pyquery如何获取你想要的元素或文本信息

技术pyquery如何获取你想要的元素或文本信息这篇文章给大家介绍pyquery 如何获取你想要的元素或文本信息,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。 hello,各位小伙伴,大家好,

本文介绍了pyquery如何获取您想要的元素或文本信息。内容非常详细。感兴趣的朋友可以参考一下,希望对你有所帮助。

哈喽,朋友们,哈喽,今天我们就来分享一下pyquery是如何获取你想要的元素或者文本信息的。

我们主要给出一些工程开发中常用的案例。稍后,我将带大家用今天学到的内容,从田甜基金在线抓取有趣的基金数据。

1.您可以加载一个超文本标记语言字符串,或者一个超文本标记语言文件,或者一个网址。

d=pq(' html title hello/title/html ')

d=pq(文件名=path_to_html_file)

D=pq(url='http://www.baidu.com ')注:这里的url好像要写满。

HTML()和text() ——得到对应的HTML块或文本块,

p=pq(' head title hello/title/head ')

P('head ')。html()#返回titlehello/title。

P('head ')。text()#返回hello。

3.根据HTML标签获取元素,

d=pq('divptest 1/pptest 2/p/div ')

D('p')#返回[p,p]

打印(' p') #返回ptest 1/pptest 2/p

打印(' p ')。html () #返回测试1

注意:当获得多个元素时,html()和text()方法只返回第一个元素对应的内容块。

4.eq(index) ——根据给定的索引号获取指定的元素。

例如,如果您想要获取第二个P标记的内容,您可以:

打印(' p ')。等式(1)。html () #返回测试2

5.filter() ——根据类名和id名获取指定的元素,例如:

d=pq('divp id='1 '测试1/pp类='2 '测试2/p/div)

D('p ')。过滤器(' 1') #返回[p#1]

D('p ')。过滤器(' . 2') #返回[第2页]

6 .查找()——查找嵌套元素

d=pq('divp id='1 '测试1/pp类='2 '测试2/p/div)

D('div ')。find('p')#返回[p#1,p.2]

D('div ')。查找(' p ')。等式(0)#返回[p#1]

7.根据类名和id名直接获取元素。

d=pq('divp id='1 '测试1/pp类='2 '测试2/p/div)

D('#1 ')。html()#返回测试1

D('.2 ')。html()#返回测试2

8.获取属性值

d=pq(' p id=' my _ id ' a href=' http://hello.com ' hello/a/p ')

D('a ')。attr('href')#返回http://hello.com。

D('p ')。attr('id')#返回my_id

9.修改属性值

D ('a ')。attr ('href ',' http://bbaidu.com ')将href属性改为百度。

10.addClass(value) ——为元素添加一个类。

d=pq('div/div ')

D.addClass('my_class')#返回[div.my_class]

1.11.hasClass(name) #返回以确定元素是否包含给定的类。

d=pq('div class='my_class'/div ')

D.hasClass('my_class')#返回True

12.子元素(选择器=无)——获取子元素

d=pq(' spanp id=' 1 ' hello/PP id=' 2 ' world/p/span)

D.children()# returns [p#1,p#2]

孩子(' 2')#返回[第2页]

13 .父元素(选择器=无)——获取父元素

d=pq(' spanp id=' 1 ' hello/PP id=' 2 ' world/p/span)

D('p ')。parents()# Returns [span]

D('#1 ')。父代(' span')#返回[span]

D('#1 ')。父代(' p')#返回[]

14.clone() ——返回一个节点的副本。

15 .清空()——删除节点内容

16.nextAll(选择器=无)——返回以下所有元素块。

d=pq(' p id=' 1 ' hello/PP id=' 2 ' world/pimg SCR=' '/')

D('p:first ')。nextAll()#返回[p#2,img]

D('p:last ')。nextAll()#返回[img]

17.not_(选择器)——返回与选择器不匹配的元素。

d=pq('p id='1 '测试1/pp id='2 '测试2/p)

D('p ')。not _(“# 2”)# Return[p # 1]

18.遍历:

通过items方法返回对象列表,或者使用lambda。

#!/usr/bin/python

'''

@File:pyquery_demo.py

@Time:2019/8/3116:46

@ author :海石牛

@Software:PyCharm

'''

frompyqueryimportpyqueryaspq

doc=pq(' divullih 2/Lili H3/Li/ul/div ')

列表=文档(' li ')

forliinlist.items():

Print(li.html)以上就是pyquery如何获取想要的元素或文本信息的全部内容。希望

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/133809.html

(0)

相关推荐

  • 什么是js递归函数调用

    技术什么是js递归函数调用这篇文章主要介绍“什么是js递归函数调用”,在日常操作中,相信很多人在什么是js递归函数调用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”什么是js递归函数调用”

    攻略 2021年11月5日
  • 抖音刷粉网址,快来点击优质的刷赞平台

    技术抖音刷粉网址,快来点击优质的刷赞平台谈到抖音自然涨粉,而抖音热门话题自然涨粉,只有热门推荐才有可能涨粉,但想要成为热门话题,必须有一定的基础点赞量,基础留言量。如果没有这些指标就很难成为热门,所以我们需要重新审视一下

    测评 2021年10月19日
  • 早餐有哪些,你们那的早餐什么最好吃

    技术早餐有哪些,你们那的早餐什么最好吃我在内蒙古呼和浩特呆了12年,已经习惯内蒙的早点,内蒙的早点相对于我老家江苏来说比较粗狂,拿东北人的话来说就是基本是硬早点,如果说内蒙的早点最有特色的我给大家推荐三种我个人认为最能代

    生活 2021年10月27日
  • 基于ES6提供的回调函数异步编程优化

    技术基于ES6提供的回调函数异步编程优化 基于ES6提供的回调函数异步编程优化同步编程:按照顺序执行任务操作步骤 同步任务连续的,阻塞和异步编程:并行执行同一个事件循环里面的全部任务 异步任务非阻塞异

    礼包 2021年12月3日
  • CentOS/RHEL 7上PostgreSQL如何安装配置

    技术CentOS/RHEL 7上PostgreSQL如何安装配置这篇文章主要介绍了CentOS/RHEL 7上PostgreSQL如何安装配置,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获

    攻略 2021年11月15日
  • 24小时自助下单平台网站便宜,抖音低价自助下单平台?

    技术24小时自助下单平台网站便宜,抖音低价自助下单平台?抖音快速涨粉方法抖音无疑是目前新媒体里面涨粉最容易,涨粉最快的平台了。前有成都小甜甜一夜涨粉500万,后有灵魂当铺一天涨粉75万。这种涨粉速度在其他平台是想都不敢想

    测评 2021年11月10日