本期,边肖将给大家带来一些关于如何分析PyQuery理论的信息。文章内容丰富,从专业角度进行分析和描述。看完这篇文章,希望你能有所收获。
亲爱的朋友们,大家好,上次我们学习了html的基础知识,后来有些人有疑问。我已经检查了html上的信息,我想得到它,但是我怎么才能在它上面得到我想要的信息呢?你有工具吗?嗯,说明这个同学还是爱思考的。目前市面上有很多可以获取html的相关工具。目前工业上使用最多的工具有:BeautifulSoup、xpath、pyquery。今天,我们介绍pyquery,这也是我在工作中使用最多的一个工具。可以说是非常得心应手。好,让我们来看看这个工具。
介绍
pyquery库是jQuery的Python实现,可以用来解析HTML网页。官方文件地址是http://packages.python.org/pyquery/.
Pyquery允许您使用jQuery语法操作xml。这与jQuery非常相似。有了lxml,pyquery将更快地处理xml和html。
这个库不是(至少还不是)可以与JavaScript交互的代码库。它只是非常类似于jQuery API。
安装
pipinstallpyquery
或者下载并安装:https://pypi.python.org/pypi/pyquery/#downloads
初始化
引入库:from pyquery import PyQuery as pq
1、直接字符串
doc=pq(' HTML/HTML ')pq参数可以直接传入HTML代码,现在doc相当于jQuery中的$符号。
2、lxml.etree
文档=pq(etree . from string(' html/html ')
首先可以使用lxml的etree对代码进行处理,这样如果你的HTML代码有一些不完整或者遗漏的地方,就会自动转换成结构完整清晰的HTML代码。
3、直接传URL
doc=pq('http://www.baidu.com ')
在这里,就像直接请求网页一样,类似于直接用urllib2请求这个链接来获取HTML代码。
4、传文件
文档=pq(文件名='hello.html ')
您可以直接传递路径的文件名。
以上就是如何分析边肖分享的PyQuery理论。如果你恰好也有类似的疑惑,可以参考上面的分析来理解。想了解更多,请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/133810.html