Python 插件杂谈 (3) ---- PyQuery , Python中的网页分析利器
来源:互联网 发布:车销 软件 编辑:程序博客网 时间:2024/05/29 16:30
嗯哼,Meego中文核心站-- 米趣网 又发新博文啦, PyQuery 是Python下用于 分析网页内容 的工具。 有点像 BeautifulSoup,但是功能更近似于 JQuery ,相信用过 BeautifulSoup
的朋友对他的操作深有印象,远不及 JQuery的语法来得简单明了。
先来段介绍:
PyQuery
允许你使用 JQuery 的语法访问 XML 文档。PyQuery的API尽可能地与JQuery相似。PyQuery
使用 lxml 快速分析 xml 和 html文档。
但是 PyQuery不是(起码不再是)用来生成javascript 或者与javascript代码的库。我(作者本人)只是喜欢 JQuery 的 api 而在Python中找不到这样的工具,所以我告诉我自己在Python中制造这样的一个工具,于是就有了PyQuery 的产生。
PyQuery可以用来实现多种用途,有一个主意我未来可能实现的,那就是使用它来模板化纯粹的http模板。我也用它进行网页抓取进而实现 装饰Deliverance 应用程序。
接着来段Demo,让大家对 PyQuery 有个认识:
- >>> from pyquery import PyQuery as pq
- >>> from lxml import etree
- >>> import urllib
- >>> d = pq("<html></html>")
- >>> d = pq(etree.fromstring("<html></html>"))
- >>> d = pq(url='http://google.com/')
- >>> d = pq(url='http://google.com/', opener=lambda url: urllib.urlopen(url).read())
- >>> d = pq(filename=path_to_html_file)
上面的 d 有点像 jQuery 中的 $
- >>> d("#hello")
- [<p#hello.hello>]
- >>> p = d("#hello")
- >>> p.html()
- 'Hello world !'
- >>> p.html("you know <a href='http://python.org/'>Python</a> rocks")
- [<p#hello.hello>]
- >>> p.html()
- u'you know <a href="http://python.org/">Python</a> rocks'
- >>> p.text()
- 'you know Python rocks'
你可以使用很多 JQuery 类似的语法, 不过不包括那样不在css标准中的语法,如::first :last :even dd :eq :lt :gt :checked :selected :file:
- >>> d('p:first')
- [<p#hello.hello>]
最后,我就不啰嗦了,为大家提供一下, PyQuery的文档
- Python 插件杂谈 (3) ---- PyQuery , Python中的网页分析利器
- Python 插件杂谈 (4) ---- BeautifulSoup , Python中的网页分析工具
- Python分析网页神器pyquery
- Python爬虫利器之PyQuery的用法
- python:使用pyquery分析html
- python pyquery
- pyquery 使用说明(支持python 3)
- Python爬虫利器六之PyQuery的用法
- python之pyquery 学习
- python安装pyquery失败
- Python PyQuery的用法
- Python 插件杂谈 (1) ---- chardet
- Python--python爬虫神器PyQuery
- 利用python中的pyquery库简单的抓取数据
- Python中的结构化数据分析利器-Pandas简介
- Python中的结构化数据分析利器-Pandas简介
- Python 边做边学 3 网页分析
- python安装pyquery失败解决方法
- MFC下 报表打印程序的实现
- Integer Numbers zoj 3365
- poj2780解题报告
- 今天让我们一起为舟曲灾区同胞祝福
- Saving Princess
- Python 插件杂谈 (3) ---- PyQuery , Python中的网页分析利器
- 开源3d游戏引擎的一些了解
- 幻镜 一
- 【SQL*Plus】使用BREAK和COMPUTE在SQL*Plus中得到分组统计结果
- MindMapper 总结SQL Server
- 开始学C+
- surfer画等值线
- 不使用鼠标浏览网页(firefox)
- 新手报道