(六)PyQuery库
来源:互联网 发布:wap商城源码 编辑:程序博客网 时间:2024/06/08 11:29
初始化的时候一般有三种传入方式:传入字符串,传入url,传入文件
**字符串初始化**html = '''from pyquery import PyQuery as pqdoc = pq(html)print(doc)print(type(doc))print(doc('li'))
如果想要获取class 则doc(‘.class_name’),如果是id则doc(‘#id_name’)….
文件初始化
通常是一个html文件,例如:pq(filename=’index.html’)
from pyquery import PyQuery as pqdoc = pq(html)print(doc('#container .list li'))
from pyquery import PyQuery as pqdoc = pq(html)items = doc('.list')print(type(items))print(items)lis = items.find('li')print(type(lis))print(lis)
代码中的items.find(‘li’) 则表示查找ul里的所有的li标签
当然这里通过children可以实现同样的效果,并且通过.children方法得到的结果也是一个pyquery对象
li = items.children()print(type(li))print(li)
通过.parent就可以找到父元素的内容
通过.parents就可以找到祖先节点的内容
from pyquery import PyQuery as pqdoc = pq(html)items = doc('.list')container = items.parent()print(type(container))print(container
from pyquery import PyQuery as pqdoc = pq(html)items = doc('.list')parents = items.parents()print(type(parents))print(parents)
兄弟元素
siblings
from pyquery import PyQuery as pqdoc = pq(html)li = doc('.list .item-0.active')print(li.siblings())
遍历
单个元素
from pyquery import PyQuery as pqdoc = pq(html)li = doc('.item-0.active')print(li)lis = doc('li').items()print(type(lis))for li in lis: print(type(li)) print(li)
获取属性
pyquery对象.attr(属性名)
pyquery对象.attr.属性名
from pyquery import PyQuery as pqdoc = pq(html)a = doc('.item-0.active a')print(a)print(a.attr('href'))print(a.attr.href)
获取文本
在很多时候我们是需要获取被html标签包含的文本信息,通过.text()就可以获取文本信息
from pyquery import PyQuery as pqdoc = pq(html)a = doc('.item-0.active a')print(a)print(a.text())
获取html
我们通过.html()的方式可以获取当前标签所包含的html信息
from pyquery import PyQuery as pqdoc = pq(html)li = doc('.item-0.active')print(li)print(li.html())
可以通过css添加一些css属性
可以通过attr给标签添加和修改属性
阅读全文
0 0
- (六)PyQuery库
- PyQuery库的使用
- PyQuery库使用
- PyQuery 库学习笔记
- pyQuery
- PyQuery
- python使用pyquery库总结
- Python爬虫利器六之PyQuery的用法
- Python中PyQuery库的使用总结
- PyQuery: 一个类似jQuery的Python库
- Python中PyQuery库的使用总结
- Python中PyQuery库的使用总结
- Python中PyQuery库的使用总结
- Python中PyQuery库的使用总结
- Python中PyQuery库的使用总结
- 【Python】网络爬虫(一):pyquery一瞥
- Python学习笔记—PyQuery库的使用总结
- 利用python中的pyquery库简单的抓取数据
- 设计模式的艺术之道--模板方法模式
- HRBUST 1444 逃脱 (哈理工第七届程序设计大赛(高年级组) G 逃脱)
- ZSTUOJ 4360:科学计数法
- keepalived的配置
- 图像处理的几种方法
- (六)PyQuery库
- 随机生成10个1--20之间的随机数,要求不能重复。(for循环解题)
- [生而为人-思考] Knowledge Cooking -7th 分享会记录
- leetcode 450. Delete Node in a BST 二叉搜索树BST删除结点
- <canvas>标签
- java排序算法
- 学Python(2)—递归
- 图 插入、删除节点 插入、删除边 返回边值 广度优先遍历
- Java类加载机制