BeautifulSoup应用笔记(2)- 遍历文档树
来源:互联网 发布:shell脚本执行php文件 编辑:程序博客网 时间:2024/04/29 22:45
通过点取属性的方式能够遍历文档树,属性如下:
获取标签
- .tag名称: 获取标签,如果有多个结果只能获得第一个标签
获取子节点
- .contents/ .child:获取直接子节点
- .descendants:获取子孙节点
获取字符串
- .string:获得NavigableString类型的子节点。如果包含多个NavigableString类型的子节点,则返回结果为None
- .strings/ .stripped_string:获取所有的字符串,.stripped_string会过滤掉空白字符串
获取父节点
- .parent/ .parents:获取父节点/获取父辈节点
获取兄弟节点
- .next_sibling/ .previsous_sibling/ .next_siblings/ .previsous_siblings:获取兄弟节点
获取元素
- .next_element/ .previous_element/ .next_elements/ .previous_elements:获取上一个/下一个元素。获取元素的顺序与HTML解析的顺序一致,如"<title>The Dormouse's story</title>"标签的下一个元素为字符串"The Dormouse's story"
通过查看源码可以看到,上述属性在底层实际上是通过@property装饰器定义的,另外在返回多个值时,定义的是一个生成器函数:
@property def next_elements(self): i = self.next_element while i is not None: yield i i = i.next_element @property def next_siblings(self): i = self.next_sibling while i is not None: yield i i = i.next_sibling
0 1
- BeautifulSoup应用笔记(2)- 遍历文档树
- BeautifulSoup应用笔记(3)- 搜索文档树
- python+BeautifulSoup文档遍历树子节点
- BeautifulSoup应用笔记
- BeautifulSoup应用笔记(1)- 解析器及对象类型
- BeautifulSoup学习笔记2
- BeautifulSoup笔记
- BeautifulSoup笔记
- BeautifulSoup帮助文档
- BeautifulSoup 中文文档
- beautifulsoup官方文档
- BeautifulSoup 中文文档
- BeautifulSoup 官方文档
- beautifulsoup 4 官方文档
- 关于 BeautifulSoup 的文档
- 【笔记】遍历二叉树的应用
- python学习笔记(二) BeautifulSoup
- BeautifulSoup爬取花千骨小说(学习笔记)
- PHP获取客户端IP函数
- 预编译#if #endif #if #elif #endif
- 1048. Find Coins (25)
- LeetCode(201) Bitwise AND of Numbers Range
- Centos6.6 本地 yum 配置
- BeautifulSoup应用笔记(2)- 遍历文档树
- linux学习教程(一)(安装篇)centos7没有安装ifconfig命令的解决方法
- JUNIT -- springMVC的action进行单元测试
- 打造微信圆形头像更换
- 存储器总结一
- 关于CollectionView的九宫格排布,多选,全选实现及删除
- 【FastDev4Android框架开发】RecyclerView完全解析之打造新版类Gallery效果(二十九)
- Two Sum(Medium)
- Intent Flag介绍 intent.addFlags()