python_BeautifulSoup库之遍历文档树
来源:互联网 发布:ubuntu 启动脚本 编辑:程序博客网 时间:2024/06/05 04:47
1.当前tag只有一个NavigableString类型子节点
EX:
<b>loulan<\b>
2.当前tag只含有一个子节点
EX:
<b><a>loulan<\a><\b>
- strings 获得当前tag的所有string generator - stripped_strings 获得当前tag的所有string generator 在strings属性的基础上,将每一个string两侧的空白字符去掉 第三组 parent 获得当前节点的的父节点 视情况而定 1.同样可以作用于字符串节点2.BeautifulSoup对象的父节点是None - parents 获得当前节点的所有父辈节点 generator 1.递归查找,排列顺序也是如此
2.最后面两个值一定是BeautifulSoup、None 第四组 next_sibling 返回当前节点的下一个兄弟节点 视情况而定 - previous_sibling 返回当前节点的上一个兄弟节点 视情况而定 - next_siblings 返回当前节点后面的所有兄弟节点 generator - previous_siblings 返回当前节点前面的所有兄弟节点 generator 第五组 next_element 返回当前元素的下一个元素 视情况而定 属性结果是按照当前元素被解析后下一个要解析的内容
EX:
<a>nihao</a><b>loulan</b>
<a>nihao</a>
之后是nihao,nihao之后是<b>loulan</b>
- previous_element 返回当前元素的上一个元素 视情况而定 - next_elements 返回当前元素后面要解析的文档内容 generator - previous_elements 返回当前元素前面要解析的文档内容 generator 阅读全文
0 0
- python_BeautifulSoup库之遍历文档树
- python_BeautifulSoup库之过滤器
- python_BeautifulSoup
- js 遍历文档树
- 遍历DOM文档树
- 18、使用jQuery操作DOM之遍历文档树
- 43、实例 使用jQuery遍历文档树
- Beautiful Soup(二)--遍历文档树
- python+BeautifulSoup文档遍历树子节点
- 爬虫系列11.BS4遍历文档树
- 稻草人的程序之路--XML文档数据的遍历
- Python_BeautifulSoup 抓取网页内容入门
- Python_BeautifulSoup 抓取网页内容入门
- Python_BeautifulSoup 抓取网页内容入门
- 树遍历之推广到图遍历
- 遍历文档 Node对象
- java 遍历文档
- 遍历文档节点
- 406. Queue Reconstruction by Height(M)
- C#初识继承
- Maven中pom.xml报错:web.xml is missing and <failOnMissingWebXml> is set to true
- Qt5--多窗口编程实例
- linux centos7 redhat7 怎么设置开机自动进入命令行模式
- python_BeautifulSoup库之遍历文档树
- webpack打包工具的使用
- C# 事件(Event)
- javascript 自己自动执行的函数
- HDOJ 1043 康拓展开
- HDOJ 1056 HangOver
- 链接器脚本 .lds
- orcal:强大的decode函数
- leetcode.array--80. Remove Duplicates from Sorted Array II