xpath学习笔记
来源:互联网 发布:accp和java 编辑:程序博客网 时间:2024/06/14 05:26
- 在html中,id是唯一的
- 在html中,class是可以多处引用的
- / 表示在下一级中搜索,逐层检索
- // 表示在所有较低层级中搜索,全局检索
- 下标 [数字]:从1开始,依次计算
- [ ]表示定语修饰,括号里可以是属性(用@表示),如class为hahah的div的文本内容 可以说'.//div[@class="hahah"/text()]',括号里也可以是文本,如文本为miaomiaomiao的div的class属性名,可以说'.//div[text()="miaomiaomiao"]/@class'
- 参考教程
html_str = """<body><div class="ui container"> <table class="ui striped table"> <tr> <th>姓名</th> <th>性别</th> <th>邮箱</th> <th>电话</th> </tr> <tr> <td><a href="zhangwei">张伟</a></td> <td>男</td> <td>zhangwei@haoren.com</td> <td>12138-111</td> </tr> <tr> <td><a href="yifei">一菲</a></td> <td>女</td> <td>yifei@haoren.com</td> <td>12138-112</td> </tr> <tr> <td><a href="xiaoxian">小贤</a></td> <td>男</td> <td>xiaoxian@haoren.com</td> <td>12138-113</td> </tr> <tr> <td><a href="meijia">美嘉</a></td> <td>女</td> <td>meijia@haoren.com</td> <td>12138-114</td> </tr> <tr> <td><a href="xiaobu">小布</a></td> <td>男</td> <td>xiaobu@hundan.com</td> <td>12138-115</td> </tr> </table></div></body>"""
五条记录中的电话:html.xpath(".//tr/td[4]/text()")
所有性别为男的姓名:html.xpath(".//tr/td[text()= ' 男']./td[4]/text()")
所有是好人的姓名:html.xpath('.//tr/td[contains(text(),"haoren")]/../td[1]/a/text()')
张伟的所有信息:
html.xpath('.//tr[2]//text()')
阅读全文
0 0
- XML学习笔记---Xpath
- Xpath路径学习笔记
- html,XPath 学习笔记
- XPath学习笔记
- XPath学习笔记
- XPath学习笔记
- XPath学习笔记
- XPATH学习笔记
- XPath学习笔记一
- Xpath学习笔记
- XPATH学习笔记
- XPath学习笔记
- XPath学习笔记
- xpath学习笔记
- xpath学习笔记
- pugixml学习笔记5 XPath
- XML学习笔记 4. xpath
- 学习笔记之 Xpath用法
- android 自定义控件
- 笔记
- 剪花布条-简单字符串匹配
- listview
- 代理模式与Java动态代理
- xpath学习笔记
- 贪心算法-4.5单源最短路径之Dijkstra算法(松弛操作)
- linux常用命令command not found的解决方案(自己整理)
- Android 跳转到新浪微博
- Mysql加锁过程详解
- JavaScript专精系列(6)——FileReader 文件读取
- UI管理器以及BasePanel基本面板
- BP反向传播算法Python简单实现
- Java8:新特性之Lambda基础语法