每天一个python段子(1):xpath
来源:互联网 发布:软件著作权 专利权 编辑:程序博客网 时间:2024/05/17 06:21
暂时设置为填空题,有兴趣的可以按大纲自行补完~
背景知识:
版本
xpath的版本进化是不断扩展的过程,所以基本语法是通用的。如果需要在刁钻的的场景下使用,就得用心研究下不同版本的用法了。
- XPath 1.0 在1999年澳门回归那年,成为W3C标准,并被广泛实现和使用在Java,C#, Python 或者Javascript中。
- XPath 2.0 在2007年纳入标准,并与XQuery1.0这个基友绑定在一起。
- XPath 3.0 在2014年纳入标准,又跟Xquery 3.0基友在一起。
语法:
绝对路径
相对路径
条件筛选
多路径同时选择
选择对象:
text
属性
tag名
通配符
调试须知:
- 浏览器会自动在table节点下补加入tbody元素来达到html标准的效果。有可能还有其他坑,所以安全起见,使用wget下载一份html文件,基于文件调试xpath。
- 推荐一些好用的浏览器调试插件。
chrome浏览器:XPath Helper
firefox浏览器: FirePath
相关库
- lxml
- scrapy
0 0
- 每天一个python段子(1):xpath
- Python爬虫实战(1):爬取糗事百科段子
- Python爬虫实战(1):爬取糗事百科段子
- 每天一个python知识点(更新中)
- [XPath/Python] XPath 与 lxml (二)XPath 语法 - iFantasticMe
- python 爬虫糗事段子中的段子
- 使用Python爬取糗百段子
- 用python看段子
- Python 练习册,每天一个小程序(1)
- python XPath
- python XPath
- 用python 爬糗事百科的段子-1
- Python - 静态页面抓取(抓取‘糗事百科’段子)
- Python网络爬虫(5)糗事百科段子抓取
- 每天一个Linux命令-1(grep)
- 每天一个Linux命令(1) ls
- 每天一个linux命令--which(1)
- 每天一个linux命令(1)--ls
- 爬楼梯
- WebView加载优化
- Java中this关键字详解
- Servlet配置方式
- java中拼接Json字符串
- 每天一个python段子(1):xpath
- 设置自定义Dialog的样式、大小位置
- 1.C#开发winform 开发调运检疫离线制证功能。调用cLodop打印控件(NVelocity模块,生成HTML(包含cLodop打印控件的js),使用WebBrowser,展现网页)总结
- 六、Java中的四种引用
- delphi多语言MultiLanguage支持,Translation Manager详细使用方法
- Android 操作SQLite基本用法
- tomcat部署web的三种方式
- oracle数据块与PCTFREE PCTUSED
- 【游戏渲染】Unity&Shader基础篇-Cg语法,数据类型与关键字