xpath很有帮助的一些用法
来源:互联网 发布:电信网络新型违法犯罪 编辑:程序博客网 时间:2024/05/29 16:22
xpath比较少见的一些用法
- 查找如上h1标签下面的两个同级tab标签
div_h1 = et.xpath(u'//div/h1[contains(text(), "社保信息")]/following-sibling::table')# com_dict['company_zch'] = ''.join(div.xpath(u".//span[contains(text(), '社会信用代码')]/following-sibling::*[1]/text()")).strip()
- 补全清理标签
有时候会遇到xpath获取不到的情况,这种情况很可能是html标签不规范等因素引起的,此时可以使用bs4的一个方法来清理标签,然后在xpath解析
import sysreload(sys)sys.setdefaultencoding('utf-8')from lxml import etreefrom bs4 import BeautifulSoups = open('1.html').read()soup = BeautifulSoup(s, 'html5lib', from_encoding='utf-8')html = soup.prettify()et = etree.HTML(html)content = et.xpath('string(.//div[@id="Zoom"])')print content
阅读全文
0 0
- xpath很有帮助的一些用法
- 一些有帮助的链接
- 一些有帮助的BLOG
- 一些有帮助的网址
- eclipse 的一些常用的快捷键。。。很有帮助。
- 一些常用的宏定义(很有帮助)
- PHP安全有帮助的一些函数
- xpath的用法
- XPath的简单用法
- xpath的用法
- XPATH的基本用法
- XPATH的一些资料(xpath的节点)
- XPATH的一些资料(xpath的语法)
- XPATH的一些资料(xpath的实例)
- XPATH的一些资料(XPath 运算符)
- python sklearn安装的一些有帮助的链接
- UDK引擎,做漫游方面遇到的一些问题,对新手很有帮助!
- 对开小型皮具厂有帮助的一些资料
- bzoj 3281: 小P的烦恼 支配树算法+dp
- 注册登录时输入11位手机号,不能输入字母和特殊字符,input number类型去掉上下加减箭头
- hackerrank挑战题——寻找正在运行的中位数
- UnicodeEncodeError: 'latin-1' codec can't encode characters in position 35-38: ordinal not in range(
- PHP历史进程
- xpath很有帮助的一些用法
- 向界面中加入自定义View的几种方式
- Django 表单
- C#回调函数学习心得
- 关于Hbuilder打包Bug—plus.maps.Marker setIcon不显示解决方法
- CentOS更改yum源与更新系统
- BZOJ 3130: [Sdoi2013]费用流 二分 最大流
- form_for js 提交错误解决
- 前端性能优化大总结