xpath解析网页中tbody问题

来源:互联网 发布:oracle导出数据库命令 编辑:程序博客网 时间:2024/06/05 05:19

取网页中表格数据时,如图


使用如下xpath语法会爬取到空列表。

xpath('//table[@id="ip_list"]/tbody/tr[2]/td[2]/text()')

原因是因为浏览器会对html文本进行一定的规范化

去掉xpath中的tbody即可

如下

xpath('//table[@id="ip_list"]/tr[2]/td[2]/text()')