程序博客网 > 阿里云流量收费标准

scrapy关于tbody标签的问题

来源：互联网发布：阿里云流量收费标准编辑：程序博客网时间：2024/04/30 01:16

爬取网页时，当爬取表格(table) 的内容时，发现用 xpath checker 获取正常，程序却解析不到。

原因是：浏览器会在table标签下添加tbody（注：在chrome、火狐测试都有这个情况。出现这种原因是因为浏览器会对html文本进行一定的规范化）

如下所示：分别在【网页源代码】和【审查元素】查看，会发现【审查元素】中多了 tbody 标签。

解决方法：使用scrapy 时将分析出的xpath 中的 tbody 去掉即可。

参考自：

http://www.bubuko.com/infodetail-4953.html

http://www.tuicool.com/articles/EVfqI3

0 0

阿里云流量收费标准

阿里云流量收费标准

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子电脑无网络连接怎么办去爱尔兰旅游签证怎么办想去东欧,怎么办签证北京下车没刷卡怎么办飞机上想抽烟怎么办进新房日子不好怎么办汽车打不着火怎么办一点都不会打字怎么办我打字不会拼音怎么办现在身上没钱了怎么办没钱了怎么办借不到家里没网了怎么办我很需要钱怎么办发动机机体裂了怎么办机场拿错行李怎么办中转的飞机行李怎么办机场行李丢了怎么办机场丢失行李后怎么办怎么办天合联盟会员卡肾透支了怎么办广告语牙齿蛀牙空了怎么办牙齿虫蛀空了怎么办 wifi被植入广告怎么办美国航空误机怎么办手机中病毒了怎么办 toll快递没拿到怎么办航班被取消了怎么办航班因天气取消怎么办特价票航班取消怎么办网上不能值机怎么办 e盘提示格式化怎么办地税零申报逾期怎么办地税ca证书过期怎么办金税盘接口坏了怎么办不交迅雷年费怎么办税控盘没有清卡怎么办金税盘没有清卡怎么办金税盘忘记抄税怎么办税控盘密码忘了怎么办户户通信号中断怎么办户户通授权丢失怎么办