Python数据提取过程中遇到的一些问题

来源:互联网 发布:linux修改oracle字符集 编辑:程序博客网 时间:2024/04/30 04:26

1.TypeError:在我的代码中,遇到这个问题是主要是因为html文件的错误,然后etree.HTML()就会出现错误,所以在代码中加入异常处理,遇到这样的html直接跳过
2.在html.xpath()函数中,有些标签找不到元素,但是标签是存在的,不明白为什么会出现这样的问题。一切都归结于html写的不规范吧~等我以后找到原因再来更新
XPath是一种表达式语言,它的返回值可能是节点,节点集合,原子值,以及节点和原子值的混合等。具体细节请看:
http://www.cnblogs.com/Loofah/archive/2012/05/10/2494036.html
拖得时间太久,都已经忘记了还有那些问题,等我想起来再来更新。
注意:在写数据提取的时候一定要做异常处理,提取一个html还好,要是批量处理,就完蛋了,尤其是在一个项目中,你的代码跑着跑着崩溃了,后面要用数据的小伙伴估计想把你团成团让你以一种圆润的方式离开。

0 0
原创粉丝点击