Python数据提取过程中遇到的一些问题
来源:互联网 发布:linux修改oracle字符集 编辑:程序博客网 时间:2024/04/30 04:26
1.TypeError:在我的代码中,遇到这个问题是主要是因为html文件的错误,然后etree.HTML()就会出现错误,所以在代码中加入异常处理,遇到这样的html直接跳过
2.在html.xpath()函数中,有些标签找不到元素,但是标签是存在的,不明白为什么会出现这样的问题。一切都归结于html写的不规范吧~等我以后找到原因再来更新
XPath是一种表达式语言,它的返回值可能是节点,节点集合,原子值,以及节点和原子值的混合等。具体细节请看:
http://www.cnblogs.com/Loofah/archive/2012/05/10/2494036.html
拖得时间太久,都已经忘记了还有那些问题,等我想起来再来更新。
注意:在写数据提取的时候一定要做异常处理,提取一个html还好,要是批量处理,就完蛋了,尤其是在一个项目中,你的代码跑着跑着崩溃了,后面要用数据的小伙伴估计想把你团成团让你以一种圆润的方式离开。
0 0
- Python数据提取过程中遇到的一些问题
- Python中文编码过程中遇到的一些问题
- 学python过程中遇到的一些问题及解决方法
- python与c++混编过程中遇到的一些问题
- Python Beautifulsoup 自学过程中遇到的一些问题
- 开发过程中遇到的一些问题
- 项目过程中遇到的一些问题
- Python打包过程中遇到的问题
- 一个新手学习python的过程中遇到的一些问题及解决方法
- vim 的配置过程中遇到的一些问题
- RabbitMQ集群过程中遇到的一些问题的解决办法
- 编写DLL过程中遇到的一些问题
- 使用webchart过程中遇到的一些问题
- sql server 2005安装过程中遇到的一些问题
- 安装Hypertable源码过程中遇到的一些问题
- 开发时间过程中遇到的一些问题
- android开发过程中遇到的一些问题汇总
- Hadoop安装过程中遇到的一些问题
- hdu-1200 To and Fro
- Session和Cookie
- 生成.zip文件
- 从数组中移除重复的小质数
- ios开发中WIFI相关功能总结
- Python数据提取过程中遇到的一些问题
- 信号量与互斥锁
- 中国的残疾人去哪了?
- Java之RandomAccessFile(随机访问文件)
- mac 上svn服务器地址变更解决方法
- 关于用php进行修改html的格式
- wireshark在mac上使用时到遇到:no interface can be used for capturing in this system with the current configur
- 修改MySQL用户的权限
- VS+opencv鼠标移动图片