Python爬虫程序学习资料网址

来源：互联网发布：淘宝如何招募分销商编辑：程序博客网时间：2024/05/01 04:56

本文为作者初学爬虫时的参考资料~

P.S. 感谢其他博主的分享

0、综述

http://blog.csdn.net/mack415858775/article/details/40182187

1、正则表达式
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

2、在采集网页信息的时候，经常需要伪造报头来实现采集脚本的有效执行
http://www.pythontab.com/html/2014/pythonhexinbiancheng_1128/928.html
http://www.jb51.net/article/51941.htm
http://www.pythontab.com/html/2013/pythonhexinbiancheng_0131/194.html

3、用try来处理程序异常的集中常用方法
http://www.2cto.com/kf/201301/184121.html

4、python如何连接mysql数据库
http://www.douban.com/note/276251476/

5、 MySQL-python-1.2.4b4.win32-py2.7提示报错，无法安装的解决方案
http://blog.csdn.net/seven_zhao/article/details/16939053

6、Python使用MySQL数据库
http://www.cnblogs.com/fnng/p/3565912.html

7、requests模块的安装和使用方法
http://www.sharejs.com/codes/python/9013
http://jingyan.baidu.com/article/ceb9fb10db2fc68cac2ba04e.html
http://www.jianshu.com/p/e1f8b690b951

8、使用urllib2模拟报头登录
http://www.cnblogs.com/sysu-blackbear/p/3629770.html
http://my.oschina.net/yangyanxing/blog/160770
http://outofmemory.cn/code-snippet/2815/python-usage-urllib2-moni-http-post
http://www.pythonclub.org/python-network-application/observer-spider

9、动态网页爬取（get/post）
http://www.2cto.com/kf/201507/417660.html
http://www.jb51.net/article/58942.htm
http://outofmemory.cn/code-snippet/1653/python-pachong-zhua-wangye-summary
http://blog.csdn.net/pleasecallmewhy/article/details/8923067

http://blog.csdn.net/chenzulong198867/article/details/8245691
http://www.jb51.net/article/58942.htm
http://www.crifan.com/how_to_crawl_dynamic_webpage_content/
http://www.crifan.com/example_to_crawl_dynamic_webpage_content_of_recent_reader_info_for_netease_blog_post/
http://www.crifan.com/example_to_crawl_dynamic_webpage_content_of_recent_reader_info_for_netease_blog_post/

0 0