76 python.crawler
来源:互联网 发布:淘宝优惠券怎么赚钱 编辑:程序博客网 时间:2024/04/29 04:51
1. 生成request对象
req = urllib2.Request('http://www.baidu.com')
通过调用urlopen并传入Request对象,将返回一个相关请求response对象
response = urllib2.urlopen(req)
应答对象如同一个文件对象,所以你可以在Response中调用.read()
the_page = response.read()
2.表单:一般的HTML表单,data需要编码成标准形式。然后做为data参数传到Request对象
data = urllib.urlencode(values)
3.模拟报头
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
header ={'user_agent':user_agent}
4.Httperror/Urlerror
服务器上每一个HTTP 应答对象response包含一个数字"状态码"。
有时状态码指出服务器无法完成请求。默认的处理器会为你处理一部分这种应答。
5. 0 0
- 76 python.crawler
- python-crawler
- python crawler(1)
- python crawler(2)
- Python Spider, Web Crawler
- python crawler(2)
- python crawler(1)
- python crawler(1)
- Crawler in python
- a summary of python crawler
- Simple Web Crawler Used Python
- python yellow page thread crawler
- Python, Crawler and Raspberry Pi
- Python crawler 豆瓣电影排行榜评分
- Crawler
- Python Spider, Web Crawler, Bot Examples
- Crawler jd code by Python&Java
- [原创] Demo: Python crawler use chrome headless
- Linux PHP开发环境:CentOS下配置LAMP开发环境
- Java操作xml文件的心得
- sdfsdfs
- 利用FFmpeg将视频文件生成bmp图像帧
- Android 网络学习之使用多线程下载,支持断点续传
- 76 python.crawler
- [leetcode-107]Binary Tree Level Order Traversal II(java)
- Spring4+SpringMVC+Hibernate4整合入门与实例
- 为PHP设置服务器(Apache/Nginx)环境变量
- 转:Oracle数据库的驱动包ojdbc*.jar之间的差别
- 主成分分析法
- C# 求时间差
- NSMutableArray在removeAllObjects时崩溃
- HTML <div> 标签