python3.4.4实现网页爬虫基础之网页下载器三种方法
来源:互联网 发布:windows server能干嘛 编辑:程序博客网 时间:2024/06/05 20:34
这是是慕课网《Python开发简单爬虫》中网页下载器的三种实现方法,课程用的是python2.7,这里用最新的3.4.4实现出来,分享给新人:
import urllib.requestfrom http.cookiejar import CookieJarurl = 'http://www.baidu.com'print('第一种方法')res1 = urllib.request.urlopen(url)print(res1.getcode()) # 打印状态码,200表示成功print(len(res1.read()))print('第二种方法')# 添加header,伪装成Mozilla浏览器request = urllib.request.Request(url, headers={'user-agent': 'Mozilla/5.0'})res2 = urllib.request.urlopen(request)print(res2.getcode())print(len(res2.read()))print('第三种方法')cj = CookieJar()opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))urllib.request.install_opener(opener)res3 = urllib.request.urlopen(url)print(res3.getcode())print(cj) # 打印网页cookieprint(res3.read()) # 打印网页源代码
下载地址:http://download.csdn.net/detail/sunflowerduidui/9480365
1 0
- python3.4.4实现网页爬虫基础之网页下载器三种方法
- python3爬虫(网页下载)
- Python3+Scrapy实现网页爬虫
- Python3.x爬虫下载网页图片
- python3爬虫下载网页上的pdf
- Python3爬虫之五网页下载器的几种方法【Python使用cookie模拟登录CSDN】
- python3 动态网页爬虫
- python开发爬虫----urllib2下载网页方法
- python3 爬虫(爬取网页、图片基础)
- python3.3网页图片爬虫
- python3爬虫--抓取网页信息
- Python3爬虫【壹】静态网页
- Python爬虫之网页下载器网页解析器
- 网络爬虫下载网页
- python3实现网络爬虫(5)--模拟浏览器抓取网页
- 网页爬虫基础篇
- 用Python3下载网页图片
- Python3下载网页中的图片
- JSP标签和EL表达式
- 资源清理
- JMeter 系统测试工具(一)
- 零真红之蝶 模型提取
- nyoj82迷宫寻宝(一)
- python3.4.4实现网页爬虫基础之网页下载器三种方法
- 重定向-转发-请求包含
- yxcms loop $plist 如何循环计数
- Bloom Filter
- Android开发java开发之常用英文词汇汇总。程序员必备英语单词
- C语言完美体系
- tomcat服务器部署项目问题
- 组合数学之排列组合(Permutations and Combinations)(四种情况)
- SQL入门