python 爬虫 伪装成 chrome
来源:互联网 发布:石油进出口数据 编辑:程序博客网 时间:2024/05/17 05:14
利用 urllib 发起的请求,UA 默认是 Python-urllib/3.5 而在 chrome 中访问 UA 则是 User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36,因为服务器根据 UA 来判断拒绝了 python 爬虫。
import urllib from urllib import request page = 1 url = 'http://www.qiushibaike.com/hot/page/'+str(page) #url = 'http://www.baidu.com' def getHTML(url): headers = {'User-Agent': 'User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'} req = request.Request(url, headers=headers) return request.urlopen(req) try: response = getHTML(url) print(response.read()) except urllib.request.URLError as e: if hasattr(e,'code'): print(e.code()) if hasattr(e,'reason'): print(e,reason())
阅读全文
0 0
- python 爬虫 伪装成 chrome
- python爬虫伪装成浏览器访问
- python 爬虫完美伪装
- 2.python爬虫伪装
- Python爬虫伪装
- python爬虫浏览器伪装
- Python 网络爬虫系列(二) --- 伪装成浏览器访问
- 爬虫伪装成浏览器访问
- Python伪装浏览器爬虫读取网页内容
- Python伪装浏览器请求爬虫豆瓣小组
- Python伪装浏览器爬虫读取网页内容
- fake-useragent,python爬虫伪装请求头
- python网络爬虫 - 如何伪装逃过反爬虫程序
- Python爬虫设置代理IP和伪装成浏览器的方法
- python通过伪装头部数据抵抗反爬虫
- python爬虫系列(四):请求伪装的做法
- Selenium+Chrome(PhantomJs) Python爬虫
- 爬虫伪装方法分类
- Algorithm-week8
- FOR XML PATH
- web统一登录验证
- wget账户密码下载网页上的数据
- 新勒索病毒Bad Rabbit(坏兔子)来袭,请做好防御准备
- python 爬虫 伪装成 chrome
- poj2488 A Knight's Journey 之 dfs解法
- PHP写webservices接口
- windows下elasticsearch5.6.0 安装x-pack
- 适合新手的Linux发行版
- [转载]如何管理数百个微服务并避免踩坑?
- 12bit灰度图像映射到8bit显示及python 实现
- 欢迎使用CSDN-markdown编辑器
- 数据库事务基础