修改爬虫的HTTP请求

来源:互联网 发布:淘宝有好货报名入口 编辑:程序博客网 时间:2024/06/06 01:25

如果遇到会对请求头进行审查的网站,他的status_code会为非200,这时候想要正常爬取,需要新建键值对kv = {’user-agent','Mozilla/5.0'},并在requests.get()里面加上headers = kv

下面是实际代码

import requestsurl = "https://item.jd.com/12029500.html?cpdad=1DLSUE"kv = {'user-agent','Mozilla/5.0'}try:r = requests.get(url, headers = kv)r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[:1000])print("爬取成功")except:print("爬取失败")


阅读全文
0 0
原创粉丝点击