py3 爬虫设置user-agent

来源：互联网发布：手机远程ubuntu 编辑：程序博客网时间：2024/05/19 05:05

爬网页的时候，明明网址是正确的，但是用python爬网页返回 not fount 404错误

网上查了结果是需要设置 user-agent

# -*- coding:utf-8 -*-import urllib.requestimport re# install proxy# url ="http://www.cnblogs.com/GuoYaxiang/p/6232831.html"url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2016/11.html"req = urllib.request.Request(url,headers={'User-agent': 'Mozilla/5.0'})html = urllib.request.urlopen(req).read()html = html.decode("gbk").replace('\n','').replace('\t','')# print(html)pat = re.findall('citytr(.*?)html',html)print(pat)

阅读全文

0 0

py3 爬虫设置user-agent
chencang-----为爬虫设置User-Agent
关于设置爬虫随机user-agent的一点尝试
修改User-Agent伪造爬虫
火狐设置User Agent
PHP设置User Agent
gtk webkit 设置user-agent
httpurlconnection设置user-agent参数
搜索引擎爬虫蜘蛛的User-Agent收集
Python网络爬虫（三）-----User-Agent
python爬虫-常用的User-Agent列表
谷歌爬虫googlebot的User-Agent
py3爬虫项目
Firefox中User-Agent设置和用途
c# 设置axwindows的User-agent信息
设置 PhantomJs 的 User-Agent 的方法
scrapy爬虫防止被禁止 User Agent切换
搜索引擎蜘蛛爬虫 User Agent 一览（便于采集）
github pager学习
Jekyll学习
PHP框架结构优化方向词条
Jekyll环境安装 Windows
一句话后门……PHP
py3 爬虫设置user-agent
Android学习笔记
PHP和java结合加解密简单实现方法
android编程常见错误集锦
数据结构实验之图论四：迷宫探索
使用C开发PHP扩展全过程及相关细节…
技术选型--因地制宜、量体裁衣
使用C开发PHP扩展全过程及相关细节…
HTML5移动Web开发