py3 爬虫设置user-agent
来源:互联网 发布:手机远程ubuntu 编辑:程序博客网 时间:2024/05/19 05:05
爬网页的时候,明明网址是正确的,但是用python爬网页返回 not fount 404错误
网上查了结果是需要设置 user-agent
# -*- coding:utf-8 -*-import urllib.requestimport re# install proxy# url ="http://www.cnblogs.com/GuoYaxiang/p/6232831.html"url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2016/11.html"req = urllib.request.Request(url,headers={'User-agent': 'Mozilla/5.0'})html = urllib.request.urlopen(req).read()html = html.decode("gbk").replace('\n','').replace('\t','')# print(html)pat = re.findall('citytr(.*?)html',html)print(pat)
阅读全文
0 0
- py3 爬虫设置user-agent
- chencang-----为爬虫设置User-Agent
- 关于设置爬虫随机user-agent的一点尝试
- 修改User-Agent伪造爬虫
- 火狐设置User Agent
- PHP设置User Agent
- gtk webkit 设置user-agent
- httpurlconnection设置user-agent参数
- 搜索引擎爬虫蜘蛛的User-Agent收集
- Python网络爬虫(三)-----User-Agent
- python爬虫-常用的User-Agent列表
- 谷歌爬虫googlebot的User-Agent
- py3爬虫项目
- Firefox中User-Agent设置和用途
- c# 设置axwindows的User-agent信息
- 设置 PhantomJs 的 User-Agent 的方法
- scrapy爬虫防止被禁止 User Agent切换
- 搜索引擎蜘蛛爬虫 User Agent 一览(便于采集)
- github pager学习
- Jekyll学习
- PHP框架结构优化方向词条
- Jekyll环境安装 Windows
- 一句话后门……PHP
- py3 爬虫设置user-agent
- Android学习笔记
- PHP和java结合加解密简单实现方法
- android编程常见错误集锦
- 数据结构实验之图论四:迷宫探索
- 使用C开发PHP扩展全过程及相关细节…
- 技术选型--因地制宜、量体裁衣
- 使用C开发PHP扩展全过程及相关细节…
- HTML5移动Web开发