程序博客网 > 新日铁住金软件怎么样

Python 爬虫学习笔记

来源：互联网发布：新日铁住金软件怎么样编辑：程序博客网时间：2024/06/01 09:12

快速爬取网页

importurllib.request

url ='http://www.baidu.com'

response = urllib.request.urlopen(url)

将爬取的内容保存到本地

fhandle=open("C:/Work/python_work/python_spider_study/1.html","wb")
fhandle.write(content)
fhandle.close()

另外一种保存方法

filename = urllib.request.urlretrieve(url,filename="C:/Work/python_work/python_spider_study/51cto.html")
urllib.request.urlcleanup()

获取网页的状态码

response.getcode()

获取爬取的URL地址

response.geturl()

模拟浏览器访问网站

user_agent ='Mozilla/5.0 (Windows NT 10.0; WOW64; rv:57.0) Gecko/20100101 Firefox/57.0'
headers = { 'User-Agent': user_agent }

request = urllib.request.Request(url,headers= headers)

response = urllib.request.urlopen(request)

超时设置

response = urllib.request.urlopen(request,timeout=1)

URL地址中，搜索关键字是中文，则需要解决编码问题

keywd ='照片'
key_code = urllib.request.quote(keywd)
url = 'http://www.baidu.com/s?wd='+ key_code

阅读全文

0 0

新日铁住金软件怎么样

新日铁住金软件怎么样

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子龟眼睛睁不开怎么办巴西龟眼睛红肿怎么办眼睛干痒是怎么办眼睛经常上火怎么办眼睛老上火怎么办眼睛紧急上火怎么办陌陌被踢出房间怎么办跟老公赌气怎么办斗鱼产完卵母鱼不好捞怎么办鼻翼骨折怎么办云支付被骗怎么办鱼脱皮怎么办? 老板骂学徒怎么办房间里闷热怎么办长水豆了怎么办火山知识主播遭黑粉时怎么办科目四露半张脸怎么办新主播没才艺怎么办新主播没礼物怎么办孕妇小腿抽筋怎么办阴阳师4星太鼓怎么办网络直播卡怎么办自己直播间卡顿怎么办小鸡吃食不消化怎么办小鸡不爱吃食怎么办小鸡仔吃多了怎么办老是丢内裤怎么办小鸡像打鸣怎么办运动鞋皱了怎么办鞋子皱了怎么办光脚穿凉鞋出汗怎么办雅乐之舞不出锦怎么办牛仔裙老是皱怎么办真丝容易皱怎么办 t恤洗皱了怎么办新衣服有皱怎么办 aj有皱纹怎么办洗完手皮皱起来怎么办真丝穿着也会皱怎么办丝绸皱了怎么办多肉晒皱了怎么办