Python3 网络爬虫入门知识碎片

来源:互联网 发布:淘宝买家秀模板 编辑:程序博客网 时间:2024/05/18 08:21

step1 下载网页源代码

# -*- coding: utf-8 -*-import urllib.requesturl1="http://www.guoxue123.com/"cc="index"url2=".html"url=url1+cc+url2request=urllib.request.Request(url)response=urllib.request.urlopen(request)skb=response.read().decode('gbk')#skb=skb.encode('latin-1').decode('unicode_escape')#skb=skb.decode('gbk').encode('utf-8')print(skb)