python爬虫urllib库学习(源码)

来源:互联网 发布:黑麒麟cms解压密码 编辑:程序博客网 时间:2024/05/22 07:53
####urllib库的使用import urllib.requestimport http.cookiejarfrom urllib.parse import urlparse# 复杂请求构造request对象;# respons = urllib.request.Request("https://www.python.org")# response=urllib.request.urlopen(respons)# print(response.read().decode("utf-8"))###cookie的使用# url="http://www.baidu.com"# cookie=http.cookiejar.CookieJar()# handlr=urllib.request.HTTPCookieProcessor(cookie)# opener=urllib.request.build_opener(handlr)# result=opener.open(url)# # for item in cookie:# #     print(item.name+"="+item.value)# #respons=urllib.request.Request(url=url,)# print(result.read())#####urlprase的使用   !!!!注意引用的方式# res=urlparse("https://www.sogou.com/web?ie=UTF-8&query=python+from..import+%E5%92%8C%E7%9B%B4%E6%8E%A5import+%E7%9A%84%E5%8C%BA%E5%88%AB")# print(type(res),res)
原创粉丝点击