Python3爬虫(二)保存抓取网页的html

来源:互联网 发布:总做白日梦知乎 编辑:程序博客网 时间:2024/06/05 15:53

下载网页html 通过使用 urllib库的urlretrieve()方法

直接下载某URL的HTML:

#-*- coding:utf-8 -*-import urllib.requesturl='http://www.163.com'urllib.request.urlretrieve(url,'./htm2.txt')#保存在当前路径的htm2.txt中
urlretrieve()的第一个参数:表示要抓取的URL

第二个参数:表示抓取完HTML保存在哪个路径


阅读全文
0 0
原创粉丝点击