Python3爬虫（二）保存抓取网页的html

来源：互联网发布：总做白日梦知乎编辑：程序博客网时间：2024/06/05 15:53

下载网页html 通过使用 urllib库的urlretrieve()方法

直接下载某URL的HTML：

#-*- coding:utf-8 -*-import urllib.requesturl='http://www.163.com'urllib.request.urlretrieve(url,'./htm2.txt')#保存在当前路径的htm2.txt中

urlretrieve()的第一个参数：表示要抓取的URL

第二个参数：表示抓取完HTML保存在哪个路径

阅读全文

0 0

Python3爬虫（二）保存抓取网页的html
Python3爬虫（一）抓取网页的html
python3实现网络爬虫（1）--urlopen抓取网页的html
Python3 爬虫（一）-- 简单网页抓取
Python3 爬虫（一）-- 简单网页抓取
python3爬虫--抓取网页信息
Python3.7 爬虫（二）使用 Urllib2 与 BeautifulSoup4 抓取解析网页
Python3：抓取网页HTML代码
python3实现网络爬虫（5）--模拟浏览器抓取网页
[Python3.x]网络爬虫（一）：利用urllib通过指定的URL抓取网页内容
网页爬虫，HttpClient+Jericho HTML Parser 实现网页的抓取
Python3简单爬虫抓取网页图片
python爬虫实战（1）抓取网页图片自动保存
python 爬虫（二）一个带下载进度的网页抓取小爬虫
C# 抓取网页Html源码（网络爬虫）
Python3.X抓取网页html乱码问题
[Python]网络爬虫（二）：利用urllib2通过指定的URL抓取网页内容
[Python]网络爬虫（二）：利用urllib2通过指定的URL抓取网页内容
如何解决fiddler抓包时出现443的问题
程序员30岁的殇
OkHttp3源码分析[缓存策略]
取出List<String>中的数据加到StringBuffer中去
ECharts3基础教程（一）简单上手篇
Python3爬虫（二）保存抓取网页的html
STL之string
比特币多重签名的现状（2017年）
如何减少http请求
简单选择排序到底稳不稳定简单选择排序到底稳不稳定
js中json
白话Spring（基础篇）---AOP（execution表达式）
unity 利用差值实现相机跟随与轴值实现人物拉近
curl 使用举例详解(五）