用Python下载一个网页保存为本地的 HTML文件
来源:互联网 发布:乐视网络大电影 编辑:程序博客网 时间:2024/06/05 00:23
我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。
比如我们要下载山东大学新闻网的一个页面,该网页如下:
实现代码如下
import urllib.requestdef getHtml(url): html = urllib.request.urlopen(url).read() return htmldef saveHtml(file_name, file_content): # 注意windows文件命名的禁用符,比如 / with open(file_name.replace('/', '_') + ".html", "wb") as f: # 写文件用bytes而不是str,所以要转码 f.write(file_content)aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"html = getHtml(aurl)saveHtml("sduview", html)print("下载成功")
打开相应的目录可以看到这个网页已经被下载保存成功了
我们用浏览器打开这个网页文件如下
由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。
0 0
- 用Python下载一个网页保存为本地的 HTML文件
- python3 保存一个网页为html文件
- 下载一个网站的html并保存到文件中
- python学习—保存网页到本地 html及pdf
- python 保存网页HTML
- VC下载网页文件,并保存至本地磁盘
- python通过本地保存的cookie文件实现登录并访问相关网页
- 使用TWebBrowser组件保存网页为html和mht文件
- Java 网页html转为word并保存为doc文件
- 下载网页HTML到本地
- 下载保存文件到手机本地前, 优先选择位置的一个取巧方法
- Python获取网页源码并保存为文件Demo
- php 下载保存文件保存到本地
- python爬虫-豆瓣爬取数据保存为html文件
- 将一个Asp页面保存为HTML文件
- 下载网页文件到本地
- 网页源码保存为文件
- Python MOOC简单获取网页内容并以html格式保存在本地
- 存储过程、存储函数、内部函数三者的区别与联系
- 覆盖索引
- C++类中的static成员学习总结
- 使用call、apply和bind解决js中烦人的this,事件绑定时的this和传参问题
- JavaScript变量、作用域和内存问题(二)——垃圾收集器
- 用Python下载一个网页保存为本地的 HTML文件
- java中的增强型for循环
- java生产者消费者
- linux下的文件的查找
- 最短路模板poj2387
- CentOS7安装MySQL并开启远程访问
- Linux多命令协作:管道及重定向
- 点击鼠标右键崩盘解决方法
- NUDT银河之光校赛总结+校赛 F