python抓取网页编码问题

来源：互联网发布：淘宝小石头编辑：程序博客网时间：2024/04/29 21:03

抓取的网页如果包含中文，那么正确打印和保存网页就需要解码和编码

import urlliburl = 'http://example.com/'html = urllib.urlopen(url).read()unicode = html.decode("utf-8")gbkcode = unicode.encode("gbk")print(gbkcode)f = open("hello.txt", "w")f.write(gbkcode)f.close

0 0

python抓取网页编码问题
python抓取gb2312/gbk编码网页乱码问题
网页抓取中遇到的编码问题
urllib2抓取网页出现中文编码问题
Python 抓取网页学习系列之一（网页编码格式）
Python 抓取网页学习系列之一（网页编码格式
python抓取中文网页显示乱码问题
python 抓取动态网页的问题
【python】网页内容抓取遭遇乱码问题
python 处理抓取网页乱码问题
Python网页抓取配置环境问题 20151203
关于python网页编码问题
黄聪：python访问抓取网页常用命令（保存图片到本地、模拟POST、GET、中文编码问题）
httpclient自动获取页面编码，解决网页抓取乱码问题
使用python抓取网页
Python抓取中文网页
python抓取网页图片
Python抓取中文网页
3D动画效果照片墙demo
最少拦截系统
Net share 命令详解
BFS例题：A计划
S1统一测试错题
python抓取网页编码问题
nlp_关键词提取总结
迷瘴
STM32启动文件分析
Android性能优化典范——总纲
tomcat、nginx压力测试方法
CSDN博客第一天
Ubuntu安装核磁共振软件fsl详细教程
操作系统内存管理——分区、页式、段式管理