windows下python3安装chardet插件

来源:互联网 发布:大数据市场前景 编辑:程序博客网 时间:2024/06/15 01:34

安装chardet插件过程很痛苦,历经了不少周折,最后也是莫名其妙的在联网的状态(确切的说是翻墙联网)下安装成功了,对其原理任然不甚了解。

安装过程如下:

1,下载chardet插件如下图,


2,下载后解压,放在Python\Lib\site-packages下,如我的是"D:\Python33\Lib\site-packages\chardet2-2.0.3"

然后打开命令行,输入"python D:\Python33\Lib\site-packages\chardet2-2.0.3\setup.py install"若果不成功,查看第三步

3,安装setuptools,下载地址,此版本为3.4.1,若需要其他版本,可直接在google中搜索“名字+版本号”,然后点击快照即可下载,下载完成后,安装完毕,再来重新安装chardet

测试代码:

import urllib.requestimport sysreload(sys)import chardetreq = urllib.request.urlopen(r"http://www.baidu.com")##这里可以换成http://www.baidu.com,http://www.sohu.comcontent = req.read()typeEncode = sys.getfilesystemencoding()##系统默认编码infoencode = chardet.detect(content).get('encoding','utf-8')##通过第3方模块来自动提取网页的编码html = content.decode(infoencode,'ignore').encode(typeEncode)##先转换成unicode编码,然后转换系统编码输出print (html)

p.s:但有个mbs的问题任然没有解决,继续改进。。。(报错:UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0--1: invalid character)


0 0
原创粉丝点击