Python 3.5 检测文件编码

来源:互联网 发布:数据包与数据帧的区别 编辑:程序博客网 时间:2024/06/09 13:57

思路:利用Python的chardet

使用方法: conda 或者 pip,在线安装  pip install XXX,下载下来后 pip install 目录




代码如下

# -*- coding: utf-8 -*-

"""
Created on Thu Jan 19 11:27:53 2017


@author: xiaoyuanl
"""




import chardet
name="foreigncitation.tsv"


f = open(name,'rb')
data = f.read(200000)
print(name+":  "+str(chardet.detect(data)))
0 0
原创粉丝点击