关于读取文件遇到UnicodeDecodeError
来源:互联网 发布:自制app软件 编辑:程序博客网 时间:2024/06/05 22:49
问题:
pandas在读取含有中文字符的csv文件时报错,因为python默认的编码方式是‘ utf-8’,而这个文件的编码是‘gbk’。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte
解决办法:
data=pd.read_table('province.csv', sep=',', names=cnames, encoding='gbk')
将译码方式设置为encoding='gbk'
这里,sep=','
,因为 csv 文件是逗号分割文件。names=cnames
, cnames是设置的列的名字。
其他注意:
保存问件时,为了后续处理方便,可以统一用utf-8编码。
更改txt,csv文件的编码方式:
用记事本打开,另存为,右下角选择编码方式。
sublime text3 也可以更改编码方式。可以将sublime text3的默认编码方式设置为utf-8。
阅读全文
0 0
- 关于读取文件遇到UnicodeDecodeError
- 关于文件读取遇到的问题
- python读取文件时遇到非法字符的处理 UnicodeDecodeError: 'gbk' codec can't decode bytes in position
- 关于java读取文件时遇到Unicode乱码情况
- 关于读取CocoStudio的ui文件可能遇到的问题
- Python遇到 UnicodeDecodeError
- windows安装SetupTools遇到 UnicodeDecodeError
- python3使用pickle读取文件提示TypeError或者UnicodeDecodeError的解决办法
- 解决Python读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode
- python3使用pickle读取文件提示TypeError或者UnicodeDecodeError的解决办法
- python3使用pickle读取文件提示TypeError或者UnicodeDecodeError的解决办法
- 关于 IOS 开发中遇到的 读取 cell xib 文件时导致死机的问题。
- Dom4j读取XML文件时遇到的一个问题(关于DTD)
- 关于C++文件读取
- 关于读取 Unicode文件
- 关于文件读取
- 关于C++文件读取
- 关于IFS读取文件
- java5——运算符(算数运算符、关系运算符)
- Linux常用操作
- Android输入输出流
- 38. 编写函数,实现B=A+A',即把矩阵A加上A转置,存放在B中
- Matlab 使用 GPU 并行计算
- 关于读取文件遇到UnicodeDecodeError
- 深度学习(六十四)Faster R-CNN物体检测
- ubuntu安装nginx依赖库zlib,pcre,openssl
- 【剑指offer】从尾到头翻转打印单链表
- JAVA入门开发环境搭配
- Android_LaunchMode
- 邮票问题
- 修改Tiny4412 uboot关闭MMU
- NGUI和UGUI优缺点和性能比较