python读取csv中所遇到的中文编码问题
来源:互联网 发布:怎么找淘宝达人 编辑:程序博客网 时间:2024/06/05 18:56
由于本人准备学习使用一些机器学习算法,第一个是DecisionTree,然后使用到了西瓜案例:
因为涉及到讨厌的编码问题,所以找了好多办法去尝试读取csv文件:
1. pandas
pandas可谓是神奇,用python学习机器学习不可缺少的一个包。 使用pandas的时候也进行了尝试,起初encoding是utf-8,但是无法读取出来,所以改成了gbk,这个其实不用担心,等有了一些经验的时候,就不用为这个部分犯愁了
pandas.csv_reader(‘xxx.csv’,encoding=’gbk’)
2. csv
这个库的使用确实比较恶心,读取内容为英文的csv还行,但是读取中文的csv的不会是unicode结构,因为机器默认的是ASCII码结构
比方说,我们把’编号取出来’,
我们会发现,那一堆乱七八糟的码就成了‘编号’
其实是python中str发挥了作用,它会把人看不懂的转成人能看懂的,这是通俗的说法,实则是会把ascii码进行转换
阅读全文
0 0
- python读取csv中所遇到的中文编码问题
- python中写入csv,excel显示、pandas读取csv文件的编码问题
- Python中文编码过程中遇到的一些问题
- Python 中读取csv文件中有中文的情况
- Python Pandas读取中文格式CSV文件遇到的问题(UTF-8与UTF-8 BOM)
- java web项目中所遇到的编码问题
- Python读取Excel文件遇到的编码问题(pycharm)
- Python中文文本分析时遇到的编码问题小结
- python在设置编码和写csv文件遇到的问题以及解决方案
- pandas读取csv编码问题
- python读取中文字符编码问题
- Python中读取CSV文件的方法
- python中中文编码问题
- ajax请求中遇到的中文字符编码问题
- 【Java】编程过程中遇到的中文编码问题
- python 处理中文遇到的编码问题总结 以及 字符str的编码如何判断
- 【python】读写csv编码问题
- python学习:编码中遇到的问题原因及解决方案
- HT1621B驱动液晶LCD连接及程序
- 深入理解JS执行细节
- 十六进制颜色转换ARGB/RGB-整理
- 【剑指offer】调整数组,奇数位于偶数的前面
- UVA 455 暴力枚举
- python读取csv中所遇到的中文编码问题
- 小结
- PCH有毒,好用但别滥用。
- excel小记
- 堆和栈的差别
- 重载
- [转]使用getInstance()方法的原因及作用
- RequestContextHolder 获取request
- Docker切换国内镜像下载源——配置国内免费registry mirror