R读取含中文excel文件,read.xlsx乱码问题

来源:互联网 发布:怎么开通淘宝直播视频 编辑:程序博客网 时间:2024/05/16 02:04

最近在做一个汽车销售量的分析,在导入xlsx文件的时候总是出现乱码,因为本来就在excel里做了部分的数据清洗和整理,所以数据其实已经挺干净的,但就是会出现乱码 
这是原始的数据表: 
原始数据表

导入的时候使用xlsx.read 
错误1:没有插入Encoding参数

文件中含有中文,但使用xlsx.read时不插入Encoding=UTF-8,会导致乱码

R语言encoding

错误2:文件不是UTF-8的编码

文件的编码和encoding应该一致

R语言encoding

更改excel文件的编码: 
更改Excel文件编码

错误3:表格名为中文名

更改了错误1、2后,发现表格名也会影响 
R语言read.xlsx乱码

错误4:表格里面含有表格格式 
在一开始的表当中,因为在Excel文件中为了好看,套用了表格格式 
原始数据表 
删除所有的格式只剩下值以后: 
无格式原始数据表

再一次使用read.xlsx() 
正确导入excel文件

没有乱码了… 
总结一下,用R语言的xlsx包里面的read.xlsx( )导入含有中文的excel文件时,会因为以下问题出现乱码: 
1.没有插入encoding的正确参数(一般为UTF-8) 
2.文件的编码方式应该与encoding一致(因为Excel一般默认GB2312) 
3.excel文件含有中文名 
4.excel文件中含有表格格式

原创粉丝点击