R 语言乱码问题

来源:互联网 发布:java精简版 编辑:程序博客网 时间:2024/05/18 00:13

R 语言似乎在WINDOWS平台上对中文的支持不是特别好,似乎是3.1.2的一个BUG。


目前我研究出了一个临时解决方案:

1. 先将本地语言集转换成English 1252:

<span style="font-family:Microsoft YaHei;font-size:10px;">Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")</span>

2. 将文件集以UTF-8的格式读入:

<span style="font-family:Microsoft YaHei;">b<-read.csv(y,head=F,encoding="UTF-8",stringsAsFactor=F)</span>

3.最后将本地语言集再转换成中文。 

Sys.setlocale("LC_CTYPE", "Chinese")

PS: 上例中文件以UNICODE的字符集的形式存在,似乎对ANSI的字符集却不会有问题。我也闹不明白什么问题。



0 0