编码转换

来源:互联网 发布:java ee 7 jdk版本 编辑:程序博客网 时间:2024/04/30 23:04
    windows下写的代码,copy到ubuntu下,用kdevelop、gedit打开,代码的中文都显示为乱码,baidu一下 ,找到原因:
1)windows现在内核是unicode,所以只要是utf8的字符他都能正确显示;
2) windows提供default encoding for non-unicode的选项,中文用户都会选chinese,PRC, 这时windows就会用gb18030来解码中文字符。
    而ubuntu下字符编码格式是utf-8,所以正常显示中文需要转换编码。ubuntu提供了iconv命令进行编码转换:
   
   iconv -f gb18030 -t utf-8 test.cpp > newtest.cpp
   
    再打开,中文显示正常。
    写了一个脚本对当前目录的所有文件进行编码转换:
#!/bin/bash
conv()
{
    
for file in $(ls) ;do
        
if [ -d $file ];then
            cd $(eval pwd)
/${file}
            conv 
            cd ..
        fi
        
if [ -f $file ];then
            iconv 
-f gb18030 -t utf-8 ${file} > ${file}.new
            mv ${file}.new ${file} 
-f
        fi
    done
}

conv