关于C++支持多国语言字符编码的问题

来源:互联网 发布:怎样用淘宝达人赚钱 编辑:程序博客网 时间:2024/05/01 23:09
    不同语言,不同编码之间的转换很容易造成乱码,经过一翻折腾,可以确定的是,在VC++中,ASCII用的是gb2312编码,这种方式和操作系统使用的字符编码相关。UNICODE用的是UTF-16LE编码,这种就是宽字符版的统一字符集,可以容纳世界上所有的语言。所以想要对多国语言进行过滤操作,UTF-8只可以转成wstring进行操作。


    由于C++本身并不支持UTF-8编码,所以需要先将编码转换为Unicode,即wstring,但是在用std::wfstream写文件的时候,发现英文可以正常写入,一旦遇到中文,藏文非英文字符,就自动截断并结束!!!


    解决方法是还是使用std::fstream,打开文件的时候用二进制方式,std::ios::binary,在写入的时候改成,file.write((char*)utf8String.data(), utf8String.size() * 2);即可解决该问题,最好是在文件开头写入UNICOD的表示,"\xFF\xFE ",这样乱码问题解决,而且支持其他语言。
阅读全文
0 0