关于C++支持多国语言字符编码的问题

来源：互联网发布：怎样用淘宝达人赚钱编辑：程序博客网时间：2024/05/01 23:09

不同语言，不同编码之间的转换很容易造成乱码，经过一翻折腾，可以确定的是，在VC++中，ASCII用的是gb2312编码，这种方式和操作系统使用的字符编码相关。UNICODE用的是UTF-16LE编码，这种就是宽字符版的统一字符集，可以容纳世界上所有的语言。所以想要对多国语言进行过滤操作，UTF-8只可以转成wstring进行操作。

由于C++本身并不支持UTF-8编码，所以需要先将编码转换为Unicode，即wstring，但是在用std::wfstream写文件的时候，发现英文可以正常写入，一旦遇到中文，藏文非英文字符，就自动截断并结束！！！

解决方法是还是使用std::fstream，打开文件的时候用二进制方式，std::ios::binary，在写入的时候改成，file.write((char*)utf8String.data(), utf8String.size() * 2);即可解决该问题，最好是在文件开头写入UNICOD的表示，"\xFF\xFE "，这样乱码问题解决，而且支持其他语言。

阅读全文

0 0