VS2008 Unicode和多字节编码区别

来源：互联网发布：30而立40不惑50知天命编辑：程序博客网时间：2024/05/16 18:37

unicode和多字节字符集是两种不同的编码方式，不同的编码方式下，所对应的一些函数是不兼容的。

一种编码格式，Unicode 2个字节表示所有的字符，多字节是一个字节表示英文，两个就表示汉字

如果你新的工程是Unicode的，就用Unicode开发，摒弃多字节编码，多字节编码弊端太多了。
其实改起来很简单，你把所有的char都改成TCHAR，如果能用CString，尽量用CString。所有字符串函数都换上带_t的版本，比如_tsprintf()、_tcscpy之类的……因为这些东西都是同时兼容Unicode和ANSI的，所以改起来很容易。

工程到底会以哪种编码方式去编码，是根据根据“项目属性”中配置的预编译宏UNICODE来决定的。

STL里面的string，封装的是单字节字符，由于其跨平台的特性，任何支持标准C++的平台都可以使用它，需要字符转换时转换即可。建议多使用std::string。

==============================

unicode和UTF-8的关系

unicode 是一种编码表格，例如，给一个汉字规定一个代码。类似 GB2312-1980, GB18030等，只不过字集不同。 一个unicode码可能转成长度为一个BYTE,或两个，三个，四个BYTE的UTF8码，取决于unicode码的值。

而英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送，比传输unicode两个BYTEs快。 UTF8并不是一种编码方式，而只是一种传送和存储的格式。是为传输unicode而想出来的“再编码”方法罢了。

其实没有太大的区别，只是在作网站时，那些网页文本一般要保存为utf-8，这样就不会出现乱码。

多字节编码与UTF8编码的转换，请参考：http://www.doc88.com/p-182436917988.html

0 0