VS2008 Unicode和多字节编码区别

来源:互联网 发布:30而立40不惑50知天命 编辑:程序博客网 时间:2024/05/16 18:37
unicode和多字节字符集是两种不同的编码方式,不同的编码方式下,所对应的一些函数是不兼容的。
 
一种编码格式,Unicode 2个字节表示所有的字符,多字节是一个字节表示英文,两个就表示汉字
如果你新的工程是Unicode的,就用Unicode开发,摒弃多字节编码,多字节编码弊端太多了。
其实改起来很简单,你把所有的char都改成TCHAR,如果能用CString,尽量用CString。所有字符串函数都换上带_t的版本,比如_tsprintf()、_tcscpy之类的……因为这些东西都是同时兼容Unicode和ANSI的,所以改起来很容易。

工程到底会以哪种编码方式去编码,是根据根据“项目属性”中配置的预编译宏UNICODE来决定的。
STL里面的string,封装的是单字节字符,由于其跨平台的特性,任何支持标准C++的平台都可以使用它,需要字符转换时转换即可。建议多使用std::string。
 

==============================
unicode和UTF-8的关系
unicode 是一种编码表格,例如,给一个汉字规定一个代码。类似 GB2312-1980, GB18030等,只不过字集不同。 一个unicode码可能转成长度为一个BYTE,或两个,三个,四个BYTE的UTF8码,取决于unicode码的值。
而英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送,比传输unicode两个BYTEs快。 UTF8并不是一种编码方式,而只是一种传送和存储的格式。是为传输unicode而想出来的“再编码”方法罢了。 
其实没有太大的区别,只是在作网站时,那些网页文本一般要保存为utf-8,这样就不会出现乱码。

 

多字节编码与UTF8编码的转换,请参考:http://www.doc88.com/p-182436917988.html

0 0
原创粉丝点击