ANSI/Unicode 字符集分析

来源:互联网 发布:市川海老藏 知乎 编辑:程序博客网 时间:2024/05/21 22:46

VC6.0默认是ANSI字符集,Visual Studio默认是Unicode字符集,我之前一直使用vc6.0做项目,没有对ANSI/Unicode 字符集编程差异做总结,现在由于项目需要在VS下开发,对于字符串处理有很大的不兼容,例如在VC6.0中可以在CWnd派生类中调用MessageBox("Hello World");弹出“Hello World”对话框,但是同样语句在VS默认都通不过编译,加上reinterpret_cast<LPCTSTR>("Hello 你好!")转化后输出的是乱码,直到这样reinterpret_cast<LPCTSTR>(_T("Hello 你好!"))才行。于是就有必要仔细研究一下二者的区别和兼容性措施了。

使用ANSI/Unicode通用数据类型:微软提供了一些ANSI和Unicode兼容的通用数据类型,我们最常用的数据类型有_T ,TCHAR,LPTSTR,LPCTSTR。顺便说一下,LPCTSTR和const TCHAR*是完全等同的。其中L表示long指针,这是为了兼容Windows 3.1等16位操作系统遗留下来的,在Win32 中以及其它的32位操作系统中,long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。P(pointer)表示这是一个指针;C

(const)表示是一个常量;T(_T宏)表示兼容ANSI和Unicode,STR(string)表示这个变量是一个字符串。综上可以看出, LPCTSTR表示一个指向常固定地址的可以根据一些宏定义改变语义的字符串。比如:TCHAR* szText=_T(“Hello!”);TCHAR szText[]=_T(“I Love You”);LPCTSTR lpszText=_T(“大家好!”);使用函数中的参数最好也要有变化,比如:MessageBox(_T(“你好”));  其实,在上面的语句中,即使您不加_T宏,MessageBox函数也会自动把“你好”字符串进行强制转换。但我还是推荐您使用_T宏,以表示您有Unicode编码意识。

修改字符串运算问题  一些字符串操作函数需要获取字符串的字符数(sizeof(szBuffer)/sizeof(TCHAR)),而另一些函数可能需要获取字符串的字节数sizeof(szBuffer)。您应该注意该问题并仔细分析字符串操作函数,以确定能够得到正确的结果。ANSI 操作函数以str开头,如strcpy(),strcat(),strlen();Unicode操作函数以wcs开头,如wcscpy,wcscpy (),wcslen();ANSI/Unicode操作函数以_tcs开头 _tcscpy(C运行期库);ANSI/Unicode操作函数以lstr开头lstrcpy(Windows函数);考虑ANSI和Unicode的兼容,我们需要使用以_tcs开头或lstr开头的通用字符串操作函数。

0 0
原创粉丝点击