_T()用途

来源:互联网 发布:网络电视好不好 编辑:程序博客网 时间:2024/05/17 07:37

Windows使用两种字符集ANSI和UNICODE,前者就是通常使用的单字节方式,但这种方式处理象中文这样的双字节字符不方便,容易出现半个汉字的情况。而后者是双字节方式,方便处理双字节字符。Windows NT的所有与字符有关的函数都提供两种方式的版本,而Windows 9x只支持ANSI方式。_T一般同字常数相关,如_T("Hello")。如果你编译一个程序为ANSI方式,_T实际不起任何作用。而如果编译一个程序为UNICODE方式,则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于,_L不管你是以什么方式编译,一律以以UNICODE方式保存

Data Type Mappings
These data-type mappings are defined in TCHAR.H and depend on whether the constant _UNICODE or _MBCS has been defined in your program.

For related information, see Using TCHAR.H Data Types with _MBCS Code.

Generic-Text Data Type Mappings

Generic-Text
Data Type Name SBCS (_UNICODE,
_MBCS Not
Defined)
_MBCS
Defined
_UNICODE
Defined
_TCHAR char char wchar_t
_TINT int int wint_t
_TSCHAR signed char signed char wchar_t
_TUCHAR unsigned char unsigned char wchar_t
_TXCHAR char unsigned char wchar_t
_T or _TEXT No effect (removed by preprocessor) No effect (removed by preprocessor) L (converts following character or string to its Unicode counterpart)

在老的 VC6 里面,假如你写:
char str1[] = "a string";
char str2[] = _T("a string");
默认情况下两句都不会报错,那是因为 VC6 默认是 ANSI 工程,所以宏 _T 在未定义 UNICODE 时事实上与第一行等价。当改成 Unicode 工程,编译器将会定义 UNICODE 和 _UNICODE 宏,此时必然报错,就像下面说的在 VC2008 里默认情况一样。而如果将这两句代码放在 VC2008 等高版本,情况又会反过来,默认创建的是 Unicode 工程,编译器将定义 UNICODE 和 _UNICODE 宏,因此在 VC2008 中默认又等价于:
char str1[] = "a string";
char str2[] = L"a string";
自然第二句也会报错,因为试图将 Unicode 字符串赋值给 ANSI 字符数组,如果改成 ANSI 工程则不报错。改成这样,在 VC2008 里默认情况下两句都不会抱错:
char str1[] = "a string";
wchar_t str2[] = _T("a string");
看到这里,你的问题已经很明显了,_T 并不是转换,而是宏替换。如果你不替换,修改工程设置可以使其不报错。但假如要拿你的工程来编译另一个字符编码的版本,则无法编译。建议所有的数据类型、字符串和函数都采用通用宏,这样你的工程在任何情况下都不会有问题。

/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

_T("")是一个宏,他的作用是让你的程序支持Unicode编码

因为Windows使用两种字符集ANSI和UNICODE,

前者就是通常使用的单字节方式,

但这种方式处理象中文这样的双字节字符不方便,

容易出现半个汉字的情况。

而后者是双字节方式,方便处理双字节字符。

Windows NT的所有与字符有关的函数都提供两种方式的版本,而Windows 9x只支持ANSI方式。

如果你编译一个程序为ANSI方式,

_T实际不起任何作用。

而如果编译一个程序为UNICODE方式,则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于,_L不管你是以什么方式编译,一律以UNICODE方式保存。

LPSTR:32bit指针指向一个字符串,每个字符占1字节

LPCSTR:32-bit指针指向一个常字符串,每个字符占1字节

LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节,取决于Unicode是否定义

LPTSTR:32-bit指针每字符可能占1字节或2字节,取决于Unicode是否定义

L是表示字符串资源为Unicode的。

比如

wchar_t Str[] = L"Hello World!";

这个就是双子节存储字符了。

_T是一个适配的宏~

#ifdef _UNICODE的时候

_T就是L

没有#ifdef _UNICODE的时候

_T就是ANSI的。

比如

LPTSTR lpStr = new TCHAR[32];

TCHAR* szBuf = _T("Hello");

以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。

比如处理LPTSTR或者LPCTSTR 的时候,不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下,strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一种中间类型,既不明确表示使用 MBCS,也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

 

原创粉丝点击