WCHAR,CHAR,TCHAR的区别

来源：互联网发布：ubuntu libxml 编辑：程序博客网时间：2024/05/22 15:03

因为C++支持两种字符串，即常规的ANSI编码（使用""包裹）和Unicode编码（使用L""包裹），这样对应的就有了两套字符串字符串处理函数，比如：strlen和wstrlen，分别用于处理两种字符串 　　微软将这两套字符集及其操作进行了统一，通过条件编译（通过_UNICODE和UNICODE宏）控制实际使用的字符集，这样就有了_T("")这样的字符串，对应的就有了_tcslen这样的函数 　　为了存储这样的通用字符，就有了TCHAR：当没有定义_UNICODE宏时，TCHAR = char，_tcslen = strlen 当定义了_UNICODE宏时，TCHAR = wchar_t ， _tcslen = wstrlen 　　当我们定义了UNICODE宏，就相当于告诉了编译器：我准备采用UNICODE版本。这个时候，TCHAR就会摇身一变，变成了wchar_t。而未定义UNICODE宏时，TCHAR摇身一变，变成了unsigned char 。这样就可以很好的切换宽窄字符集。tchar可用于双字节字符串，使程序可以用于中日韩等国 语言文字处理、显示。使编程方法简化。

现在C++的字符分成两种类型wchar_t和char。   其中   WCHAR==wchar_t，CHAR==char。   TCHAR是一种条件编译的类型，根据条件可以代表wchar_t或char。  
CHAR实施上就是unsigned char,WCHAR为宽字符，而TCHAR根据是否支持unicode而不同。 在程序使用sizeof(TCAHR)，当默认设置时，这个值是1；当定义UNICODE宏时，这个值是2。
BSTR是BASICA中的字符串在C++中的表示方法，它是一种带有字符计数的wchar_t类型的字符串，SysAllocString,   SysFreeString这两个函数是Windows中专门处理BSTR的函数(属于COM函数）。       各种类型之间是可以进行强制转换的（有些有专有的函数比如wchar_t和char的相互转换）
/////////////////////////////////////////////////////////////////////////////////////
WCHAR,CHAR,TCHAR的关系实际上是这样的       #ifdef   UNICODE               typedef   wchar_t   TCHAR;     #else               typedef   unsigned   char   TCHAR;     #endif           typedef   unsigned   char   CHAR;     typedef   unsigned   wchar_t   WCHAR;         //wchar_t   16-bit   predefined   type   for   wide   characters.   Unsigned         A   BSTR,   known   as   basic   string   or   binary   string,   is   a   pointer   to   a   wide   character   string   used   by   Automation   data   manipulation   functions.       typedef   OLECHAR   FAR*   BSTR;         BSTRs   are   wide,   double-byte   (Unicode)   strings   on   32-bit   Windows   platforms   and   narrow,   single-byte   strings   on   the   Apple&reg;   PowerMac&#8482;.       因而不能直接进行强制转换，系统提供了一些宏进行转换如OLE2T,T2OLE。   另外   BSTR   并在   COM   对象之间传递它们时，必须小心地处理它们所使用的内存以避免内存泄漏。当   BSTR   停留在接口中时，在完成其使用后必须释放出它的内存。但是，如果   BSTR   传递出了接口，那么接收对象将负责它的内存管理。管理的函数就诸如SysAllocString,   SysFreeString。BSTR是一个比较复杂的数据类型，系统有许多关于他的操作和封装对象，应该看一些有关方面的书。其他的问题请提的具体些，并且多给一点分。
//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
1.char* to wchar* WCHAR* ToWChar(char * str) { static WCHAR buffer[1024]; wcsset(buffer,0); MultiByteToWideChar(CP_ACP,0,str,strlen(str),buffer,1024); return buffer; } 2 wchar* to char* (1)use WideCharToMultiByte uchar wszSomeString[1024]; char szANSIString [MAX_PATH]; WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL ); (2)use W2A: USES_CONVERSION; pTemp=W2A(wszSomeString);             ///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
1. char * --> UNICODE WCHAR * CComBSTR bstr(str); 2. UNICODE WCHAR*到 char * CString str(wchar*);
char 8 字节 ：
char *p = "hello";
char p[] = "hello";
宽字符 
typedef unsigned short wchar_t;   
wchar_t 16 字节；
wchar_t c = 'A';
wchar_t Cw = L"hello";   14 字节 --->最后还有一个0;
L : 告诉编译器，按宽字符保存；strlen(const char*)     //用于计算单字符的长度
wcslen(const wchar_t*); //用于计算宽字符的长度。
strlen(p);          如果两个混用将出现错误；             
wcslen(cw);          ---〉== 6;(自动去掉末尾的0)
还有一些函数：
wprintf, ----printf
wsprintf, ----sprintf
wvsprintf ----vsprintf
获取长度:
LPCTSTR strTmp : lstrlen( LPCTSTR lpString ); char *strTmp : strlen( const char *string ); _bstr_t strTmp : wcslen( const wchar_t *string );