“使用多字节字符集”和“使用Unicode字符集”下的字符串的长度问题

来源:互联网 发布:淘宝在线代码编辑器 编辑:程序博客网 时间:2024/05/13 07:21

#ifdef UNICODE

#define lstrlen  lstrlenW

#else

#define lstrlen  lstrlenA

#endif // !UNICODE

在Unicode下,lstrlen等同lstrlenW,在非Unicode下等同lstrlenA。

在Unicode下,lstrlen等同wcslen在非Unicode下等同strlen

一个是C的标准函数,一个是WinAPI函数。


小结:
1、lstrlen依据参数的类型,返回字符串中字符的个数(如果操作系统定义了UINCODE,则表示宽字符,如果未定义,则表示ANSI字符)
2、wcslen返回宽字符的个数
3、strlen返回ANSI字符的个数




再讨论strlen、wcslen与sizeof的区别。


在非Unicode下,TCHAR = char,_tcslen = strlen
在Unicode下,TCHAR = wchar_t , _tcslen = wcslen


TCHAR szGBR[] = _T("abcd");
TCHAR szCHN[] = _T("民主科学");

int iStrLenGBR = lstrlen(szGBR);
int iStrLenCHN = lstrlen(szCHN);

int iSizeofGBR = sizeof(szGBR);
int iSizeofCHN = sizeof(szCHN);


在非Unicode下:

iStrLenGBR = strlen(szGBR);
iStrLenCHN = strlen(szCHN);

iStrLenGBR = 4;
iStrLenCHN = 8;

iSizeofGBR = 5;
iSizeofCHN = 9;


在Unicode下:

iStrLenGBR =wcslen(szGBR);
iStrLenCHN =wcslen(szCHN);

iStrLenGBR = 4;
iStrLenCHN = 4;

iSizeofGBR = 10;
iSizeofCHN = 10;


由此可见:

strlen返回的是字节数(对中英文不一致,中文占两个字节,不包括'\0');

wcslen返回的是字符数(对中英文一致);

sizeof返回的是字节数(包含'\0',而'\0'在Unicode下也是占两个字节的)。





1 0
原创粉丝点击