[C++]_[获取Utf8字符串的字符个数和子字符串]

来源:互联网 发布:乐视电视mac码可以干嘛 编辑:程序博客网 时间:2024/05/16 19:20

场景:

1.有时候需要统计utf8字符串的个数,单纯统计字节个数是不行的。

2.有时候也需要获取从某个位置开始的n个连续字符用于显示或计算。


[cpp] view plain copy
  1. static int GetUtf8LetterNumber(const char *s)  
  2. {  
  3.     int i = 0, j = 0;  
  4.     while (s[i])  
  5.     {  
  6.         if ((s[i] & 0xc0) != 0x80) j++;  
  7.         i++;  
  8.     }  
  9.     return j;  
  10. }  
  11.   
  12. static int GetUtf8Word(const char *s,int wantedNum,int& offset)  
  13. {  
  14.     int i = 0, j = 0;  
  15.       
  16.     int readedNum = 0;  
  17.     int isReach = 0;  
  18.     while (s[i])  
  19.     {  
  20.         if ((s[i] & 0xc0) != 0x80)  
  21.         {  
  22.             if(isReach)  
  23.             {  
  24.                 break;  
  25.             }  
  26.             ++j;  
  27.             readedNum = j;  
  28.             if(j == wantedNum)  
  29.             {  
  30.                 isReach = 1;  
  31.             }  
  32.               
  33.         }  
  34.         ++i;  
  35.     }  
  36.     offset = i;  
  37.     return readedNum;  
  38. }  

原创粉丝点击