关于中文文本的截取
来源:互联网 发布:淘宝分销入口 编辑:程序博客网 时间:2024/05/14 02:40
从Java转到C++后,对于它的字符串处理能力抱怨了好久
这不,非Unicode下对字符串进行截取有时会出现乱码,因为把一个汉字是两个字节,如果拆开了就显示不正确了
但是,对于汉字来说,第一个字节肯定大于0x80,第二个字节就不一定了,所以,要判断一个字节是不是汉字的一部分,只能从字符串的开头进行扫描:
这不,非Unicode下对字符串进行截取有时会出现乱码,因为把一个汉字是两个字节,如果拆开了就显示不正确了
IsDBCSLeadByte
The IsDBCSLeadByte function uses the ANSI code page to determine whether a specified byte is potentially a lead byte that is, the first byte of a two-byte character in a double-byte character set (DBCS).
To use a different code page, use the IsDBCSLeadByteEx function.
BOOL IsDBCSLeadByte(BYTE TestChar // character to test);MSDN里有这个函数,可以判断一个char是不是一个双字节字的开始.
但是,对于汉字来说,第一个字节肯定大于0x80,第二个字节就不一定了,所以,要判断一个字节是不是汉字的一部分,只能从字符串的开头进行扫描:
for (int i = 0; i < text.length(); i++)
{
if (IsDBCSLeadByte(text[i])
{
i++;
//TODO:
}
}
这样就可以在遇到汉字的时候一次跳过两个字节了
{
if (IsDBCSLeadByte(text[i])
{
i++;
//TODO:
}
}
- 关于中文文本的截取
- ASP关于截取含有Html代码的文本段
- 关于中文文本分类的一点想法
- 一个常用的php关于中文截取的函数
- 关于Smarty插件中truncate截取中文乱码的解决方案
- 中文PHP的截取
- 字符截取,解决中文的截取问题
- 关于字符串的截取
- 关于字符串的截取
- 文本截取
- php的中文字符串截取
- 老生长谈的中文截取
- Python 中文字符串的截取
- 截取带有中文的字符串
- 截取包含中文的字符串
- 中文截取字符串的方法
- 前几天遇到的一个面试题,关于中文字符截取的问题。IO流的应用
- dedecms截取富文本的content
- AHK使用手记--Run/RunWait指令
- SIGGRAPH 2007 papers on the web
- 超级方便的boost安装方法
- 光华控股涨停内幕
- 3D引擎数据库
- 关于中文文本的截取
- 微软关于SDE、SDET、PM等职位的解答
- 自己写的浮动面板
- OGRE中用到的设计模式
- 三联商社无量涨停 会有多少横线
- 昌九生化受益农业利好大幅上升
- 去天涯抢沙发
- Ping程序的源代码
- Cidr 计算的几种方式