lua utf-8编码的汉字
来源:互联网 发布:制冷量计算软件 编辑:程序博客网 时间:2024/04/27 19:17
lua 的string库不支持处理utf-8编码的汉字。用lua要处理汉字还是很费劲的。
UTF8的编码规则:
1. 字符的第一个字节范围: 0x00—0x7F(0-127),或者 0xC2—0xF4(194-244); UTF8 是兼容 ascii 的,所以 0~127 就和 ascii 完全一致
2. 0xC0, 0xC1,0xF5—0xFF(192, 193 和 245-255)不会出现在UTF8编码中
3. 0x80—0xBF(128-191)只会出现在第二个及随后的编码中(针对多字节编码,如汉字)
这样我们可以利用lua强大的模式匹配,来实现我们要的效果,关键的处理有这么两个:
1. local _, count = string.gsub(str, "[^\128-\193]", ""),用来得到str中的字符数
2. for uchar in string.gfind(str, "[%z\1-\127\194-\244][\128-\191]*") do tab[#tab+1] = uchar end,用来把str中的每个字符映射到tab中
- lua utf-8编码的汉字
- lua utf-8编码的汉字
- lua utf-8编码的汉字
- lua utf-8编码的汉字
- utf-8编码汉字
- 获得汉字的UTF-8编码
- 常用汉字的UTF-8编码
- lua 中文 汉字 utf-8
- 常用汉字的UTF-8编码及编码范围
- 常用汉字的UTF-8编码及编码范围
- lua用UTF-8处理汉字
- lua匹配UTF-8中文汉字
- 常用3753个汉字的UTF-8编码
- c# GBK,Unicode,UTF-8编码与汉字的转换
- js设置汉字为utf-8的编码
- 将汉字转为UTF-8编码
- java汉字转UTF-8编码
- iOS 汉字转UTF-8编码
- 我的日常杂事记录。
- linux下安装tomcat
- windows2008安装ODP.NET(64bit)
- 第六周实验报告2
- 安装事件过滤器(Installing Event Filters)
- lua utf-8编码的汉字
- NSDictionary的常见用法总结
- cin与getline 和 八进制数的表达方式
- spring 创建bean的三种方式.
- 在Android 2.3状态栏中添加menu,home和back快捷键的方法
- 如果使用UITextView来显示的大篇内容排版混乱,该怎么办?
- Handler本质简析与使用实例
- 由于B/S模式的局限性,单点登录没有好的解决方案
- 获取通话时长