Lua string.sub截取UTF8 中英混合字符
来源:互联网 发布:seo 百度云 编辑:程序博客网 时间:2024/06/10 11:17
在使用Lua的过程中,经常会遇到需要截取字符串或者获得字符串真实长度的情况,而Lua自带的string.sub()对于中文字符会当作3个字符来处理,截取时会造成乱码。所以需要自己改造下,下面的SubStringUTF8()方法是我改编的SubString方法,经测试可以识别中英混合的字符串,不管是英文字符还是中文字符都当作一个字符来计算index,并且可以像系统的string.sub()一样使用负数来从末尾截取字符。其他的几个方法是SubStringUTF8()的依赖方法,也可以单独拿来使用。
--截取中英混合的UTF8字符串,endIndex可缺省function SubStringUTF8(str, startIndex, endIndex) if startIndex < 0 then startIndex = SubStringGetTotalIndex(str) + startIndex + 1; end if endIndex ~= nil and endIndex < 0 then endIndex = SubStringGetTotalIndex(str) + endIndex + 1; end if endIndex == nil then return string.sub(str, SubStringGetTrueIndex(str, startIndex)); else return string.sub(str, SubStringGetTrueIndex(str, startIndex), SubStringGetTrueIndex(str, endIndex + 1) - 1); endend--获取中英混合UTF8字符串的真实字符数量function SubStringGetTotalIndex(str) local curIndex = 0; local i = 1; local lastCount = 1; repeat lastCount = SubStringGetByteCount(str, i) i = i + lastCount; curIndex = curIndex + 1; until(lastCount == 0); return curIndex - 1;endfunction SubStringGetTrueIndex(str, index) local curIndex = 0; local i = 1; local lastCount = 1; repeat lastCount = SubStringGetByteCount(str, i) i = i + lastCount; curIndex = curIndex + 1; until(curIndex >= index); return i - lastCount;end--返回当前字符实际占用的字符数function SubStringGetByteCount(str, index) local curByte = string.byte(str, index) local byteCount = 1; if curByte == nil then byteCount = 0 elseif curByte > 0 and curByte <= 127 then byteCount = 1 elseif curByte>=192 and curByte<=223 then byteCount = 2 elseif curByte>=224 and curByte<=239 then byteCount = 3 elseif curByte>=240 and curByte<=247 then byteCount = 4 end return byteCount;end
2 0
- Lua string.sub截取UTF8 中英混合字符
- lua utf8 len sub
- Lua utf8中文字符个数和子串截取
- lua中截取UTF8字符串的方法(无乱码)
- lua中截取UTF8字符串的方法(无乱码)
- lua 截取中文UTF8字符串
- 中英文混合字符截取
- 截取字符,中英混合无乱码。 一个汉字当作一个字符
- lua截取中英文混合字符串
- 字符截取 支持UTF8/GBK
- 分割utf8中英混合字符串
- lua UTF8字符串操作,截取,索引
- Lua中string 字符换行方法
- JAVA String字符截取
- string字符截取
- Lua 特定字符截取字符串
- lua如何截取中英文混合字符串
- php 中英字符串截取,支持utf8 和gbk
- Android 实现多个输入框的对话框
- HDU 1875 畅通工程再续 有限制的最小生成树
- 两个链表的第一个公共结点
- 混合开发中遇到的上拉刷新,下拉加载的问题
- 代码整洁—什么是好代码
- Lua string.sub截取UTF8 中英混合字符
- JTabel 单元格中加入日期选择器DatePicker
- Sublime Text 3 For mac 插件安装
- mysql中decimal类型详解及类型转换
- LNMP状态管理命令
- Android闪光灯开发
- Android 四大组件之Service的基本使用
- Java类集框架——Iterator和ListIterator 迭代器的使用(遍历集合)
- 在eclipse中快速开发JNI(不使用Cygwin,一键生成C头文件.h,以及一键使用NDK交叉编译)