Lua中的字符串函数库

来源:互联网 发布:合肥九龙医院网络预约 编辑:程序博客网 时间:2024/05/01 05:22

Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。

字符串库中的一些函数是非常简单的:

string.len(s)          返回字符串s的长度;
string.rep(s, n)      返回重复n次字符串s的串;你使用string.rep("a", 2^20)可以创建一个1M bytes的字符串(比如,为了测试需要);
string.lower(s)       将s中的大写字母转换成小写(string.upper将小写转换成大写)。如果你想不关心大小写对一个数组进行排序的话,你可以这样:
                             table.sort(a, function (a, b)returnstring.lower(a) <string.lower(b)end)
string.upper(s)       将s中的小写字母转换成大写
                            string.upperstring.lower都依赖于本地环境变量。所以,如果你在 European Latin-1环境下,表达式:
                            string.upper("a??o")    --> "A??O"
string.sub(s,i,j)      函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以,string.sub(s, 1, j)返回字符串s的长度为j的前缀;string.sub(s, j, -1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s, j);string.sub(s, 2, -2)返回去除第一个和最后一个字符后的子串。
s = "[in brackets]"
print(string.sub(s, 2, -2)) --> in brackets
记住:Lua中的字符串是恒定不变的。string.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。一个常见的错误是:
string.sub(s, 2, -2)
认为上面的这个函数会改变字符串s的值。如果你想修改一个字符串变量的值,你必须将变量赋给一个新的字符串:
s = string.sub(s, 2, -2)
string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。下面的例子中,我们假定字符用ASCII表示:

print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99

上面最后一行,我们使用负数索引访问字符串的最后一个字符。

Lua提供了string.format()函数来生成具有特定格式的字符串, 函数的第一个参数是格式(formatstring), 之后是对应格式中每个代号的各种数据. 由于格式字符串的存在, 使得产生的长字符串可读性大大提高了. 这个函数的格式很像C语言中的printf().函数string.format在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:

格式字符串可能包含以下的转义码:

%c - 接受一个数字, 并将其转化为ASCII码表中对应的字符
%d, %i - 接受一个数字并将其转化为有符号的整数格式
%o - 接受一个数字并将其转化为八进制数格式
%u - 接受一个数字并将其转化为无符号整数格式
%x - 接受一个数字并将其转化为十六进制数格式, 使用小写字母
%X - 接受一个数字并将其转化为十六进制数格式, 使用大写字母
%e - 接受一个数字并将其转化为科学记数法格式, 使用小写字母e
%E - 接受一个数字并将其转化为科学记数法格式, 使用大写字母E
%f - 接受一个数字并将其转化为浮点数格式
%g(%G) - 接受一个数字并将其转化为%e(%E, 对应%G)及%f中较短的一种格式
%q - 接受一个字符串并将其转化为可安全被Lua编译器读入的格式
%s - 接受一个字符串并按照给定的参数格式化该字符串

为进一步细化格式, 可以在%号后添加参数. 参数将以如下的顺序读入:

(1) 符号: 一个+号表示其后的数字转义符将让正数显示正号. 默认情况下只有负数显示符号.
(2) 占位符: 一个0, 在后面指定了字串宽度时占位用. 不填时的默认占位符是空格.
(3) 对齐标识: 在指定了字串宽度时, 默认为右对齐, 增加-号可以改为左对齐.
(4) 宽度数值
(5) 小数位数/字串裁切: 在宽度数值后增加的小数部分n, 若后接f(浮点数转义符, 如%6.3f)则设定该浮点数的小数只保留n位, 若后接s(字符串转义符, 如%5.3s)则设定该字符串只显示前n位.

在这些参数的后面则是上述所列的转义码类型(c, d, i, f, ...).


print(string.format("pi = %.4f", PI))
      --> pi = 3.1416
d = 5; m = 11; y = 1990
print(string.format("%02d/%02d/%04d", d, m, y))
        --> 05/11/1990
tag, title = "h1", "a title"
print(string.format("<%s>%s</%s>", tag, title, tag))
        --> <h1>a title</h1>

第一个例子,%.4f代表小数点后面有4位小数的浮点数。第二个例子%02d代表以固定的两位显示十进制数,不足的前面补0。而%2d前面没有指定0,不足两位时会以空白补足。对于格式串部分指示符得详细描述清参考lua手册,或者参考C手册,因为Lua调用标准C的printf函数来实现最终的功能。

以下是一些例子:


string.format("%%c: %c", 83)            输出S
string.format("%+d", 17.0)              输出+17
string.format("%05d", 17)               输出00017
string.format("%o", 17)                 输出21
string.format("%u", 3.14)               输出3
string.format("%x", 13)                 输出d
string.format("%X", 13)                 输出D
string.format("%e", 1000)               输出1.000000e+03
string.format("%E", 1000)               输出1.000000E+03
string.format("%6.3f", 13)              输出13.000
string.format("%q", "One\nTwo")         输出"One\
                                          Two"
string.format("%s", "monkey")           输出monkey
string.format("%10s", "monkey")         输出    monkey
string.format("%5.3s", "monkey")        输出  mon


Lua 标准库 - 字符串处理(string manipulation)

【IT168 技术文档】字符串库为Lua提供简易的字符串处理操作,所有的字串操作都是以1为基数的(C以0),也可使用负向索引,最后一个索引为-1 ; 所有的函数都存放在string表,并且已建立元表(__index=string表)

  所以string.byte(s,i) <=> s:byte(i)

记住:Lua中的字符串是恒定不变的。String.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。

  1、string.byte(s [, i [, j]])

  功能:返回从i到j的字符所对应的数值(字符 到 ASCII值),i默认为1,j默认为i的值

  如:s="123456" s:(1,2) => 49 50

  --------------------------------------------------------------------------------

  2、string.char (···)

  功能:返回ASCII值参数对应的字符串

  如:string.char(49,50) => 12

  --------------------------------------------------------------------------------

  3、string.dump(function)

  功能:返回指定函数的二进制代码(函数必须是一个Lua函数,并且没有上值)

  --------------------------------------------------------------------------------

  4、string.find(s, pattern [, init [, plain]])

  功能:查找s中首次出现pattern的位置,如果找到则返回首次出现的起始和结束索引否则返回nil

  init:为搜索位置的起始索引,默认为1(也可以用负索引法表示)

  plain:true 将关闭样式简单匹配模式,变为无格式匹配

  --------------------------------------------------------------------------------

  5、string.format (formatstring, ···)

  功能:格式化字符串formatstring参数与C差不多,在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,使用和C语言的printf函数几乎一模一样,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:

  其中:*, l, L, n, p, h不被支持

  c, d, E, e, f, g, G, i, o, u, X, x:接受数字参数

  q, s:接受字符串参数

  %q:为自动将对应参数字串中的特殊字符加上\

  如:string.format('%q', 'a string with "quotes" and \n new line')等于

  "a string with \"quotes\" and \

  new line"

  注:此函数不能接受字符串中间带\0的字符

  --------------------------------------------------------------------------------

  6、string.gmatch(s, pattern)

  功能:返回一个迭代函数,每次调用此函数,将返回下一个查找到的样式串对应的字符

  如: s = "hello world from Lua"

  for w in string.gmatch(s, "%a+") do

  print(w)

  end

  为 hello

  word

  from

  Lua

  字串到表的赋值

  t = {}

  s = "from=world, to=Lua"

  for k, v in string.gmatch(s, "(%w+)=(%w+)") do

  t[k] = v

  end

  --------------------------------------------------------------------------------

  7、string.gsub (s, pattern, repl [, n])

  功能:string.gsub的第一个返回值表示他进行替换操作后的字串s

                   string.gsub的第二个返回值表示他进行替换操作的次数  

       s:待替换的字串

  pattern:查找的字串

  repl:要替换的内容(可以为字串,表,函数)

  当repl为字符串时:进行对应字串的替换,%0~%9 %0为全匹配 %% 为%

  当repl为表时:

  当repl为函数时:每次查找到字符都将

-----------------------------------------------------------------------------------------------------------------------------------------------

8、string.len(s)返回字符串s的长度;

9、string.rep(s, n)返回重复n次字符串s的串;

你使用string.rep("a", 2^20)可以创建一个1M bytes的字符串(比如,为了测试需要)

10、string.upper()和string.lower()

string.lower(s)将s中的大写字母转换成小写(string.upper将小写转换成大写)

11、string.sub(s,i,j)

函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以, string.sub(s, 1, j)返回字符串s的长度为j的前缀;string.sub(s, j, -1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s, j);string.sub(s, 2, -2)返回去除第一个和最后一个字符后的子串。

13、

13、string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。

14、函数string.format(s, pattern)

15、模式匹配:

. 任意字符

%a 字母

%c 控制字符

%d 数字

%l 小写字母

%p 标点字符

%s 空白符

%u 大写字母

%w 字母和数字

%x 十六进制数字

%z 代表0的字符

例如:s = "Deadline is 30/05/1999, firm"

date = "%d%d/%d%d/%d%d%d%d"

print(string.sub(s, string.find(s, date))) --> 30/05/1999

上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:

print(string.gsub("hello, up-down!", "%A", "."))

--> hello..up.down. 4

(数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。


0 0
原创粉丝点击