Lua语法分析(4)- 表达式

来源:互联网 发布:程序员的工资组成 编辑:程序博客网 时间:2024/05/18 19:20

欢迎关注公众号《Lua探索之旅》。


上一节介绍了二元操作符,本节以Lua EBNF为基础,介绍Lua表达式的各种表现形式。


Lua支持逗号分隔的表达式列表 explist,在多重返回值、多重赋值、参数列表等场景使用,示例如下:

return a,b,c
a,b,c=1,2,3
local a,b,c=1,2,3
f = function (a,b,c) end
print(1,2,3)

从 explist 开始介绍表达式。



explist1 

explist1 -> expr {`,` expr}


根据上面示例很好理解,逗号分隔的每一项为一个expr。



expr

expr -> subexpr(limit=0)


上一节介绍了运算符优先级,也就是 subexpr 的实现。初始优先级 limit=0,逐个读取运算符,根据优先级递归解析,可参考《二元操作符》一节。



subexpr

subexpr -> 
 (simpleexp | unop subexpr)
 { binop subexpr }


一个表达式由运算符和子表达式组成,运算符分为一元运算符(unary operator)和二元运算符(binary operator)。

  • simpleexp 表示子表达式。

  • unop subexpr 表示一元运算符和子表达式。

  • binop subexpr 表示二元运算符和子表达式。


以 "-9+10*5/(a+10) == #t1" 为例,推导如下:

"-9"   -> unop subexpr
"+10"  -> binop subexpr
"*5"   -> binop subexpr

"/(a+10)" -> binop subexpr
"(a+10)"  -> simpleexp

"== #t1"  -> binop subexpr
"#t1"     -> unop subexpr


Lua里一元操作符有:

  • '#' 取字符串长度,或table数组元素数量。

  • '-' 负号。

  • 'not' 取反,相当于c语言的'!'取反。



simpleexp

simpleexp -> NIL 
 | false | true | NUMBER
 | STRING | ... | FUNCTION body
 | primaryexp | constructor


前面6个产生式比较简单,分别对应nil、false、true、数字、常量字符串、可变参数...

  • FUNCTION body 表示函数定义。

  • constructor 表示table初始化。

  • primaryexp 表示主表达式。



FUNCTION body

body -> `(`parlist`)` chunk END
parlist -> [param {`,' param}]
param -> NAME | `...'


范例:

f = function (a,b,c) 
 return a+b+c
end


  • FUNCTION和END 为两个终结符。

  • chunk 表示函数体。

  • parlist 表示参数列表。


在Lua里函数是第一类型,和普通变量有相同的用法,可以作为参数、值传递,这一点类似python。



constructor

constructor -> `{`[fieldlist]`}`
fieldlist ->
   field { fieldsep field }
   [ fieldsep ]
field ->
   `[` expr `]` `=` expr |
   name `=` expr |
   expr
fieldsep -> `,` | `;`


范例:

a = {}
a = {1,2,3}
a = {x=1,["y2"]=2}
a = {1,2;x=1,[y1]=2;["y2"]=2,3;}


table是Lua里唯一的数据结构,可以理解为array和hash的组合。

  • {1,2,3} 存在数组部分。

  • {x=1} 存在哈希部分。

  • 元素之间可以用 ',' 或 ';' 分隔。

  • {x=1} 等价于 {["x"]=1}。



语法分析总结

通过对Lua语法分析的一系列介绍,虽然没有接触实际源码,相信对Lua语法分析也有了一定的了解。这一块应该属于Lua源码相当难啃的一部分内容,通过先理论后实践的方法,避免陷入源码实现的黑洞,从而提升信心。


Lua的词法分析、语法分析、指令生成模块耦合在一起,并且Lua是基于寄存器的虚拟机。在生成指令的时候,已经指定每个指令所操作的寄存器位置,所有这些逻辑都要在lua脚本的一次遍历分析完成。


关于语法分析的介绍到此为止,后续将介绍指令生成部分,敬请期待!