lua执行字节码的过程介绍

来源:互联网 发布:安易数据恢复软件破解 编辑:程序博客网 时间:2024/06/05 10:11

前面一篇文章中介绍了lua给下面代码生成最终的字节码的整个过程,这次我们来看看lua vm执行这些字节码的过程。

1 foo = "bar"2 local a, b = "a", "b"3 foo = a

生成的字节码如下所示:

之前lua是在luaY_parser函数(入口)中完成了lua脚本的解析生成字节码的整个过程的,在生成了main func(过程见“lua解析赋值类型代码的过程“)后luaY_parser会返回一个Proto结构体指针tf,Proto结构将描述整个main func的所有信息。

//如果此字符是LUA_SIGNATURE中的第一个字符说明文件内容是预编译好的文件内容,因此利用函数luaU_undump来加载一个预编译后的代码块  //否则是未编译的脚本源码,利用luaY_parser来对源码进行parse  tf = ((c == LUA_SIGNATURE[0]) ? luaU_undump : luaY_parser)(L, p->z,                                                             &p->buff, p->name);  cl = luaF_newLclosure(L, tf->nups, hvalue(gt(L)));  cl->l.p = tf;  for (i = 0; i < tf->nups; i++)  /* initialize eventual upvalues */    cl->l.upvals[i] = luaF_newupval(L);  setclvalue(L, L->top, cl);  incr_top(L);

接下来第5行,函数luaF_newLclosure生成了一个Closure结构体来表示lua的closure,然后下一行将Proto结构体地址传给cl保存,接下来的循环里cl的upvalue数组记录下main func中的upvalue,然后setclvalue函数将cl放入到lua stack的栈顶上,incr_top将栈顶L->top加一。此时lua stack的顶部存放了包裹了main func的closure结构体,下面lua将会调用lua_pcall函数来执行这个closure了,也即vm加载整个生成的字节码并加以解释。

LUA_API int lua_pcall (lua_State *L, int nargs, int nresults, int errfunc) {  struct CallS c;  //... ...  c.func = L->top - (nargs+1);  /* function to be called */  c.nresults = nresults;  status = luaD_pcall(L, f_call, &c, savestack(L, c.func), func);  //... ...}/*** Execute a protected call.*/struct CallS {  /* data to `f_call' */  StkId func;  int nresults;};
首先第4行根据要执行的函数参数数量和L->top的值来算出function在lua stack中的位置并将其保存到CallS结构体中,其中CallS结构体中的StkId类型为stack下标类型。接着第6行将c和f_call函数一起传入luaD_pcall函数中,luaD_pcall函数执行一些标志的设置后调用函数luaD_rawrunprotected,函数luaD_rawrunprotected内部调用f_call并将c作为其参数传入。如下所示:

1 static void f_call (lua_State *L, void *ud) {2   struct CallS *c = cast(struct CallS *, ud);3   luaD_call(L, c->func, c->nresults);4 }

在luaD_call中首先判断lua此时是否到达了函数调用层次的最大值,超过这报错否则判断要执行的函数是不是lua function,是的话就调用luaV_execute函数来运行vm执行字节码。

void luaD_call (lua_State *L, StkId func, int nResults) {  if (++L->nCcalls >= LUAI_MAXCCALLS) {    if (L->nCcalls == LUAI_MAXCCALLS)      luaG_runerror(L, "C stack overflow");    else if (L->nCcalls >= (LUAI_MAXCCALLS + (LUAI_MAXCCALLS>>3)))      luaD_throw(L, LUA_ERRERR);  /* error while handing stack error */  }  if (luaD_precall(L, func, nResults) == PCRLUA)  /* is a Lua function? */    luaV_execute(L, 1);  /* call it */  L->nCcalls--;  luaC_checkGC(L);}
luaV_execute函数是vm执行字节码的核心过程,整个函数约有400行代码,由于整个过程分支太多,我们只讲解示例中的字节码解析过程。
void luaV_execute (lua_State *L, int nexeccalls) {  LClosure *cl;  StkId base;  TValue *k;  const Instruction *pc; reentry:  /* entry point */  lua_assert(isLua(L->ci));  pc = L->savedpc;  cl = &clvalue(L->ci->func)->l;  base = L->base;  k = cl->p->k;//... ...

L->savedpc为字节码数组的指针,因此pc保存了当前要执行字节码的下标,clvalue萃取出当前要执行的lua function对应的closure,k指向了当前function的常量数组。

下面先来看看vm解释loadk01字节码的过程。

/* main loop of interpreter */  for (;;) {    const Instruction i = *pc++;    StkId ra;    //... ...    ra = RA(i);    //... ...    switch (GET_OPCODE(i)) {      //... ...      case OP_LOADK: {        setobj2s(L, ra, KBx(i));        continue;      }//... ...
第3行i保存了当前要执行的字节码,同时pc指向下一条字节码,第6行ra保存了通过宏RA萃取出的字节码中的a部分并与function stack的base相加得出的stack中的值;第8行Get_OPCODE宏萃取出字节码i的类型,结果是OP_LOADK,因此调用了setobj2s函数,其中KBx宏萃取出字节码i的bx部分并与function的常量数组地址相加得出的常量值,这里ra指向了function stack中相应的位置,KBx(i)部分指向了当前function中常量数组中存放的常量“bar”。

/* from stack to (same) stack */#define setobjs2s    setobj/* to stack (not from same stack) */#define setobj2s    setobj#define setobj(L,obj1,obj2) \  { const TValue *o2=(obj2); TValue *o1=(obj1); \    o1->value = o2->value; o1->tt=o2->tt; \    checkliveness(G(L),o1); }
obj1为ra,obj2为KBx结果。可以看到第7行将这两个值转换为了TValue,并将o2的value设为o1的value,o2的值的类型设为o1的类型,效果上完成了将“bar”的值存放在了function stack上。接着又返回到上面的主循环处读取下一个字节码并执行,下一个要执行的字节码为setglobal00.
switch (GET_OPCODE(i)) {      //... ...      case OP_SETGLOBAL: {        TValue g;        sethvalue(L, &g, cl->env);        lua_assert(ttisstring(KBx(i)));        Protect(luaV_settable(L, &g, KBx(i), ra));        continue;      }//... ...
首先第5行中,cl->env为当前function的环境,函数sethvalue将其传给了g,KBx(i)指向了function常量数组中的值,ra为stack中的值,这里为前一条字节码loadk保存在stack中的“bar”。

void luaV_settable (lua_State *L, const TValue *t, TValue *key, StkId val) {  int loop;  TValue temp;  for (loop = 0; loop < MAXTAGLOOP; loop++) {    const TValue *tm;    if (ttistable(t)) {  /* `t' is a table? */      Table *h = hvalue(t);      TValue *oldval = luaH_set(L, h, key); /* do a primitive set */      if (!ttisnil(oldval) ||  /* result is no nil? */          (tm = fasttm(L, h->metatable, TM_NEWINDEX)) == NULL) { /* or no TM? */        setobj2t(L, oldval, val);        h->flags = 0;        luaC_barriert(L, h, val);        return;      } //... ...}

这里首先判断g是不是table,然后第7行取得g的hash部分,通过第8行luaH_set里的luaH_get得到table中key对应的old value。最后第11行,函数setobj2t将val("bar")存放在了全局变量foo的位置处,即foo = “bar”。

1 #define setobj(L,obj1,obj2) \2   { const TValue *o2=(obj2); TValue *o1=(obj1); \3     o1->value = o2->value; o1->tt=o2->tt; \4     checkliveness(G(L),o1); }

好了到了这里语句foo = “bar”对应的两条字节码的解释过程已经全部介绍完了,下面的三条字节码就不再详细解释了,大家可以按照上面的路线自己过一遍~








0 0
原创粉丝点击