lua源码剖析(一)

来源:互联网 发布:linux下的telnet 编辑:程序博客网 时间:2024/05/16 10:23
先来看lua中值的表示方式。 
Java代码  收藏代码
  1. #define TValuefields Value value; int tt  
  2.   
  3. typedef struct lua_TValue {  
  4.   TValuefields;  
  5. } TValue;  


其中tt表示类型,value也就是lua中对象的表示。 

Java代码  收藏代码
  1. typedef union {  
  2.   GCObject *gc;  
  3.   void *p;  
  4.   lua_Number n;  
  5.   int b;  
  6. } Value;  


gc用于表示需要垃圾回收的一些值,比如string,table等等。 
p用于表示 light userdata它是不会被gc的。 
n表示double 
b表示boolean 

tvalue这样表示会有空间的浪费.可是由于要完全符合c99,因此只能这么做.否则我们为了效率可以这么做.由于在大多数机器上,指针都是严格对齐(4或者8字节对齐).因此后面的2,3位就是0,因此我们可以将类型存储在这几位,从而极大地压缩了Value的大小. 

更新:这里经的老朱同学的提醒,其实tvalue之所以不使用指针的后几位来存储类型,更重要的时候由于和c的交互.因为那样的话,我们就必须强制和lua交互的c模块也必须保持和我们一样的内存模型了. 

lua_state表示一个lua虚拟机,它是per-thread的,也就是一个协程(多个和lua交互的c程序,那自然也会有多个lua-state)一个lua_state,然后来看它的几个比较重要的域。 

StkId top这个域表示在这个栈上的第一个空闲的slot。 
StkId base 这个域表示当前所在函数的base。这个base可以说就是栈底。只不过是当前函数的。 
StkId stack_last 在栈上的最后一个空闲的slot 
StkId stack  栈的base,这个是整个栈的栈底。 
StkId是一个Tvalue类型的指针。 


在 lstrlib中,基本上所有的str函数都是首先调用luaL_checklstring来得到所需要处理的字符串然后再进行处理。如果是需要改变字符串的话,那么都会首先生成一个luaL_Buffer对象(主要原因是在lua中,都会做一个传递进来的字符串的副本的),然后最终将处理的结果通过调用luaL_pushXXX放到栈中。 

luaL_checklstring 函数,这个函数只是简单的对lua_tolstring进行了一层简单的封装。而luaL_tolstring也是对index2adr函数做了一层简单封装,然后判断所得到的值是否为字符串,是的话返回字符串,并修改len为字符串长度。 

Java代码  收藏代码
  1. LUALIB_API const char *luaL_checklstring (lua_State *L, int narg, size_t *len) {  
  2. ///通过luaL_tolstring得到字符串s  
  3.   const char *s = lua_tolstring(L, narg, len);  
  4.   if (!s) tag_error(L, narg, LUA_TSTRING);  
  5.   return s;  
  6. }  


因此我们详细来看index2adr这个函数,这个函数目的很简单,就是通过索引得到对应的值的指针。第一个参数lua_state,第二个参数为索引值。 

我们首先要知道在lua中,索引值可以为负数也可以为正数,当为负数的话,top为-1,当为正数第一个压入栈的元素为1,依此类推. 

而且有些类型的对象当转换时还需要一些特殊处理,比如闭包中的变量。 

除去特殊的,一般的存取很简单,当index>0则我们只需要用base+i -1来取得这个指针,为什么要用base而不是top呢,我们上面已经说过了,当index为正数,所取得的是第一个值,因此也就是栈的最下面那个值,而 base表示当前函数在栈里面的位置,因此我们加上i -1 就可以了。当index<0则更简单,我们用top+index就可以了。 


Java代码  收藏代码
  1. static TValue *index2adr (lua_State *L, int idx) {  
  2.   if (idx > 0) {  
  3. ///索引为正值时,通过base取得value  
  4.     TValue *o = L->base + (idx - 1);  
  5.     api_check(L, idx <= L->ci->top - L->base);  
  6. ///如果超过top,则返回nil,否则返回o。  
  7.     if (o >= L->top) return cast(TValue *, luaO_nilobject);  
  8.     else return o;  
  9.   }  
  10.   else if (idx > LUA_REGISTRYINDEX) {  
  11. ///正常的小于0的索引。则直接通过top+idx取得对象。  
  12.     api_check(L, idx != 0 && -idx <= L->top - L->base);  
  13.     return L->top + idx;  
  14.   }  
  15. ///下面省略的部分是取得闭包以及其他一些类型的值,等我们后面分析完所有类型后,会再次回到这个函数  
  16. ..............................  
  17. }  



而lmathlib.c中处理数字更简单,因为数字不需要转换,因此基本都是直接调用lua_pushnumber来压入栈。 

接下来就来看lua_pushXXX这些函数。这些函数都是用来从C->stack的。 

我们先来看不需要gc的类型,不需要gc的类型的话都是比较简单。比如lua_pushinteger.内部实现都是调用setnvalue来将值set进栈顶。 

Java代码  收藏代码
  1. #define setnvalue(obj,x) \  
  2.   { TValue *i_o=(obj); i_o->value.n=(x); i_o->tt=LUA_TNUMBER; }  


可以看到很简单的实现,就是给value赋值,然后给类型也赋值。 

而这里我们要知道基本上每个类型都会有一个setXXvalue的宏来设置相应的值。 
这里还要注意一个就是nil值,在lua中,nil有一个专门的类型就是LUA_TNIL,下面就是lua中的值的类型。 

Java代码  收藏代码
  1. #define LUA_TNIL        0  
  2. #define LUA_TBOOLEAN        1  
  3. #define LUA_TLIGHTUSERDATA    2  
  4. #define LUA_TNUMBER        3  
  5. #define LUA_TSTRING        4  
  6. #define LUA_TTABLE        5  
  7. #define LUA_TFUNCTION        6  
  8. #define LUA_TUSERDATA        7  
  9. #define LUA_TTHREAD        8  


接下来我们先来看lua中gc的结构,在lua中包括table,string,function等等都是需要gc的。因此gc的union也就包含了这几个类型: 

Java代码  收藏代码
  1. union GCObject {  
  2.   GCheader gch;  
  3.   union TString ts; /*string*/  
  4.   union Udata u;   /*user data*/  
  5.   union Closure cl; /* 闭包 */  
  6.   struct Table h; /*表*/  
  7.   struct Proto p; /*函数*/  
  8.   struct UpVal uv;  
  9.   struct lua_State th;  /* thread */  
  10. };  


而这里gc的头主要就是用来实现gc算法,它包括了next(指向下一个gc对象),tt 表示类型,marked用来标记这个对象的使用。 

Java代码  收藏代码
  1. #define CommonHeader    GCObject *next; lu_byte tt; lu_byte marked  


接下来我们就来详细分析下这几种需要gc的类型的结构。 

首先来看TSring: 

Java代码  收藏代码
  1. typedef union TString {  
  2.   L_Umaxalign dummy;  /* ensures maximum alignment for strings */  
  3.   struct {  
  4.     CommonHeader;  
  5.     lu_byte reserved;  
  6.     unsigned int hash;  
  7.     size_t len;  
  8.   } tsv;  
  9. } TString;  


我们知道在lua中会将字符串通过一定的算法计算出散列值,并保存这个散列值到hash域中,然后以后的操作,都是通过这个散列值来进行操作。 

而TSring其实只是字符串的一个头,而字符串的值会紧跟在头的后面,详细可以看newlstr函数。 

在lus_state中的global_State *l_G也就是全局状态中有一个 stringtable strt的域,所有的字符串都是保存在这个散列表中。 

Java代码  收藏代码
  1. typedef struct stringtable {  
  2.   GCObject **hash;  
  3.   lu_int32 nuse;  /* number of elements */  
  4.   int size;  
  5. } stringtable;  


可以看到hash也就是保存了所有的字符串。这里size表示为hash桶的大小。 

在luaS_newlstr中会先计算字符串的hash值,然后遍历stringtable这个全局hash表,如果查找到对应的字符串就返回ts,否则调用newlstr重新生成一个。 



而 newlstr则就是新建一个tsring然后给相应位赋值,然后计算hash值插入到全局的global_State的stringtable中。然后每次都会比较nuse和size的大小,如果大于size则说明碰撞太严重,因此增加桶的大小。这里增加每次都是2的倍数增加。 
Java代码  收藏代码
  1. static TString *newlstr (lua_State *L, const char *str, size_t l,  
  2.                                        unsigned int h) {  
  3.   TString *ts;  
  4.   stringtable *tb;  
  5.   if (l+1 > (MAX_SIZET - sizeof(TString))/sizeof(char))  
  6.     luaM_toobig(L);  
  7. ///初始化字符串。  
  8.   ts = cast(TString *, luaM_malloc(L, (l+1)*sizeof(char)+sizeof(TString)));  
  9.   ts->tsv.len = l;  
  10.   ts->tsv.hash = h;  
  11.   ts->tsv.marked = luaC_white(G(L));  
  12.   ts->tsv.tt = LUA_TSTRING;  
  13.   ts->tsv.reserved = 0;  
  14. ///开始拷贝字符串数据到ts的末尾  
  15.   memcpy(ts+1, str, l*sizeof(char));  
  16.   ((char *)(ts+1))[l] = '\0';  /* ending 0 */  
  17. ///取得全局的strtable  
  18.   tb = &G(L)->strt;  
  19. ///计算位置  
  20.   h = lmod(h, tb->size);  
  21. ///链接到相应的位置,并更新nuse。  
  22.   ts->tsv.next = tb->hash[h];  /* chain new entry */  
  23.   tb->hash[h] = obj2gco(ts);  
  24.   tb->nuse++;  
  25. ///判断是否需要增加桶的大小  
  26.   if (tb->nuse > cast(lu_int32, tb->size) && tb->size <= MAX_INT/2)  
  27.     luaS_resize(L, tb->size*2);  /* too crowded */  
  28.   return ts;  
  29. }  

还有一个就是TSring和插入到stringtable中时所要计算的hash值是不一样的。 

接下来就来看这两个hash值如何生成的。先来看tsring中的hash的生成: 

Java代码  收藏代码
  1. size_t step = (l>>5)+1;  
  2. for (l1=l; l1>=step; l1-=step)  /* compute hash */  
  3.     h = h ^ ((h<<5)+(h>>2)+cast(unsigned char, str[l1-1]));  


step表示要计算的次数,l为字符串的长度,这里主要是为了防止太长的字符串。因此右移5位并加一。 

这个hash算法叫做JS Hash Function ,计算完后对桶的大小size取模然后插入到hash表。 

下面来看luaS_newlstr. 
Java代码  收藏代码
  1. TString *luaS_newlstr (lua_State *L, const char *str, size_t l) {  
  2.   GCObject *o;  
  3.   unsigned int h = cast(unsigned int, l);  /* seed */  
  4.   size_t step = (l>>5)+1;  /* if string is too long, don't hash all its chars */  
  5.   size_t l1;  
  6. ///计算字符串hash,  
  7.   for (l1=l; l1>=step; l1-=step)  /* compute hash */  
  8.     h = h ^ ((h<<5)+(h>>2)+cast(unsigned char, str[l1-1]));  
  9. ///遍历全局的字符串表  
  10.   for (o = G(L)->strt.hash[lmod(h, G(L)->strt.size)];  
  11.        o != NULL;  
  12.        o = o->gch.next) {  
  13.     TString *ts = rawgco2ts(o);  
  14.     if (ts->tsv.len == l && (memcmp(str, getstr(ts), l) == 0)) {  
  15.       /* string may be dead */  
  16.       if (isdead(G(L), o)) changewhite(o);  
  17.       return ts;  
  18.     }  
  19.   }  
  20.   return newlstr(L, str, l, h);  /* not found */  
  21. }  


这里要注意lua每次都会memcpy传递进来的字符串的。而且在lua内部字符串也都是以0结尾的。 

接下来来看lua中最重要的一个结构Table. 
Java代码  收藏代码
  1. typedef union TKey {  
  2.   struct {  
  3.     TValuefields;  
  4.     struct Node *next;  /* for chaining */  
  5.   } nk;  
  6.   TValue tvk;  
  7. } TKey;  
  8.   
  9.   
  10. typedef struct Node {  
  11.   TValue i_val;  
  12.   TKey i_key;  
  13. } Node;  
  14.   
  15. typedef struct Table {  
  16.   CommonHeader;  
  17.   lu_byte flags;  /* 1<<p means tagmethod(p) is not present */  
  18.   lu_byte lsizenode;  /* log2 of size of `node' array */  
  19.   struct Table *metatable;  
  20.   TValue *array;  /* array part */  
  21.   Node *node;  
  22.   Node *lastfree;  /* any free position is before this position */  
  23.   GCObject *gclist;  
  24.   int sizearray;  /* size of `array' array */  
  25. } Table;  



这里它的头和TSring是一样的,其实所有gc的类型的头都是相同的。在lua5.0中table表示为一种混合的数据结构,包含一个数组部分和一个散列表部分,当键为整数时,他不会保存这个键而是直接保存这个值到数组中。 

也就是数组保存在上面的array中,而散列表保存在node中。其中tkey保存了当前slot的下一个node的指针。 

我们可以通过lapi.c来详细分析table的实现。 

比较核心的函数就是luaH_get。 

const TValue *luaH_get (Table *t, const TValue *key) 

这个函数就是用来从表t中查找key对应的值,从而返回。因此这里我们可以看到它会通过key的类型不同,从而进行不同的处理。 

1 如果是NIl 则直接返回luaO_nilobject。 

2 如果是string,则调用luaH_getstr进行处理(下面会介绍) 

3 如果是number,则调用luaH_getnum来处理。这里要注意如果是非int类型的话,它会跳过这里,进入default处理。 

4 然后就是default了。它会计算key的hash值,然后在hash表中查找到slot,然后遍历这个链表查找到对应的key,然后返回value。如果没有找到则返回nil。 




此时由于lua的lua_Number默认是double型的,而数组的下标是int的,因此这里有一个转换double到int的一个过程。在lua中是通过lua_number2int这个函数来实现的,它用了一个小技巧。 

Java代码  收藏代码
  1. union luai_Cast { double l_d; long l_l; };  
  2. #define lua_number2int(i,d) \  
  3.   { volatile union luai_Cast u; u.l_d = (d) + 6755399441055744.0; (i) = u.l_l; }  


可以看到lua是定义了一个联合,然后将要转换的d加上 6755399441055744.0。然后将l_l赋值给最终的值i。 

6755399441055744.0是一个magic number ,它也就是1.5*2^52 ,而在ia-32的架构中,fraction是52位。而在浮点数加法中,首先要做的就是小数点对齐,而对齐标准就是和幂大的对齐。并且小数点前的1是忽略的。因此当相加时,就会将小数点后的四舍五入掉了。而为什么是1.5呢,主要是为了处理负数。 

我这里只是简单的分析了下,详细的,自己动笔算一下就清楚了。 


ok,现在我们来看luaH_getstr的实现。这个函数的实现其实很简单,就是计算hash然后得到链表,并遍历,得到对应key的值。这里我们要知道当 key为字符串时,在table中的hash不等于string本身的hash(也就是全局字符串hash的那个hash). 

Java代码  收藏代码
  1. const TValue *luaH_getstr (Table *t, TString *key) {  
  2. ///得到对应的节点。  
  3.   Node *n = hashstr(t, key);  
  4. ///然后开始遍历链表。  
  5.   do {  /* check whether `key' is somewhere in the chain */  
  6.     if (ttisstring(gkey(n)) && rawtsvalue(gkey(n)) == key)  
  7.       return gval(n);  /* that's it */  
  8.     else n = gnext(n);  
  9.   } while (n);  
  10.   return luaO_nilobject;  
  11. }  


然后是luaH_getnum的实现。这个函数首先判断这个key,也就是数组下标是否在范围内。如果在则直接返回相应的值。否则将这个key计算hash然后在hash链表中查找相应的值。 


Java代码  收藏代码
  1. const TValue *luaH_getnum (Table *t, int key) {  
  2.   /* (1 <= key && key <= t->sizearray) */  
  3. ///判断key的范围。  
  4.   if (cast(unsigned int, key-1) < cast(unsigned int, t->sizearray))  
  5.     return &t->array[key-1];  
  6.   else {  
  7. ///如果不在,则说明在hash部分,因此开始遍历对应的node。  
  8.     lua_Number nk = cast_num(key);  
  9.     Node *n = hashnum(t, nk);  
  10.     do {  /* check whether `key' is somewhere in the chain */  
  11.       if (ttisnumber(gkey(n)) && luai_numeq(nvalue(gkey(n)), nk))  
  12.         return gval(n);  /* that's it */  
  13.       else n = gnext(n);  
  14.     } while (n);  
  15.     return luaO_nilobject;  
  16.   }  
  17. }  




看完get我们来看set方法。 

TValue *luaH_set (lua_State *L, Table *t, const TValue *key) 

这个函数会判断是否key已经存在,如果已经存在则直接返回对应的值。否则会调用newkey来新建一个key,并返回对应的value。(这里主要并不是所有的数字的key都会加到数组里面,有一部分会加入到hash表中).可以说这个hash表中包含两个链表,一个是空的槽的链表,一个是已经填充了的槽的链表。 

Java代码  收藏代码
  1. TValue *luaH_set (lua_State *L, Table *t, const TValue *key) {  
  2. ///调用get得到对应的值(也就是在表中查找是否存在这个key)  
  3.   const TValue *p = luaH_get(t, key);  
  4.   t->flags = 0;  
  5. ///不为空,则直接返回这个值  
  6.   if (p != luaO_nilobject)  
  7.     return cast(TValue *, p);  
  8.   else {  
  9.     if (ttisnil(key)) luaG_runerror(L, "table index is nil");  
  10.     else if (ttisnumber(key) && luai_numisnan(nvalue(key)))  
  11.       luaG_runerror(L, "table index is NaN");  
  12. ///调用newkey,返回一个新的值。  
  13.     return newkey(L, t, key);  
  14.   }  
  15. }  


然后来看newkey。 

static TValue *newkey (lua_State *L, Table *t, const TValue *key) 

这里lua使用的是open-address hash。不过做了一些改良。这里它会有专门的一个free position的链表(也就是所有空闲槽的一个链表),来保存所有冲突的node,换句话说就是如果有冲突,则从free position中取得位置,然后将冲突元素放进去,并从free position中删除。 

这个函数的具体流程是这样的: 

1 首先调用mainposition返回一个node,然后判断node的value是否为空,如果为空,则给value赋值,然后返回这个node的value。 

2 如果node的value非空,或者说这个node就是空的,则先通过getfreepo从空的槽的链表得到一个空的槽,如果没有空着的槽,则说明hash表已满,此时扩容hash表,然后继续调用luaH-set. 

3 如果此时有空着的槽,再次计算mainposition,通过key的value.(这是因为我们是开地址散列,每次冲突的元素都会放到free position中)。如果得到的node和第一步计算的node相同,则将空着的槽(也就是链表)n链接到第一步得到的node后面,这个也就是将当前要插入的key的node到free position,然后移动node指针到n的位置,然后赋值并返回。 

4 如果和第一步计算的node不同,则将新的node插入到这个node。然后将本身这个node移动到free position。 

接下来来看源码。 

Java代码  收藏代码
  1. static TValue *newkey (lua_State *L, Table *t, const TValue *key) {  
  2. ///得到主位置的值。  
  3.   Node *mp = mainposition(t, key);  
  4.   if (!ttisnil(gval(mp)) || mp == dummynode) {  
  5.     Node *othern;  
  6. ///得到freee position的node。  
  7.     Node *n = getfreepos(t);  /* get a free place */  
  8.     if (n == NULL) {  /* cannot find a free place? */  
  9. ///如果为空,则说明table需要增长,因此rehash  
  10.       rehash(L, t, key);  /* grow table */  
  11.       return luaH_set(L, t, key);  /* re-insert key into grown table */  
  12.     }  
  13.     lua_assert(n != dummynode);  
  14. ///得到mp的主位置。  
  15.     othern = mainposition(t, key2tval(mp));  
  16. ///如果不等,则说明mp本身就是一个冲突元素。  
  17.     if (othern != mp) {  /* is colliding node out of its main position? */  
  18. ///链接冲突元素到free position  
  19.       while (gnext(othern) != mp) othern = gnext(othern);  /* find previous */  
  20.       gnext(othern) = n;  /* redo the chain with `n' in place of `mp' */  
  21.       *n = *mp;  /* copy colliding node into free pos. (mp->next also goes) */  
  22.       gnext(mp) = NULL;  /* now `mp' is free */  
  23.       setnilvalue(gval(mp));  
  24.     }  
  25.     else {  /* colliding node is in its own main position */  
  26.       /* new node will go into free position */  
  27. ///这个说明我们当前的key是冲突元素。  
  28.       gnext(n) = gnext(mp);  /* chain new position */  
  29.       gnext(mp) = n;  
  30.       mp = n;  
  31.     }  
  32.   }  
  33. ///赋值。  
  34.   gkey(mp)->value = key->value; gkey(mp)->tt = key->tt;  
  35.   luaC_barriert(L, t, key);  
  36.   lua_assert(ttisnil(gval(mp)));  
  37. ///返回value  
  38.   return gval(mp);  
  39. }  


接下来来看rehash的实现。每次表满了之后,都会重新计算散列值。 

具体的函数是 
static void rehash (lua_State *L, Table *t, const TValue *ek) 

再散列的流程很简单。第一步是确定新数组部分和新散列部分的尺寸。所以,Lua遍历所有条目,计数并分类它们,每次满的时候,都会是最接近数组当前大小的值的次幂(0->1,3->4,9->16等等),它使得数组部分超过半数的元素被填充。然后散列尺寸是能容纳所有剩余条目的2的最小乘幂。 

lua为了提高效率,尽量不去做rehash,因为rehash非常非常耗时,因此看下面的代码: 

Java代码  收藏代码
  1. local a={}  
  2. print("-----------\n")  
  3. a.x=1  
  4. a.y=2  
  5. a.z=3  
  6. a.u=4  
  7. a.o=5  
  8. for i = 11 do  
  9.     print(i)  
  10.     print("==============\n")  
  11.     a[i]=1  
  12.     print("==============\n")  
  13. end  


当a.o之后表的散列部分大小为8,因此下面的a[i]=1,尽管属于数组部分,可是不会进行rehash,而是暂时放到hash部分中。而当必须要rehash表的时候,计算数组大小时,会将放到hash部分中的数组重新插入到数组部分。 

来看代码,这里注释很详细,我就简单的介绍下。 

我们知道在lua中,数组部分有个最大值(为2^26),而这里它准备了一个数组,大小为26+1,然后数组每一个的值都表示了在某一个段的范围内的值得多少: 

nums[i] = number出表示了在  2^(i-1) 和 2^i之间的数组部分的有多少值。 

这样做的目的主要是为了防止数组部分过于稀疏,太过于稀疏的话,会将一些值放到hash部分中,我们下面分析computesizes时,会详细介绍这个。 


Java代码  收藏代码
  1. ///这里表示数组部分的最大容量为2^26  
  2. #define MAXBITS     26  
  3. static void rehash (lua_State *L, Table *t, const TValue *ek) {  
  4.   int nasize, na;  
  5.   int nums[MAXBITS+1];  /* nums[i] = number of keys between 2^(i-1) and 2^i */  
  6.   int i;  
  7.   int totaluse;  
  8. ///首先初始化每部分都为0  
  9.   for (i=0; i<=MAXBITS; i++) nums[i] = 0;  /* reset counts */  
  10. ///计算array部分的元素个数  
  11.   nasize = numusearray(t, nums);  /* count keys in array part */  
  12.   totaluse = nasize;  /* all those keys are integer keys */  
  13. ///计算hash部分的元素个数  
  14.   totaluse += numusehash(t, nums, &nasize);  /* count keys in hash part */  
  15.   /* count extra key */  
  16.   nasize += countint(ek, nums);  
  17.   totaluse++;  
  18. ///计算新的数组部分的大小  
  19.   na = computesizes(nums, &nasize);  
  20.   /* resize the table to new computed sizes */  
  21. ///调用resize调整table的大小。  
  22.   resize(L, t, nasize, totaluse - na);  
  23. }  


这里比较关键就是上面几个计算函数,我们一个个来分析: 
numusearray 计算当前的数组部分的元素个数,并且给num赋值。 

Java代码  收藏代码
  1. static int numusearray (const Table *t, int *nums) {  
  2.   int lg;  
  3.   int ttlg;  /* 2^lg */  
  4.   int ause = 0;  /* summation of `nums' */  
  5.   int i = 1;  /* count to traverse all array keys */  
  6.   for (lg=0, ttlg=1; lg<=MAXBITS; lg++, ttlg*=2) {  /* for each slice */  
  7.     int lc = 0;  /* counter */  
  8.     int lim = ttlg;  
  9. ..........................  
  10.     /* count elements in range (2^(lg-1), 2^lg] */  
  11.     for (; i <= lim; i++) {  
  12.       if (!ttisnil(&t->array[i-1]))  
  13.         lc++;  
  14.     }  
  15. ///得到相应的段的个数  
  16.     nums[lg] += lc;  
  17. ///计算总的元素个数。  
  18.     ause += lc;  
  19.   }  
  20.   return ause;  
  21. }  


然后是numusehash ,这个函数计算hash部分的元素个数。 
Java代码  收藏代码
  1. static int numusehash (const Table *t, int *nums, int *pnasize) {  
  2.   int totaluse = 0;  /* total number of elements */  
  3.   int ause = 0;  /* summation of `nums' */  
  4.   int i = sizenode(t);  
  5. ///遍历node。(由于是开地址散列,因此遍历很简单)  
  6.   while (i--) {  
  7.     Node *n = &t->node[i];  
  8. ///判断是否为nil  
  9.     if (!ttisnil(gval(n))) {  
  10. ///countint就是判断n是否可以进入数组部分,是的话返回1,否则为0  
  11.       ause += countint(key2tval(n), nums);  
  12. ///总得大小加一  
  13.       totaluse++;  
  14.     }  
  15.   }  
  16. ///更新数组部分的大小  
  17.   *pnasize += ause;  
  18.   return totaluse;  
  19. }  


接下来是computesizes,它用来计算新的数组部分的大小。这里扩展的大小也就是最接近数组当前的大小的2的次幂。 

这里遍历也就是每次一个段的遍历。 

如果数组的利用率小于50%的话,大的元素就不会计算到数组部分,也就是会放到hash部分。 
Java代码  收藏代码
  1. static int computesizes (int nums[], int *narray) {  
  2.   int i;  
  3.   int twotoi;  /* 2^i */  
  4.   int a = 0;  /* number of elements smaller than 2^i */  
  5.   int na = 0;  /* number of elements to go to array part */  
  6.   int n = 0;  /* optimal size for array part */  
  7.   for (i = 0, twotoi = 1; twotoi/2 < *narray; i++, twotoi *= 2) {  
  8. ///如果大于0,说明这个段中有数据  
  9.     if (nums[i] > 0) {  
  10.       a += nums[i];  
  11.       if (a > twotoi/2) {    
  12. ///如果多于一半,则设置数组当前的大小为twotoi(2^i)  
  13.         n = twotoi;  /* optimal size (till now) */  
  14.         na = a;  /* all elements smaller than n will go to array part */  
  15.       }  
  16. ///如果少于一半,则这个值将不会计算到数组部分,也就是n值不会更新  
  17.     }  
  18.     if (a == *narray) break;  /* all elements already counted */  
  19.   }  
  20.   *narray = n;  
  21.   lua_assert(*narray/2 <= na && na <= *narray);  
  22.   return na;  
  23. }  
Java代码  收藏代码
  1.   


resize就不介绍了,这个函数比较简单,就是重新分配数组部分和hash部分的大小,这里用realloc来调整大小,然后重新插入值。
0 0
原创粉丝点击