PHP源码分析-变量的存储方式

来源:互联网 发布:2017sas数据分析大赛 编辑:程序博客网 时间:2024/05/21 06:55
PHP中的变量类型和值是通过C语言实现的,内核具体是如何组织用户在PHP中定义的变量呢?
HashTable在ZE内核中被广泛使用,PHP变量也正是存储在一个HashTable实现的符号表里。

当在PHP中调用一个函数或者类时,内核会创建一个新的符号表,这也是为什么在函数中无法使用函数外部定义的变量的原因。(因为他们分属两个符号表,一个当前作用域,一个全局作用域)


现在来看内核中是如何定义作用域的:

struct _zend_executor_globals {    //略    HashTable symbol_table;//全局变量的符号表    HashTable *active_symbol_table;//局部变量的符号表    //略};

可以通过EG宏来访问变量符号表,EG(symbol_table)访问全局作用域的变量符号表,EG(active_symbol_table)访问当前作用域的变量符号表。


<?php$foo='bar';?>

上面这段代码很简单,创建变量foo,并赋值bar。之后的PHP代码中就可以调用$foo变量了。
现在看看PHP中定义的变量,内核中是如何实现的。伪代码:

zval* foo;MAKE_STD_ZVAL(foo);ZVAL_STRING(foo, "bar", 1);ZEND_SET_SYMBOL( EG(active_symbol_table), "foo", foo);

第一步、创建一个zval结构,并设置类型。
第二步、赋值为bar。
第三步、将其加入当前作用域符号表,只有这样用户才能在PHP里使用这个变量。

通过简单的这三步,即可实现定义PHP变量。简单的原因,在于内核为我们提供了强大的宏。现在我们将宏分别展开。

MAKE_STD_ZVAL应用到的宏有:

#define MAKE_STD_ZVAL(zv)ALLOC_ZVAL(zv);INIT_PZVAL(zv)#define ALLOC_ZVAL(z)ZEND_FAST_ALLOC(z, zval, ZVAL_CACHE_LIST)#define ZEND_FAST_ALLOC(p, type, fc_type)(p) = (type *) emalloc(sizeof(type))#define INIT_PZVAL(z)(z)->refcount__gc = 1;(z)->is_ref__gc = 0;
MAKE_STD_ZVAL(foo)展开后得到:
(foo) = (zval *) emalloc(sizeof(zval));(foo)->refcount__gc = 1;(foo)->is_ref__gc = 0;
可以看出,MAKE_STD_ZVAL做了三件事:分配内存、初始化zval结构中的refcount、is_ref。

ZVAL_STRING应用到的宏有:

#define ZVAL_STRING(z, s, duplicate) {\const char *__s=(s);\Z_STRLEN_P(z) = strlen(__s);\Z_STRVAL_P(z) = (duplicate?estrndup(__s, Z_STRLEN_P(z)):(char*)__s);\Z_TYPE_P(z) = IS_STRING;\}#define Z_STRLEN_P(zval_p)Z_STRLEN(*zval_p)#define Z_STRLEN(zval)(zval).value.str.len#define Z_STRVAL_P(zval_p)Z_STRVAL(*zval_p)#define Z_STRVAL(zval)(zval).value.str.val#define Z_TYPE_P(zval_p)Z_TYPE(*zval_p)#define Z_TYPE(zval)(zval).type#define IS_STRING6
展开后得到:

const char *__s=("foo");(foo).value.str.len=strlen(__s);(foo).value.str.val=(duplicate?estrndup(__s, (zval).value.str.len):(char*)__s);(foo).type=6;
ZVAL_STRING做的工作是设置数据类型并赋值。


ZEND_SET_SYMBOL这里只展开一部分宏,因为它展开后过于复杂。

# define EG(v) (executor_globals.v)
展开部分后得到:
ZEND_SET_SYMBOL(executor_globals.active_symbol_table, "foo", foo);
将变量名入当前作用域符号表。


注:之所以使用内核提供的宏来分配内存、注册变量作用域,是因为这样能提高兼容性。



原创粉丝点击