php脚本的执行过程(编译与执行相分离)

来源:互联网 发布:软件测试全程项目 编辑:程序博客网 时间:2024/05/18 01:34

 php的编译和执行是分离开的,亦即:先执行完编译,而后再执行。很多人会说:c++也是如此啊,确实。不过php的这种分离可以给我们提供很多便利,当然不可避免也有很有缺点。

 

      先说一下整个过程:

      ①php会调用编译函数zend_compile_file()来进行编译。 这个函数的具体实现其实是包括两个主要过程的:词法分析(Lex实现),语法分析(Yacc实现)。当执行完这个函数之后:php脚本的编译就算结束了。 这个函数的输入是:php脚本文件,而输出则是op_array.简单一点说:编译过程就是把脚本给解析成一条条php虚拟机可以处理的指令,而op_array就是这些指令做成的一个array而已(这很类似一些编译型语言编译产生的汇编代码了,也是一条条的命令)。

      ②:之后php虚拟机会调用zend_execute()这个函数来执行。该函数的输入就是上边编译阶段产生的op_array,在这里他会解析每条命令并进行处理。 由于op命令一共有150左右,所以它需要处理这150中命令。这里会产生一个很有意思的问题:它是如何处理这150种命令的呢?首先每条命令都是有对应的处理器来进行处理的。所以:虚拟机会依据op_array中各条命令的类型来分发给响应的处理器来进行处理。

      这里有两个小问题: 1:这里的处理器是什么?  2:如何分发的?

      要解答这两个问题都是要从分发机制上来解释:php虚拟机分发命令的机制有三种:CALL, SWITCH, 和GOTO这三种类型.php默认是使用CALL方式, 也就是所有的opcode处理器都定义为函数, 然后供虚拟机调用. 这种方式是传统的方式, 也一般被认为是最稳定的方式.而SWITCH方式和GOTO方式则是通过switch和goto来分发opcode到对应的处理逻辑(段)执行的.

      那现在来回答上边两个问题:

      1:处理器其实是处理op命令的逻辑。其可以以函数的形式存在,也可能是以逻辑段的方式存在,这取决于命令的分发方式。

      2:分发方式有call,switch和goto三种。哪种效率高呢?其实从上边解释已经可以初步了解了。switch和goto都是在zend_execute()这个函数中有对应的逻辑段,直接执行就可以了。而call是在zend_execute()这个函数中执行函数调用。明摆着:函数调用效率是最低的,调用一次就得压栈啊!所以效率上:call是最低的。对于switch和goto:比如要执行第三种命令的处理:switch还要先挨个判断是不是前两种,而goto根本不需要判断,直接跳到第三种命令的逻辑代码段去执行,这比switch少了顺序从上到下判断的损耗,所以:goto效率又比switch要高。 所以这三种分发方式总体而言:goto > switch > call

 

 

     题外话:由于php默认是call,如果你想进一步榨干php的效能,可以更改下其命令分发方式为goto。不过用goto方式虽然提高了执行速度,但是编译速度上其实最慢的喔。

 

--------------------------------------------------------------------------------------------------------------------------------------------------

     再说一下php这种编译和执行分离的弱点:

     其实也不能算是弱点,虽然zend engine(php的虚拟机)将编译和执行严格分开,但是对于用户而言:就跟没分开一样,因为我每次执行一个php脚本请求都是要执行:编译->执行  这两个阶段。任何一个阶段都少不了。那么这一点我们可以拿来和c++这种编译型语言做一下对比: 同一个请求运行100遍

     ①对于c++,由于其前期只要编译一遍,编译好就不会再重复编译了,只需要执行就ok,所以其损耗为:

         1次编译 + 100次执行

     ②对于php,其每次都要编译+执行,所以其损耗为:

         100次编译 + 100次执行

 

      显然:解释性语言从数量上来看:其消耗是比编译型语言多的多。说白了就是:php这种编译和执行相分离并不是真正的分离。而c++那种才算是真正的分离。

 

     php也早就意识到这个问题了,于是就想了一个办法来解决这个问题:这个解决方案就是eAccelerator。主要思路如下:

当脚本第一次运行后,以某种方式保存编译后脚本(里边存放的是op_array),在我们规定的缓存有效时间内,当第二次运行该脚本时就不在进行重复性的编译工作,而是直接调用执行前面保存的编译后文件,大大提高了程序性能。

 

     这种方式一定程度上提高了php的效率,但不是最终极的方法,最终极的还是改成编译型语言那种方式好了,吼吼~~~

 

---------------------------------------------------------------------------------------------------------------------------------------------------

    最后说一下php编译和执行分离的优点;

    这个优点其实是针对程序员而言,对用户而言没什么。因为这两个阶段的分离,我们可以在这里做一些我们想做的事情。

    比如想做文件加解密,你想把一些php脚本源码文件加密,让用户看不到源码。同时呢这个加密后的源码文件又可以被php虚拟机所解析和处理。当然:要实现这个前提是你先想好加解密算法并保证这个是可逆的过程。

 

    现在你对php源码文件已经加密了,此时你需要定义一下这种加密文件的后缀,假设为:*.buaa。 那问题就是:我们怎么让php虚拟机可以处理这种后缀的文件呢?这就要用到上边所说的编译和执行相分离的过程了。

    回想一下:编译阶段的输入是php源文件,输出是op_array。 ok,我们就在这个阶段做文章。主要思路为:首先在zend_compile_file()这个编译函数中:看一下输入文件的后缀:如果是正常的.php那就走正常逻辑,如果是*.buaa,那就先解密然后再走正常逻辑。。。

    哈~就是这么简单。当然:这个过程没有所说的这么简单,而且你也不可能直接修改zend_compile_file()函数,最后是自己扩展实现一个模块来处理这个过程。

 原文链接:http://blog.csdn.net/nrc_douningbo/article/details/6576777

原创粉丝点击