函数调用栈

来源：互联网发布：linux find mmin 编辑：程序博客网时间：2024/05/20 18:18

首先引入几个寄存器：

EIP，EBP，ESP都是系统的寄存器，里面存的都是些地址。

为什么要说这三个指针，是因为我们系统中栈的实现上离不开他们三个。

我们DC上讲过栈的数据结构，主要有以下特点：

后进先处。（这个强调过多）

其实它还有以下两个作用：

1.栈是用来存储临时变量，函数传递的中间结果。

2.操作系统维护的，对于程序员是透明的。

我们可能只强调了它的后进先出的特点，至于栈实现的原理，没怎么讲？下面我们就通过一个小例子说说栈的原理。

先写个小程序：

void fun(void)

{

printf("hello world")；

}

void main(void)

{

fun()

printf("函数调用结束");

}

这是一个再简单不过的函数调用的例子了。

当程序进行函数调用的时候，我们经常说的是先将函数压栈，当函数调用结束后，再出栈。这一切的工作都是系统帮我们自动完成的。

但在完成的过程中，系统会用到下面三种寄存器：

1.EIP Extended Instructions Pointer 指令寄存器

2.ESP Extended Stack Pointer栈指针寄存器

3.EBP Extended (Stack) Base Pointer 栈基指针寄存器

当调用fun函数开始时，三者的作用。

1.EIP寄存器里存储的是CPU下次要执行的指令的地址。

也就是调用完fun函数后，让CPU知道应该执行main函数中的printf（"函数调用结束"）语句了。

2.EBP寄存器里存储的是是栈的栈底指针，通常叫栈基址，这个是一开始进行fun()函数调用之前，由ESP传递给EBP的。（在函数调用前你可以这么理解：ESP存储的是栈顶地址，也是栈底地址。）

3.ESP寄存器里存储的是在调用函数fun()之后，栈的栈顶。并且始终指向栈顶。

当调用fun函数结束后，三者的作用：

1.系统根据EIP寄存器里存储的地址，CPU就能够知道函数调用完，下一步应该做什么，也就是应该执行main函数中的printf（“函数调用结束”）。

2.EBP寄存器存储的是栈底地址，而这个地址是由ESP在函数调用前传递给EBP的。等到调用结束，EBP会把其地址再次传回给ESP。所以ESP又一次指向了函数调用结束后，栈顶的地址。

其实我们对这个只需要知道三个指针是什么就可以，可能对我们以后学习栈溢出的问题以及看栈这方面的书籍有些帮助。当有人再给你说EIP,ESP,EBP的时候，你不能一头雾水，那你水平就显得洼了许多。其实不知道我们照样可以编程,因为我们是C级别的程序员，而不是ASM级别的程序员。

函数调用栈：

理解调用栈最重要的两点是：栈的结构，EBP寄存器的作用。

右侧的红色部分，写出了引发栈结构变化的对应的指令
+| (栈底方向，高位地址) |
| ....................|
| ....................|// call somefun(...)-->修改esp，栈向下增长，参数入栈，返回值入栈
| 参数3 |
| 参数2 |
| 参数1 |
| 返回地址|
-| 上一层[EBP] |// push ebp --->修改esp，栈向下增长

| 局部变量1 | // sub esp局部变量占用空间 -->修改esp，栈向下增长

| 局部变量2 |

|.....................|

补充：栈一直随着函数调用的深入，一直想栈顶方向压下去。每次调用函数时候，先压函数参数（从右往左顺序压），再压入函数调用下条指令的地址（由call完成）。接着进入调用函数体中先执行PUSH EBP; MOV EBP ESP;（一般已经由编译器加入到函数头中了），接着就是吧函数体中的局部变量压入栈中。再遇到函数的调用的嵌套则依此类推。（added by smsong）

“PUSH EBP”“MOV EBP ESP”这两条指令实在大有深意：首先将EBP入栈，然后将栈顶指针ESP赋值给EBP。“MOV EBP ESP”这条指令表面上看是用ESP把EBP原来的值覆盖了，其实不然——因为给EBP赋值之前，原EBP值已被压栈（位于栈顶），而新的EBP又恰恰指向栈顶。
此时EBP寄存器就已处于一个很重要的地位，该寄存器中存储着栈中的一个地址（原EBP入栈后的栈顶），从该地址为基准，向上（栈底方向）能获取返回地址、参数值，向下（栈顶方向）能获取函数局部变量值，而该地址处又存储着上一层函数调用时的EBP值！
一般而言，ss:[ebp+4]处为返回地址，ss:[ebp+8]处为第一个参数值（最后一个入栈的参数值，此处假设其占用4字节内存），ss:[ebp-4]处为第一个局部变量，ss:[ebp]处为上一层EBP值。
由于EBP中的地址处总是“上一层函数调用时的EBP值”，而在每一层函数调用中，都能通过当时的EBP值“向上（栈底方向）能获取返回地址、参数值，向下（栈顶方向）能获取函数局部变量值”。
如此形成递归，直至到达栈底。这就是函数调用栈。
编译器对EBP的使用实在太精妙了。
从当前EBP出发，逐层向上找到任何的EBP是很容易的：
unsigned int _ebp;
__asm _ebp, ebp;
while (not stack bottom)
{
//...
_ebp = *(unsigned int*)_ebp;
}
假如要写一个简单的调试器的话，注意需在被调试进程（而非当前进程——调试器进程）中读取内存数据。

1、

2、首先要认识到这样两个事实：
1、一个函数调用动作可分解为：零到多个PUSH指令（用于参数入栈），一个CALL指令。CALL指令内部其实还暗含了一个将返回地址（即CALL指令下一条指令的地址）压栈的动作。
2、几乎任何本地编译器都会在每个函数体之前插入类似如下指令：PUSH EBP; MOV EBP ESP;
即，在程序执行到一个函数的真正函数体时，已有以下数据顺序入栈：参数，返回地址，EBP。
由此得到类似如下的栈结构（参数入栈顺序跟调用方式有关，这里以C语言默认的CDECL为例）：

3、 ////////////////////////////
注意以下几个事实
1）栈的变化仅当esp的值被改变

4、 2）esp的值得变化仅当
1.1 发生在 push，pop的时候。
1.2 sub esp ，add esp eg:刚进入一个函数时，为了给局部变量分配栈空间

3) push发生在
1）代码中显式的push，pop
2）call指令会让参数入栈调用push，会让返回值入栈，调用push

4） ebp的值发生仅在刚进入一个函数时 push ebp esp

参考原文：http://blog.csdn.net/djbtestingsky/article/details/1884678

参考原文：http://blog.csdn.net/zdl1016/article/details/4139839

参考原文：http://blog.21ic.com/user1/8252/archives/2011/86642.html