函数调用栈

来源:互联网 发布:linux find mmin 编辑:程序博客网 时间:2024/05/20 18:18


首先引入几个寄存器:

EIPEBPESP都是系统的寄存器,里面存的都是些地址。

为什么要说这三个指针,是因为我们系统中栈的实现上离不开他们三个。

我们DC上讲过栈的数据结构,主要有以下特点:

后进先处。(这个强调过多)

其实它还有以下两个作用:

1.栈是用来存储临时变量,函数传递的中间结果。

2.操作系统维护的,对于程序员是透明的。

我们可能只强调了它的后进先出的特点,至于栈实现的原理,没怎么讲?下面我们就通过一个小例子说说栈的原理。

先写个小程序:

void fun(void)

{

printf("hello world")

}

void main(void)

{

fun()

printf("函数调用结束");

}

这是一个再简单不过的函数调用的例子了。

当程序进行函数调用的时候,我们经常说的是先将函数压栈,当函数调用结束后,再出栈。这一切的工作都是系统帮我们自动完成的。

但在完成的过程中,系统会用到下面三种寄存器:

1.EIP       Extended Instructions Pointer 指令寄存器

2.ESP    Extended Stack Pointer栈指针寄存器

3.EBP     Extended (Stack) Base Pointer 栈基指针寄存器

当调用fun函数开始时,三者的作用。

1.EIP寄存器里存储的是CPU下次要执行的指令的地址。

也就是调用完fun函数后,让CPU知道应该执行main函数中的printf"函数调用结束")语句了。

2.EBP寄存器里存储的是是栈的栈底指针,通常叫栈基址,这个是一开始进行fun()函数调用之前,由ESP传递给EBP的。(在函数调用前你可以这么理解:ESP存储的是栈顶地址,也是栈底地址。)

3.ESP寄存器里存储的是在调用函数fun()之后,栈的栈顶。并且始终指向栈顶。

当调用fun函数结束后,三者的作用:

1.系统根据EIP寄存器里存储的地址,CPU就能够知道函数调用完,下一步应该做什么,也就是应该执行main函数中的printf函数调用结束)。

2.EBP寄存器存储的是栈底地址,而这个地址是由ESP在函数调用前传递给EBP的。等到调用结束,EBP会把其地址再次传回给ESP。所以ESP又一次指向了函数调用结束后,栈顶的地址。

其实我们对这个只需要知道三个指针是什么就可以,可能对我们以后学习栈溢出的问题以及看栈这方面的书籍有些帮助。当有人再给你说EIP,ESP,EBP的时候,你不能一头雾水,那你水平就显得洼了许多。其实不知道我们照样可以编程,因为我们是C级别的程序员,而不是ASM级别的程序员。

 

函数调用栈:

理解调用栈最重要的两点是:栈的结构,EBP寄存器的作用。

右侧的红色部分,写出了引发栈结构变化的对应的指令
+| (
栈底方向,高位地址) |
| ....................|
| ....................|
// call somefun(...)-->修改esp,栈向下增长,参数入栈,返回值入栈
|
参数3 |
|
参数2 |
|
参数1 |
|
返回地址|
-|
上一层[EBP] |// push ebp --->修改esp,栈向下增长

| 局部变量1 | // sub esp局部变量占用空间 -->修改esp,栈向下增长

| 局部变量2 |

|.....................|

补充:栈一直随着函数调用的深入,一直想栈顶方向压下去。每次调用函数时候,先压函数参数(从右往左顺序压),再压入函数调用下条指令的地址(由call完成)。接着进入调用函数体中先执行PUSH EBP; MOV EBP ESP;(一般已经由编译器加入到函数头中了),接着就是吧函数体中的局部变量压入栈中。再遇到函数的调用的嵌套则依此类推。(added by smsong

“PUSH EBP”“MOV EBP ESP”
这两条指令实在大有深意:首先将EBP入栈,然后将栈顶指针ESP赋值给EBP“MOV EBP ESP”这条指令表面上看是用ESPEBP原来的值覆盖了,其实不然——因为给EBP赋值之前,原EBP值已被压栈(位于栈顶),而新的EBP又恰恰指向栈顶。
此时EBP寄存器就已处于一个很重要的地位,该寄存器中存储着栈中的一个地址(原EBP入栈后的栈顶),从该地址为基准,向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址处又存储着上一层函数调用时的EBP值!
一般而言,ss:[ebp+4]处为返回地址,ss:[ebp+8]处为第一个参数值(最后一个入栈的参数值,此处假设其占用4字节内存),ss:[ebp-4]处为第一个局部变量,ss:[ebp]处为上一层EBP值。
由于EBP中的地址处总是上一层函数调用时的EBP,而在每一层函数调用中,都能通过当时的EBP向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值
如此形成递归,直至到达栈底。这就是函数调用栈。
编译器对EBP的使用实在太精妙了。
从当前EBP出发,逐层向上找到任何的EBP是很容易的:
unsigned int _ebp;
__asm _ebp, ebp;
while (not stack bottom)
{
//...
_ebp = *(unsigned int*)_ebp;
}
假如要写一个简单的调试器的话,注意需在被调试进程(而非当前进程——调试器进程)中读取内存数据。

1、  

2、 首先要认识到这样两个事实:
1
、一个函数调用动作可分解为:零到多个PUSH指令(用于参数入栈),一个CALL指令。CALL指令内部其实还暗含了一个将返回地址(即CALL指令下一条指令的地址)压栈的动作。
2
、几乎任何本地编译器都会在每个函数体之前插入类似如下指令:PUSH EBP; MOV EBP ESP;
即,在程序执行到一个函数的真正函数体时,已有以下数据顺序入栈:参数,返回地址,EBP
由此得到类似如下的栈结构(参数入栈顺序跟调用方式有关,这里以C语言默认的CDECL为例):

3、 ////////////////////////////
注意以下几个事实
1
栈的变化仅当esp的值被改变

4、 2esp的值得变化仅当
1.1
发生在 pushpop的时候。
1.2 sub esp
add esp eg:刚进入一个函数时,为了给局部变量分配栈空间

3) push
发生在
1
)代码中显式的pushpop
2
call指令会让参数入栈调用push,会让返回值入栈,调用push

4
ebp的值发生仅在刚进入一个函数时 push ebp esp

 

 

 

 

参考原文:http://blog.csdn.net/djbtestingsky/article/details/1884678

参考原文:http://blog.csdn.net/zdl1016/article/details/4139839

参考原文:http://blog.21ic.com/user1/8252/archives/2011/86642.html


原创粉丝点击