堆栈平衡:估计这是最详细的讲解堆栈平衡的了 vc++6.0

来源:互联网 发布:思迅软件破解版 编辑:程序博客网 时间:2024/05/15 18:51
#include <stdio.h>#include <stdlib.h>#include <string.h>#include <windows.h>int ShowEsp(int* arg1,int* arg2);/*引言 各种面试宝典上都会说 又说栈在进程空间的高地址部分,向下扩展; 堆在进程空间的低地址部分,堆向上扩展来验证一下是否正如所说这些变量在内存中如何分布?*/int main(){//0)int i=0xABCDABCD;//int* j = (int*)malloc(sizeof(int)); //malloc为什么被我注掉了?//memcpy(j,&i,sizeof(int));int* k = (int*)VirtualAlloc(NULL,sizeof(int),MEM_COMMIT,PAGE_READWRITE);int* ptr = NULL;ptr = (int*)&i;//ptr = j; /*malloc 是crt运行库实现 系统为crt库在进程靠近2G的高地址处保留大块堆内存 用链表管理 调用malloc时,单独从此处抽取分配给调用者*/ptr = k;//1) 忽略malloc这另类 看看实际系统定义诺干栈变量后,查看他们在内存中的分布int arg1=0x40302010;int arg2=0x20;int* ptr1=NULL;int* ptr2=NULL;char str[] = {"1234567"};printf("arg1:%x\narg2:%x\n",&arg1,&arg2);printf("ptr1:%x\nptr2:%x\n",&ptr1,&ptr2);printf("str:%x\n",str);//结论:变量的地址是连续并且向下扩展//编译器通过sub esp,immd来开辟栈空间//再来看下变量地址存放的内容 arg1char* arg1Ptr = (char*)&arg1;printf("arg1Ptr[0]:%02x\narg1Ptr[1]:%02x\narg1Ptr[2]:%02x\narg1Ptr[3]:%02x\n",*arg1Ptr,*(arg1Ptr+1),*(arg1Ptr+2),*(arg1Ptr+3));//程序没问题吧,感觉在用arg1Ptr取arg1各个字节的内容,看下arg1在内存中的分布//.........................................................................//intel cpu小端机 (题外话 网络编程时 ip/port转换即为大小端字节转换) 数据在内存中按高高低低分布 高字节 在高位 低字节在低位//2) 知道了变量在内存中的分布 再看下如何存取变量,alt-8//arg1 = 0x80706050;arg2 = arg1;arg2 = 0x20;//程序编译后 用[ebp-N]相对偏移取变量 why? //intel CPU用esp指向当前函数栈顶,变量又保存在栈中,理所当然的可以用esp取变量。//但是变量在不断扩充esp在不断减小 ------//假设 现在要取arg1变量值 可能会编译成 mov eax,[esp+0x40],意思是arg1离栈顶esp相差0x40个字节//如果程序又新定义一个栈变量,栈顶向下移动,即esp=esp-4 此时 esp离arg1的距离为0x44 //如果再次取arg1的值 会编译成 mov eax,[esp+0x44] 这样编译起来太麻烦了  //a) intel CPU用ebp做当前函数帧[不是强制约定 习惯],也就是栈底,某些面试宝典会写//函数栈底不改变,说的就是ebp再当前函数中不改变。栈变量编译后内存位置固定下来,现在ebp又是固定不变的准绳//这样无论程序怎样扩展栈变量,ebp到各个变量之间的距离都不会改变//3) 面试宝典还说 c++参数入栈顺序是 从右往左压栈 全部入完后 压入函数返回地址//既然 大家对堆栈达成共识才看到这了 再来看下调用函数,继续反汇编 观察堆栈变化ShowEsp(&arg1,&arg2);//a)入栈操作 (esp寄存器的变化) 用的是push 每次push后esp减4 压入返回地址后 jmp到ShowEsp//程序jmp到ShowEsp 这里也跟到esp//5) 堆栈平衡的收尾/*来看下函数返回后当前栈顶还剩啥指令执行顺序-|esp变化------|保存ebp后变量相对于新栈帧ebp的距离-------push &arg2   |1次esp=esp-4 | ebp+0x0Cpush &arg1   |2次esp=esp-4 | ebp+0x08*//*函数参数已经显得不重要了可以忽略不计,再说main函数中依然可以通过[ebp-N]的形式访问这些变量但是目前堆栈还没有恢复到函数调用前的样子 还倒欠main函数8个字节,于是编译器采用了一种简单粗暴却有行之有效的办法add esp,0x08于是堆栈平衡还有一个问题,函数范围值在哪?eax中eax 4字节 不管返回什么都没问题*/exit(0);}int ShowEsp(int* arg1,int* arg2){//进入到ShowEsp后 先是取形参,然后赋值给局部变量//局部变量访问 已经不是这里的重点 此处重点看下如何取形参int op1,op2,res;//atl-8op1 = *arg1;op2 = *arg2;/*访问arg1 arg2 被翻译成mov eax,[ebp+8],[ebp+0x0c]之前访问变量是用[ebp-N]的形式 现在怎么变成使用[ebp+N]的形式?解释这个 还是得看反汇编的结果反汇编的前几句如下push ebpmov ebp,espsub esp,4Ch上面2-a)处写到过 intel CPU用ebp做当前函数帧,刚才指令流是在main函数中,因此ebp是基于main函数的现在进入到ShowEsp函数中,要形成新的函数帧,因此先用push ebp把前一个函数的函数帧保存起来,然后mov ebp,esp把当前的栈顶esp赋值给ebp形成新的函数帧 最后的sub esp,4Ch 为本函数创建栈空间如果把之前main函数中的函数调用和参数入栈 以及此处生成新的函数帧一系列动作联合起来 并查看esp在此期间的变化:指令执行顺序-|esp变化------|保存ebp后变量相对于新栈帧ebp的距离-------push &arg2   |1次esp=esp-4 | ebp+0x0Cpush &arg1   |2次esp=esp-4 | ebp+0x08call ShowEsp |3次esp=esp-4 | ebp+0x04push ebp     |4次esp=esp-4 | ebp+0x00这应该能解释函数取形参用mov eax,[ebp+0x08]等形式*/res = op1+op2;//4)堆栈平衡的下半段/*还是拿某宝典说事,说c++是_stdcall c是_cdcel call区别是函数执行结束 一个由被调用的函数恢复堆栈 另一个是由调用者恢复堆栈这代码是_cdcel call 由调用者恢复堆栈来看下这函数怎么恢复堆栈 继续返回编*/return res;/*程序结尾处看到mov esp ebppop ebpret 8还记得函数入口处的?push ebpmov ebp esp都说是堆栈操作了,所有的操作要呼应对吧,执行了mov esp ebppop ebp这两句之后,函数堆栈恢复到发生调用ShowEsp的情景,虽然ShowEsp分配的栈变量还存在,但已经处在esp指向的范围之外,换句话说,此时再新建栈变量,以前栈上的变量就会覆盖。当然很少有人这么做。这也是有时候函数返回了,还能得到函数内部变量的原因。注意,所谓的宝典会说,函数返回会自动清栈变量,反正c的代码,我没看到这种语句最后的ret语句会使程序返回到函数调用的地方,这个地方由谁指定?还记得3-a)处调用ShowEsp时,把下一条指令压入堆栈?就是那个时候指定函数返回地址,翻阅intel手册说发生ret时,返回到当前栈顶指向的值来看下当前栈顶还剩啥指令执行顺序-|esp变化------|保存ebp后变量相对于新栈帧ebp的距离-------push &arg2   |1次esp=esp-4 | ebp+0x0Cpush &arg1   |2次esp=esp-4 | ebp+0x08call ShowEsp |3次esp=esp-4 | ebp+0x04栈顶还剩call ShowEsp时压入的返回地址,ret执行后 相当于pop eax, jmp eax 弹出一个栈值。于是我们乘坐这个传送门返回到main函数中[题外话]如果修改这个返回地址会得到意想不到的结果,这是后面要讲的缓冲区溢出*/}//文章结尾感谢同事yj同志 帮我做义务审校,并提出修改建议
本文源于公司内部交流 要涉及到溢出,因此有了这篇堆栈平衡的文章
0 0
原创粉丝点击