汇编语言小结

来源:互联网 发布:js illegal character 编辑:程序博客网 时间:2024/05/01 19:05

  • 文章来源: http://www.hacklong.com
  • 原文作者: E言E行黑客龙脉
  • 前言: 写这篇文章出于个人兴趣,要先声明的是本人能力是非常有限!其中参考了许多文章!由于无法提供更多的信息教程,所以文章题目才叫做"给新手引路 之 浓缩汇编基础"。主要讲的是破解中所要的一些汇编知识,方便新手们理解,我将用比较通俗的语言讲述!希望大家别说我"低级" - -b 写此文的理由: 1、出于兴趣 2、助于自己学习巩固,利于新手注: 本文并不教如何编写汇编程序,只想引新手们进Crack大门,一些迟迟无法Crack成功的人也就是这个原因了! 最好是能抛砖引玉了,勾起新手们学习汇编的兴趣! 重要一点是:不懂汇编是完全没办法搞Crack的,希望大家带着这点来学习! ----------------------------------------------------------------------------------------------- 1.0 关于汇编语言汇编语言是创造出来代替原始的只能由处理器理解的二进制代码的,也就是在OD中常见的机器码!用机器码来写程序,可以想象其难度吧,所以汇编语言就出现了,汇编代码是直接描述处理器可以执行的代码,也就是在OD中最常见的反汇编代码了!(当然,有点不一样),而汇编语言是和cpu相关的,和机器语言是一一对应的! 2.0 关于cpu CPU的任务就是执行存放在存储器里的指令序列。为此,除要完成算术逻辑操作外,还需要担负CPU和存储器以及I/O之间的数据传送任务。早期的CPU芯片只包括运算器和控制器两大部分。到了近几年,为了使存储器速度能更好地与运算器的速度相匹配,又在芯片中引入了高速缓冲存储器(知道为什么P4比P4赛扬贵那么多了吧?)。看主要的部件: 1.算术逻辑部件ALU(arithmetic logic unit)用来进行算术和逻辑运算。这部分与我们的关系不太大,我们没必要管它。 2.控制逻辑。同样与我们的关系不大。 3.工作寄存器。意识了吧,寄存器呀!喂,,寄存器呀!~ 3.0 寄存器所要了解的是8个32位的寄存器,分别是eax,ebx,ecx,edx,esp,ebp,edi,esi eax-edx这四个是通用寄存器,虽然各个都有各自的用途,不过你可以用它们来做任何事!是32位的,自然有低位和高位,我们又可以通过ax,bx,cx,dx来访问其低十六位,但高十六位是无法访问的!比如eax=12345678h,那么低十六位ax=5678h!而十六位的自然也有低位和高位,不过高八位是可以访问的,如ax可以分为ah和al,看字面就知道,ah(high)高八位,al就为低八位了!前面的例子,ax=5678h,那么ah=56h,al=78h!这四个寄存器主要是用来暂放计算结果或什么什么的! esp-esi这四个主要是寻址时用来存放偏移或指针,所以,也就称为指针寄存器或变址寄存器了~如在OD中看到的[eax],其实eax中存放的是一个内存地址,而实际要访问的是那个内存地址里的内容! esp(堆栈指针寄存器): 很重要的一个概论,堆栈有着先进后出的特点,就好像有一个圆柱形的筒子,该直径刚好是一个乒乓球的直径,所以最先放进去的球当然会最后出来.而esp呢,永远是指着最顶的那个球的,也就是永远都指向栈顶!在od中也很常见了,比如push和pop就是对栈的操作,push把一个数据压入栈中,也就是把一个球放进去,再去调用push时就再放进一个,而esp则指向第二个放进去的那个球了!使用pop呢就从栈中弹出一个数据,前面说了,堆栈有着先进后出的特点,所以用pop呢就从最后放进去的那个球先出了(除非你破坏筒子(破坏堆栈?那是不可能的,程序马上死给你看))!而esp还是指向栈顶! 取个代码例子: (1) mov ecx, 100<---------100传入ecx (2) mov eax, 200<---------200传入eax (3) push eax <------------ecx先进了 (4) push ecx<-------------再来是eax (5) pop ebx<--------------从栈顶取出一个,也是最后进去的那一个,结果存到ebx (6) pop ecx<--------------从栈顶取出一个,也就是刚刚先进去的那个了,结果存到ecx 最后ebx=200,ecx=100 到了win32的平台下,api大家都知道了吧!api的参数都是靠堆栈来传递的,比如说一个FindWindow,在C里我这样调用 ->::FindWindow(NULL,"a")->而反汇编之后在系统底层反汇编代码就象这个样子: push xxxxxxxx->xxxxxxxx为"a"的内存地址 push yyyyyyyy->yyyyyyyy为空中止字符串的指针 call zzzzzzzz->调用FindWindow 而在call里面先使用pop弹出先前压入栈的参数再使用 ebp(基址指针寄存器): 它称为基址指针寄存器,它们都可以与堆栈段寄存器SS(堆栈段)联用来确定堆栈中的某一存储单元的地址,ESP用来指示段顶的偏移地址,而EBP可作为堆栈区中的一个基地址以便访问堆栈中的信息。 ESI(源变址寄存器)和EDI(目的变址寄存器)一般与数据段寄存器DS联用,用来确定数据段中某一存储单元的地址。这两个变址寄存器有自动增量和自动减量的功能,可以很方便地用于变址。 还有两个专用寄存器,分别是eip和flags flags: 这个是标志寄存器了,存放条件标志码、控制标志和系统标志的寄存器!在od中也见很多了,比如zf(零标志),用cmp比较时,把两个操作数相减,为0就置zf为1,否则zf为0。而jnz就是看zf是否为0,为0就跳!这样说起来似乎更乱了,建议大家去记那些大于就跳,小于就跳的,比较简单(jnz就是不相等就跳)``哦呵呵!!至于其它标志,这里不再阐述了,可以去参看汇编速查! cmp eax,ebx<-比较eax和ebx,两个相减,为0的话zf就为一,否则zf为0 jnz xxxxxxx<-判断zf是否为0,为0就跳到xxxxxxx处,也就是所谓的不相等就跳 eip(指令指针寄存器): 这个很好理解,根据od来说,载入一个程序后,比如代码像这样: 0043C412 >/$ 55 push ebp <-载入后停在这,看寄存器窗口eip这时为43c412 0043C413 |. 8BEC mov ebp, esp <-f8运行一步之后,eip为43c413 0043C415 |. 6A FF push -1 <-eip为43c415 0043C417 |. 68 C8B64800 push 0048B6C8 <-eip为43c417 有人会说"原来eip是指示当前执行到代码处的地址的!" ,这不对!!因为f8运行还没通过那条代码,所以还不算已经执行了,没错,eip指向的就是下一条将要执行的指令的指针! 段寄存器: cs代码段,ds数据段,ss堆栈段,es附加段在Win32编程中段的概念已经不重要了!而在Crack时你总不会是在调是dos时代的程序吧!-! 4.0 常用汇编指令 mov ax,cx <-很常用了,把cx的值送入ax中,cx值保持不变 cmp eax,ecx<-很常见了吧,比较eax和ecx,置标志位!方法前面说过了 xor eax,eax<-看这个,eax与自己异或,是清零的操作! lea eax,str<-并不传送数据,只传送该数据的地址,将str字符串的地址传到eax push eax <-进栈操作,前面说过了,eax进栈 pop ebx <-出栈操作,前面也说了,弹出位于栈顶的数据存入ebx ADD 加法指令 格式:ADD DST,SRC 执行的操作:(DST)<-(SRC)+(DST) SUB 减法指令 格式:SUB DST,SRC 执行的操作:(DST)<-(DST)-(SRC) MUL 无符号乘法指令 格式: MUL SRC 执行的操作:字节操作(AX)<-(AL)*(SRC);字操作(DX,AX)<-(AX)*(SRC);双字操作:(EDX,EAX)<- (EAX)*(SRC) DIV 无符号除法指令 格式:DIV SRC 执行的操作:字节操作:16们被除数在AX中,8位除数为源操作数,结果的8位商在AL中,8位余数在AH中 。表示为: (AL)<-(AX)/(SRC)的商,(AH)<-(AX)/(SRC)的余数。字操作:32位被除数在DX,AX中。其中DX为高位字,16位除数为源操作数,结果的16 位商 在AX中,16位余数在DX中。表示为:(AX)<-(DX,AX)/(SRC)的商,(DX)<-(DX,AX)/(SRC)的余数。 nop <- 无操作,去掉指令用的吧!去掉一个跳转,让程序直接往下走,就到注册成功处啦(扯远了````) call <- 调用子程序或函数用的 关于跳转指令,可以查看汇编速查手册,别强迫自己把所有的都一下记住,浪费精力,不懂时再查一下,久了就记住了! 5.0 高级语言程序的汇编浅解析汇编语言要和硬件直接打交道,写病毒是方便点啦!!而在高级语言中,如C中我们要面向的是问题的解决,对于硬件资源操作,编译器搞定了!在这里稍微讲一下高级语言中与反汇编代码相应的一些地方: 1、定义变量 int a; 一个变量其实是存放在一个内存地址里,如果对a进行赋值"a=10",在反汇编中就有可能表现为: mov word ptr[007e58c2],A 像这个样子,而a所对应的内存地址就是0x007e58c2了,当然是乱写的一个地址而已,系统怎样分配?(天知道...) 2、比如一个数组 char str[]="hello"; 占用了6个字节,最后一个是以0结尾的空字节,数组名可以当做数组的指针!str[0]='h',str[0]相应一个变量地址,比如为[0040e123],那么[0040e124]就为'e',[0040e125]就为'l'....了` 3、指针 char *p; 指针也是一个变量,所以它也对应一个内存地址!但访问时应该是访问其指向的内存地址的内容,而不是这个指针变量的内容,其内容只是一个地址而已!假如该指针变量地址为007e1000,那么语句p=a,这句在高级语言里是让指针p指向a这个内存单元!p里的内容是a的地址,*p实际上是a的内容了!而反汇编有可能表现成这样: mov [007e1000],007e2000<-假如007e2000为变量a的地址,那么就是把a的地址传到007e1000这个内容里了! 4、函数调用 sub(a,b); 假如sub是自定义的一个减法函数,作用为参数一减去参数二,上面语句为在C中调中时传递参数!前面有说过了,Win32平台下函数调用的参数是通过堆栈来传递的,那么反汇编就是: (假如a=2,b=1) mov eax,2 mov ebx,1 push eax push ebx call 取地址(sub) ....... ----------------------------------------------------------------------------------------------- 好了,最后感谢大家能看完这篇了了草草的东西,我也回顾了不少知识!在本人能力范围内的事不知道对新手们有没有帮助,还有一点要提醒各位新手,如果真想学好Crack学通Crack这门知识的话,不完全了解汇编是不行的!所以在看了我这篇之后如果能激起你学汇编的信心是最好的!要不等到Crack遇到什么问题时才再想回过头学汇编,那很难!~

    原创粉丝点击