How to study C && ASM Code(3)

来源：互联网发布：淘宝几单才有2颗心编辑：程序博客网时间：2024/04/26 06:48

Download:
http://www.cisrg.cn/doc/lesson3.rar
                    ==www.cisrg.cn.==

                    How to study C && ASM Code(3)

|=---------------=[ 运算符、表达式的逆向 ]=------------------------=|
|=-----------------------------------------------------------------=|
|=---------------=[ 7all<7all7_at_163.com> ]=----------------------=|
|=-----------------------------------------------------------------=|
|=---------------=[ 版权所有:www.cisrg.cn ]=-----------------------=|

--[ Let's Go
一个C程序由运算符、表达式组成，表达式还包括一些循环语句。C的运算符比较多，
也比较有意思，而且其定义没有C++那般的无耻，所以这可能是有些老道的程序员喜欢
C而不喜欢C++的原因之一。一般来说C的程序都比较的随意，随意的结果就是允许程序
员自己实现更多的东西，这种随意的结果使得很多的代码狂成了C的偏执者。有那么一
段时间，本人徘徊在C、C++、JAVA与C#之间，直到某个月黑人静的晚上，我逆向了C、
C++的代码后就再也没有碰过C++，虽然偶尔也会写MFC的代码，但基本上MFC程序的核心
代码我都试图摆脱MFC的封装类。如果不是人懒惰的原因，我想我会直接拿SDK来写界面
程序的。那个月黑人静的夜晚，是什么原因要我放弃了C++呢？原因是比较简单的，我
发现我拿函数封装实现某个功能的C代码，与用类来实现同样功能的C++代码相比，其汇
编代码相差很大，这里我的意思是说C++逆向后的汇编代码要比C的多了那么十几行，同
样的Release模式编译，实现同样功能的代码居然会相差这么多！虽然现在电脑运行速度
快了很多，很难想象，如果一个超过2W行的代码使用C++书写的话，其汇编代码要比C多
多少？做为一个只有小学文化的程序员，我在考虑的差不多头皮发麻的那一瞬间，毅然
的抛弃了C++:)当然这里仅仅是个人的观点，毕竟C++还有众多的FANS存在，我可不想走
在大街上都被别人扔臭鸡蛋。

--[ 运算符
如果您不知道C的运算符是啥子东东，您可以去论坛的FAQ那个板块提问，如果在那里有
人给您了回答，但是您还是不理解运算符是啥东东，那么您可以给我发封EMail过来，我
会找我身边对C非常熟悉的同事给您一个很专业的答案，如果您在看到我同事的回答后还
是不知道运算符是啥东东，那么您可以选择这样的一条汇编语句，以表达我们对您的崇拜
之情。汇编语句是：
mov eax, 黄河
jmp eax
C的运算符有赋值运算符（=）、算数运算符、其它运算符，我们该小节会简单的说明下
这些运算符，本文的内容也会针对这些运算符进行我们的逆向过程。
A: 赋值运算符
例如: int i = 9;即把整数9赋值给int类型的变量i，这里需要注意的是符号=，不是真正
等于的意思，而是赋值的意思。虽然也可以称呼为等于，但在C里面的标准却是赋值。
B: 算数运算符
+、-、*、/、%、++、--，我们这里直接书写一段C代码来演示下这些运算符，当然后面会
直接拿这个代码进行我们可爱的逆向。
[code]
#include <stdio.h>
#include <stdlib.h>

int main()
{
int i = 9;
int j = 8;
i = i + j;
printf("i+j = %d/n", i);
i = i - j;
printf("i-j = %d/n", i);
i = i * j;
printf("i*j = %d/n", i);
i = i / j;
printf("i/j = %d/n", i);
i = i % j;
printf("i%%j = %d/n", i);
i = i++;
printf("i++ = %d/n", i);
i = i--;
printf("i-- = %d/n", i);
exit(0);
}
[/code]

C: 其它运算符
sizeof是个很有意思的运算符，sizeof以字节为单位返回其操作数的大小，
sizeof、(类型)
[code]
#include <stdio.h>
#include <stdlib.h>

int main()
{
int i = 1;
char *ptr = "abc";
char str[12] = "aaa";
float flt;
ptr = (char *)malloc(8);
printf("sizeof(i) = %d/n", sizeof(i));
printf("sizeof(*ptr) = %d/n", sizeof(ptr));
printf("sizeof(str) = %d/n", sizeof(str));
printf("sizeof(flt) = %d/n", sizeof(flt));
exit(0);
}
[/code]
小节：运算符的概念是很容易理解的，看过C的朋友都知道，这里也就不再加以
累赘的说明。在下面的章节我们会针对这两个代码进行逆向。

--[ 算数运算符的逆向
按照上面的那个算数运算符的例子代码来看，该代码最后打印的结果会是：
i+j = 17
i-j = 9
i*j = 72
i/j = 9
i%j = 1
i++ = 2
i-- = 1
下面我们来剖析下汇编代码是如何完成这个工作的:)下面的代码是关于例子1的
汇编代码实现。
[code]
6:        int i = 9;
//把整数9放到ebp-4的位置，前面的文章曾详细的讲解过这种类型的赋值
0040D798   mov         dword ptr [ebp-4],9
7:        int j = 8;
//把整数8放到ebp-8的位置
0040D79F   mov         dword ptr [ebp-8],8
8:        i = i + j;
/*这里的add指令在汇编里为加法指令*/
0040D7A6   mov         eax,dword ptr [ebp-4]--|->实现了i+j的操作
0040D7A9   add         eax,dword ptr [ebp-8]--|->而后把相加的值
0040D7AC   mov         dword ptr [ebp-4],eax--|->赋值给变量i
9:        printf("i+j = %d/n", i);
0040D7AF   mov         ecx,dword ptr [ebp-4]
0040D7B2   push        ecx
0040D7B3   push        offset string "i+j = %d/n" (00422fe8)
0040D7B8   call        printf (004012c0)
0040D7BD   add         esp,8
10:       i = i - j;
/*这里的sub指令在汇编里为减法指令*/
0040D7C0   mov         edx,dword ptr [ebp-4]--|->实现了i-j的操作
0040D7C3   sub         edx,dword ptr [ebp-8]--|->而后把相减的值
0040D7C6   mov         dword ptr [ebp-4],edx--|->赋值给变量i
11:       printf("i-j = %d/n", i);
0040D7C9   mov         eax,dword ptr [ebp-4]
0040D7CC   push        eax
0040D7CD   push        offset string "i-j = %d/n" (00422fdc)
0040D7D2   call        printf (004012c0)
0040D7D7   add         esp,8
12:       i = i * j;
/*这里的imul指令在汇编里为乘法指令*/
0040D7DA   mov         ecx,dword ptr [ebp-4]-|->实现了i*j的操作
0040D7DD   imul        ecx,dword ptr [ebp-8]-|->而后把相乘的值
0040D7E1   mov         dword ptr [ebp-4],ecx-|->赋值给变量i
13:       printf("i*j = %d/n", i);
0040D7E4   mov         edx,dword ptr [ebp-4]
0040D7E7   push        edx
0040D7E8   push        offset string "i*j = %d/n" (00422fd0)
0040D7ED   call        printf (004012c0)
0040D7F2   add         esp,8
14:       i = i / j;
/*
这里的idiv指令在汇编里为除法指令,可能大家注意到了,在idiv指令前
增加了cdq指令,cdq指令会把EAX寄存器中的符号位扩展到EDX中，可能
大家猜测到这里会做什么了:)
如果这里修改为mov dword ptr [ebp-4],edx。那么就是把进行%运算后
的数值赋值给变量i。不过即使你不去主动的使用cdq指令，Intel的处理
办法也会自动把除法的余数放到edx上。
*/
0040D7F5   mov         eax,dword ptr [ebp-4]-|->实现了i/j的操作
0040D7F8   cdq               -|->而后把相除的值
0040D7F9   idiv        eax,dword ptr [ebp-8]-|->赋值给变量i
0040D7FC   mov         dword ptr [ebp-4],eax-|
15:       printf("i/j = %d/n", i);
0040D7FF   mov         eax,dword ptr [ebp-4]
0040D802   push        eax
0040D803   push        offset string "i/j = %d/n" (00422040)
0040D808   call        printf (004012c0)
0040D80D   add         esp,8
16:       i = i % j;
/*
正如前面我们猜测的结果，cdq指令会把eax的有符号位扩展到edx上，
此时对变量i的赋值已经不是 mov [ebp-4],eax，而是mov [ebp-4],edx
此时被扩展到edx上的值就是取模后的数值:)
*/
0040D810   mov         eax,dword ptr [ebp-4]-|->实现了i%j的操作
0040D813   cdq               -|->而后把取模的值
0040D814   idiv        eax,dword ptr [ebp-8]-|->赋值给变量i
0040D817   mov         dword ptr [ebp-4],edx-|->
17:       printf("i%%j = %d/n", i);
0040D81A   mov         ecx,dword ptr [ebp-4]
0040D81D   push        ecx
0040D81E   push        offset string "i%%j = %d/n" (00422034)
0040D823   call        printf (004012c0)
0040D828   add         esp,8
18:       i = i++;
/*
i++ = i + 1;所以这里会采取add eax,1，其它与上面我们的解释一致。
*/
0040D82B   mov         edx,dword ptr [ebp-4]
0040D82E   mov         dword ptr [ebp-4],edx
0040D831   mov         eax,dword ptr [ebp-4]
0040D834   add         eax,1
0040D837   mov         dword ptr [ebp-4],eax
19:       printf("i++ = %d/n", i);
0040D83A   mov         ecx,dword ptr [ebp-4]
0040D83D   push        ecx
0040D83E   push        offset string "i++ = %d/n" (00422028)
0040D843   call        printf (004012c0)
0040D848   add         esp,8
20:       i = i--;
/*
i-- = i - 1;所以这里会采取sub eax,1，其它与上面我们的解释一致。
*/
0040D84B   mov         edx,dword ptr [ebp-4]
0040D84E   mov         dword ptr [ebp-4],edx
0040D851   mov         eax,dword ptr [ebp-4]
0040D854   sub         eax,1
0040D857   mov         dword ptr [ebp-4],eax
21:       printf("i-- = %d/n", i);
0040D85A   mov         ecx,dword ptr [ebp-4]
0040D85D   push        ecx
0040D85E   push        offset string "i-- = %d/n" (0042201c)
0040D863   call        printf (004012c0)
0040D868   add         esp,8
22:       exit(0);
0040D86B   push        0
0040D86D   call        exit (00401130)
23:   }
[/code]
通过上面我们对汇编语言的理解，我们基本上可以把这个代码从C代码转换为
汇编代码了。至于怎么详细的实现了这个转换过程，这里就不再累赘了，前面
的文章比较详细的说明了整个的逆向流程。
汇编代码实现的与C代码相同的程序:)
[code]
#include <stdio.h>
#include <stdlib.h>

int main()
{
int i = 9;
int j = 8;
printf("i = 9/nj = 8/nStart.../n/n");

/*实现i+j的汇编代码*/
__asm{
  mov eax,i;
  add eax,j;
  mov i,eax;
}
printf("i+j = %d/n", i);

/*实现i-j的汇编代码*/
__asm{
  mov eax,i;
  sub eax,j;
  mov i,eax;
}
printf("i-j = %d/n", i);

/*实现i*j的汇编代码*/
__asm{
  mov eax,i;
  imul eax,j;
  mov i,eax;
}
printf("i*j = %d/n", i);

/*实现i/j的汇编代码*/
/*__asm{
  xor edx,edx;//该段代码使用了div指令完成,其用法与idiv类似.
  mov eax,i; //至于为什么需要xor edx,edx呢?那是因为被除数达到了双精度值
  mov ecx,j; //所以不能用符号扩展，而只能将高16位送0
  div ecx;
  mov i,eax;
}*/
/*
大家仔细观察下这里的汇编代码与上面反编译的汇编代码有啥区别？
上面的指令为idiv eax,dword ptr [ebp-8]，而实际情况是idiv这个指令，
在Intel的声明中只支持一个操作数而已，令人头疼的问题，但这里也不可能
是伪指令，如果是的话，按照常理编译器应该认识我的语法...
可怜的程序员又被MS给爽了一把，窃喜ing...
*/
__asm{
  xor edx,edx;
  mov eax,i;
  mov ecx,j
  //cdq;
  idiv ecx;
  mov i,eax;
}
printf("i/j = %d/n", i);

/*实现i%j的汇编代码*/
__asm{
  xor edx,edx;
  mov eax,i;
  mov ebx,j;
  //cdq;
  idiv ebx;
  mov i,edx;
}
printf("i%%j = %d/n", i);

/*实现i++的汇编代码*/
__asm{
  mov eax,i;
  add eax,0x01;
  mov i,eax;
}
printf("i++ = %d/n", i);

/*实现i--的汇编代码*/
//请自行书写，当家庭作业吧:)

exit(0);
}
[/code]

--[ 其它运算符的逆向
可爱的sizeof是我们的第一个选择，写代码写多了，于是遇到了这样的一个
问题，关于把变量置空的问题。我一般置空的办法为:
char str[12];
memset(&str, 0, sizeof(&str));这样的情况下数组一般可以被我置空，但是
那天同事突然感觉我这种置空的办法很不可思议，于是认真的考虑了下这个问题。
同事当时给了我另外一种memset置空的方法，搞的我也是莫名其妙......，今天
算是把这个问题给彻底的搞定了:)不过不知道自己这么想到底对还是不对?
memset函数原型
函数名: memset
功能: 设置s中的所有字节为ch, s数组的大小由n给定
用法: void *memset(void *s, char ch, unsigned n);
首先，sizeof(&str)的值肯定是12个字节的，虽然我这里使用了取地址，但是
取来取去还是str所指向的内存空间，道理还是相同的。
其次，调用memset函数时，会把&str的内存空间置空，但仔细考虑下的话，str
取地址的话，不正与&str是相同的嘛？
最后，证明我的这边办法是可行的。不过，也得出一个结论，不是学计算机专业
难免会存在很多的弊端。

为了更好的书写这里的代码，我把上面的代码简单的修改了下，修改后的C
代码为：
[code]
int main()
{
printf("sizeof(int) = %d/n", sizeof(int));
printf("sizeof(char *) = %d/n", sizeof(char *));
printf("sizeof(char) = %d/n", sizeof(char));
printf("sizeof(float) = %d/n", sizeof(float));
exit(0);
}
[/code]
得到的汇编代码为:
[code]
6:        printf("sizeof(int) = %d/n", sizeof(int));
0040D708   push        4 //sizeof直接返回了int类型的长度
0040D70A   push        offset string "sizeof(i) = %d/n" (00423004)
0040D70F   call        printf (00401230)
0040D714   add         esp,8
7:        printf("sizeof(char *) = %d/n", sizeof(char *));
0040D717   push        4 //sizeof直接返回了char *类型的长度
0040D719   push        offset string "sizeof(*ptr) = %d/n" (00422fcc)
0040D71E   call        printf (00401230)
0040D723   add         esp,8
8:        printf("sizeof(char) = %d/n", sizeof(char));
0040D726   push        1 //sizeof直接返回了char类型的长度
0040D728   push        offset string "sizeof(str) = %d/n" (00422fb8)
0040D72D   call        printf (00401230)
0040D732   add         esp,8
9:        printf("sizeof(float) = %d/n", sizeof(float));
0040D735   push        4 //sizeof直接返回了float类型的长度
0040D737   push        offset string "sizeof(flt) = %d/n" (0042201c)
0040D73C   call        printf (00401230)
0040D741   add         esp,8
10:       exit(0);
0040D744   push        0
0040D746   call        exit (004010a0)
[/code]
因此，我们没有必要去逆向sizeof到底做了啥事情，他只是处理了返回的字节大小。
但在实际编程中，sizeof却是如此的重要，极少的C代码会不使用sizeof。当然也有人
会说自己写C就没有使用过sizeof，那样的话，的确得好好的佩服一下了。

--] 总结
运算符、表达式多么美好的组合，有了这些就可以象码砖一样的建个大楼出来，
不过在你学会了这些的同时，你已经朝程序员的旅程迈进了一步了。对了，不要
以为别人喊你是程序员你就开心的不得了，那其实是在骂你而已:)，最起码国内
的程序员是这样的。