Win32逆向学习之C语言for循环实现机理--利用eax寄存器实现累加
环境:Windows xp sp1+vc6++
C语言for循环的使用
编程的时候经常会使用到for循环,那么for循环中最关键的累加是具体怎么实现的呢?一直百思不得其解,这次主要是通过反汇编来看一看for循环中的累加的实现本质,一些简单的使用方法就不再赘述。
1. for语句语法
for(表达式1;表达式2;表达式3)
{
执行语句;
}
2. for语句执行步骤
第一步:执行表达式1,初始化条件 第二步:执行表达式2,表示终止这个循环的条件,条件为真则执行,否则退出。 第三步:执行循环体内的语句。 第四步:执行表达式3。 第五步:执行下轮循环,直到表达式2的结果为假退出循环。
3. 简单的for示例
for (i = 0;i < 5;i++)
{
printf("Hello,World\n");
}
在for循环中,累加实现的地方就是表达式i++,而在程序运行的时候究竟是如何实现的呢? 形成反汇编代码一步一步分析。
4. 示例程序的反汇编代码
为了更为简单地分析i++这个累加的本质实现过程,尽可能地将不相关的代码注释掉,而不形成反汇编代码,这样更利于分析。 将printf语句注释掉形成的反汇编部分代码如下:
28: for(i=0;i<5;i++)
00401028 C7 45 FC 00 00 00 00 mov dword ptr [ebp-4],0
0040102F EB 09 jmp main+2Ah (0040103a)
00401031 8B 45 FC mov eax,dword ptr [ebp-4]
00401034 83 C0 01 add eax,1
00401037 89 45 FC mov dword ptr [ebp-4],eax
0040103A 83 7D FC 05 cmp dword ptr [ebp-4],5
0040103E 7D 02 jge main+32h (00401042)
29: {
30: //printf("Hello World!\n");
31:
32: }
00401040 EB EF jmp main+21h (00401031)
33:
34: return 0;
00401042 33 C0 xor eax,eax
也可以从代码中看出来,for绝对不是一个函数。(因为还是在原函数的栈空间中,并没有新的栈空间)。
5.for循环第一步—执行表达式1:i=0
在for之前已经声明变量i的类型为int了。这里的i=0的对应的汇编代码就是:
mov dword ptr [ebp-4],0
本质就是将立即数0 给栈中的一块内存。
6. 执行for第二步—执行表达:2:i<5
这句对应的汇编就是:
EB 09 jmp main+2Ah (0040103a)
cmp dword ptr [ebp-4],5
其实就是将栈中的数值与立即数5进行比较,满足条件就继续执行,不满足就离开。
7. 执行for第四步—执行表达式3:i++(第三步注释掉了)
这个也是本篇的关键,看for中的i++是如何实现的。 其对应的反汇编是:
00401031 8B 45 FC mov eax,dword ptr [ebp-4]
00401034 83 C0 01 add eax,1
00401037 89 45 FC mov dword ptr [ebp-4],eax
其实现的本质就是将ebp-4的值也就是变量i的值给eax寄存器,寄存器完成加1后再将值给ebp-4,看起来像是ebp-4完成加1一样(也就是i++功能的实现),而利用寄存器可以更好地提升计算的速度,避免了内存和计算单元打交道。 大致就如同下面图中显示的:
8. 总结
其实要探究具体的本质,只要掌握方法还是很简单的,但是中间涉及的像函数调用,堆栈的知识最好能事先了解。for循环中表达式3的实现本质是eax寄存器在进行计算,主要的步骤就是:
1.将初始值给内存ebp-4 就是栈中的局部变量。
2.将ebp-4的值和5进行比较。
3.在条件范围内继续执行相应的动作----这里的就是printf。
4.将ebp-4的值给eax寄存器。
5.eax寄存器加上一步(eax+1)这里一步就是1。
6.再将eax里面加好的值给ebp-4的栈内存,这样完成的加法。
其实这样分析的目的就是更好地了解程序的运行机理,在进行逆向分析的时候看到反汇编的结构里面有诸如ebp-4/ebp-8…的值给eax寄存器-------eax一直加上同样的数-----然后将值给ebp-4/ebp-8…这样的情况的话,那么很有可能这些汇编语句相对应的C语言语句就是for循环。
这里还抛出一个问题,如果for循环里面还嵌套着for或者其他各种循环,那么这样的汇编语句有什么样的特征呢?如果看到这样的反汇编代码,能否还能看出这就是for循环或者别的循环语句呢?如何更扎实练好看汇编就如同看C语言的能力。
|