gcc编译过程概述

来源：互联网发布：万卓环球知乎编辑：程序博客网时间：2024/05/21 09:19

当我们进行编译的时候,要使用一系列的工具,我们称之为工具链.其中包括:预处理器CPP,编译器前端gcc/g++,汇编器as,连接器ld.一个编译过程包括下面几个阶段： (1)预处理。预处理器CPP将对源文件中的宏进行展开。 (2)编译。gcc将c文件编译成汇编文件。 (3)汇编。as将汇编文件编译成机器码。 (4)连接。ld将目标文件和外部符号进行连接，得到一个可执行二进制文件。下面以一个很简单的test.c来探讨这个过程。 #defineNUMBER(1+2) int main() { int x = NUMBER; return 0; } (1)预处理： gcc会首先调用CPP进行预处理：CPP test.c > test.i 预处理的输出为文件test.i。我们用cat test.i查看test.i的内容如下： int main() { int x = (1+2); return 0; } 我们可以看到，文件中宏定义NUMBER出现的位置被(1+2)替换掉了，其它的内容保持不变。 (2)gcc将c文件编译成汇编文件。接下来gcc会执行gcc -S test.i得到的输出文件为test.s. (3)as将汇编文件编译成机器码。 as test.s -o test.o 得到输出文件为test.o. test.o中为目标机器上的二进制文件. 用nm查看文件中的符号：nm test.o 输出如下： 00000000 b .bss 00000000 d .data 00000000 t .text U ___main U __alloca 00000000 T _main 既然已经是二进制目标文件了，能不能执行呢？试一下./test.o,提示cannot execute binaryfile. 原来___main前面的U表示这个符号的地址还没有定下来，T表示这个符号属于代码段。ld连接的时候会为这些带U的符号确定地址。 (4)连接。连接需要指定库的位置。通常程序中会有很多的外部符号，因此需要指定的位置就会很多。不过，我们之需要调用gcc即可，ld会自己去找这些库的位置。 gcc test.o > test 就得到了最终的可执行程序了。