GCC编译的四个阶段

来源:互联网 发布:linux中可执行文件 编辑:程序博客网 时间:2024/04/27 21:13

gcc编译流程分为4个步骤,分别为:

  1. 预处理(Pre-Processing)
  2. 编译(compiling)
  3. 汇编(Assembling)
  4. 链接(Linking)

下面就具体查看gcc是如何完成这四个步骤的。
helloworld.c的源代码
#include <stdio.h>int main() {printf("hello world!\n");return 0;}
(1)预处理阶段
在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用gcc的选项“-E”进行查看,该选项的作用是把源代码进行预处理。
预处理器根据以字符#开头的命令(directives),修改原始的C程序。如helloworld.c中的#include <stdio.h>指令告诉预处理器读系统头文件stdio.h的内容,并把它直接插入到程序文本中去。结果得到一个C程序,通常是以.i作为文件扩展名的。
注意:gcc指令的一般格式为:gcc [选项] 要编译的文件 [选项] [目标文件]。其中,目标文件可缺省,gcc默认生成的可执行文件名为:编译文件.out
gcc -E helloworld.c -o helloworld.i
选项“-o”是指目标文件,“-i”文件为已经过预处理的C原始程序。以下列出了helloworld.i文件的部分内容:
 wint_t __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) fgetwchar (void); wint_t __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) fputwchar (wint_t); int __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) getw (FILE*); int __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) putw (int, FILE*);# 2 "helloworld.c" 2int main() { printf("hello world!\n"); return 0;}
由此可见,gcc确实进行了预处理,它把“stdio.h”的内容插入到helloworld.c文件中了。
(2)编译阶段
接下来进行的是编译阶段,在这个阶段中,gcc首先要检查代码的规范性、是否有语法错误等,以确定代码实际要做的工作,在检查无误后,gcc把代码编译成汇编代码。用户可以使用“-S”选项来进行查看,该选项生成汇编代码。汇编语言是非常有用的,它为不同高级语言不同编译器提供了通用语言。如:C编译器和Fortran编译器产生的输出文件都是一样的汇编语言。
gcc -S helloworld.i -o helloworld.s
以下列出了helloworld.s的内容,可见gcc已经将其转化为汇编了。感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。
.file"helloworld.c".def___main;.scl2;.type32;.endef.section .rdata,"dr"LC0:.ascii "hello world!\0".text.globl_main.def_main;.scl2;.type32;.endef_main:LFB6:.cfi_startprocpushl%ebp.cfi_def_cfa_offset 8.cfi_offset 5, -8movl%esp, %ebp.cfi_def_cfa_register 5andl$-16, %espsubl$16, %espcall___mainmovl$LC0, (%esp)call_putsmovl$0, %eaxleave.cfi_restore 5.cfi_def_cfa 4, 4ret.cfi_endprocLFE6:.def_puts;.scl2;.type32;.endef
(3)汇编阶段
汇编阶段是把编译阶段生成的“.s”文件转化成目标文件,读者可以使用选项“-c”把汇编代码转化为“.o”的二进制目标代码了。如下所示:
gcc -c helloworld.s -o helloworld.o
(3)链接阶段
在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。
读者可以重新查看这个小程序,在这个程序中并没有定义“printf”的函数实现,且在预编译中包含进去的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么是在哪里实现的“printf”函数的呢?答案是:系统把这些函数实现都做到了名为libc.so.6的库文件中去了,在没有特别指定时,gcc会到系统默认的搜索路径“/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数“printf”了,而这也就是链接的作用。
函数库一般分为静态库和动态库两种。静态库是指在编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不需要库文件了,其后缀一般为“.a”。动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时链接文件加载库,这样就可以节省系统的开销,动态库一般后缀名为“.so”,如前面所述的libc.so.6就是动态库。gcc在编译时默认使用动态库。
完成了链接之后,gcc就可以生成可执行文件了,如下所示:
gcc helloworld.o -o helloworld
运行该可执行文件,出现正确结果
./helloworld
hello world!










0 0