gcc编译器家族

来源:互联网 发布:大数据产业链包括 编辑:程序博客网 时间:2024/04/30 13:55

转自开源社区:http://www.oschina.net/question/565065_113341

一、GCC简介

The GNU Compiler Collection,通常简称 GCC,是一套由 GNU 开发的编译器集,为什么是编辑器集而不是编译器呢?那是因为它不仅支持 C 语言编译,还支持 C++, Ada,Objective C 等许多语言。另外 GCC 对硬件平台的支持,可以所无所不在,它不仅支持 X86处理器架构, 还支持 ARM, Motorola 68000, Motorola 8800,AtmelAVR,MIPS 等处理器架构。

二、GCC的组成结构

GCC 内部结构主要由 Binutils、gcc-core、Glibc 等软件包组成。

  1. Binutils:它是一组开发工具,包括连接器,汇编器和其他用于目标文件和档案的工具。关于 Binutils 的介绍可以参考 Binutils 简单介绍。这个软件包依赖于不同的目标机的平台。因为不同目标机的指令集是不一样的,比如 arm 跟 x86 就不一样。
  2. gcc-core:顾明之意是 GCC 的核心部分,这部分是只包含 c 的编译器及公共部分,而对其他语言(C++、Ada 等)的支持包需要另外安装,这也是 GCC 为何如此强大的重要原因 。gcc-core依赖于 Binutils。
  3. Glibc:包含了主要的 c 库,这个库提供了基本的例程,用于分配内存,搜索目录,读写文件,字符串处理等等。kernel 和 bootloader不需要这个库的支持。

举例描述下上面 3 个包是如何进行运作的。有一个 c 源文件 test.c 源码如下:

<span style="font-size:18px;">#include<stdio.h>int main(int argc, char *argv[]){printf("Hello Linux!!\n");return 0;}</span>

编译命令为: gcc -o test test.c 编译生成 test 可执行文件。

gcc 编译流程分为四个步骤:预处理、编译 、汇编、链接。

个人认为预处理和编译主要由 gcc-core 来完成,汇编和链接主要由 Binutils 来完成。

        那么何时用到 glibc 呢?

        看到源码中的 printf 函数没有,这个函数在 GCC 中是以库函数的形式存在,这个库函数在 glibc 库中,

在 stdio.h 头文件中被声明。总的来说,如果真正了解了上面 3 个软件包的作用,自然就明白 GCC 是如何工作的。



补充:gcc执行过程

       虽然我们称GCC是C语言的编译器,但使用gcc由C语言源代码文件生成可执行文件的过程不仅仅是编译的过程,而是要经历四个相互关联的步骤∶预处理(也称预编译,Preprocessing)、编译(Compilation)、汇编(Assembly)和链接(Linking)。
      命令gcc首先调用cpp进行预处理,在预处理过程中,对源代码文件中的文件包含(include)、预编译语句(如宏定义define等)进行分析。接着调用cc1进行编译,这个阶段根据输入文件生成以.i为后缀的目标文件。汇编过程是针对汇编语言的步骤,调用as进行工作,一般来讲,.S为后缀的汇编语言源代码文件和汇编、.s为后缀的汇编语言文件经过预编译和汇编之后都生成以.o为后缀的目标文件。当所有的目标文件都生成之后,gcc就调用ld来完成最后的关键性工作,这个阶段就是连接。在连接阶段,所有的目标文件被安排在可执行程序中的恰当的位置,同时,该程序所调用到的库函数也从各自所在的档案库中连到合适的地方。
示例代码#include<stdio.h> int main(void){    printf("hello\n");    return 0;}
  • 1.预编译过程:这个过程处理宏定义和include,并做语法检查。可以看到预编译后,代码从6行扩展到了910行。
gcc -E a.c -o a.icat a.c|wc -l5cat a.i|wc -l910

  • 2.编译过程:这个阶段,生成汇编代码。

gcc -S a.i -o a.scat a.s|wc-l59

  • 3.汇编过程:这个阶段,生成目标代码。此过程生成ELF格式的目标代码。

gcc -c a.s -o a.ofile a.oa.o:ELF64-bitLSBrelocatable,AMDx86-64,version1(SYSV),notstripped

  • 4.链接过程:链接过程。生成可执行代码。链接分为两种,一种是静态链接,另外一种是动态链接。使用静态链接的好处是,依赖的动态链接库较少,对动态链接库的版本不会很敏感,具有较好的兼容性;缺点是生成的程序比较大。使用动态链接的好处是,生成的程序比较小,占用较少的内存。

gcc a.o -o a

程序运行:./ahello

三、交叉编译

交叉编译(或交叉建立)是这样一种过程,它在一种机器结构下编译的软件将在另一种完全不同的机器结构下执行。

一个常见的例子是在 PC 机上为运行在基于 ARM、PowerPC或 MIPS 的目标机的编译软件。幸运的是,GCC 使得这一过程所面临的困难要比听起来小得多。

GCC 中的一般工具通常都是通过在命令行上调用命令(如 gcc)来执行的。在使用交叉编译的情况下,这些工具将根据它编译的目标而命名。

例如,要使用交叉工具链为 ARM 机器编译简单的 Hello World 程序,你可以运行如下所示的命令:使用如下命令编译并测试这个代码: arm-linux-gcc -o hello hello.c。

四、arm-linux-gcc

arm-linux-gcc 是基于 ARM 目标机的交叉编译软件, arm-linux-gcc 跟 GCC 所需的安装包不同,但仅仅是名字不同而已,这是为什么呢?

x86 跟 ARM 所使用的指令集是不一样的,所以所需要的 binutils 肯定不一样;上面提到过 gcc-core 是依赖于 binutils 的,自然 ARM 跟 x86 所使用的 gcc-core 包也不一样;

glibc 一个 c 库,最终是以库的形式存在于编译器中,自然 ARM 所使用的 glibc 库跟 x86 同样也不一样,其它的依此类推。

五、arm-elf-gcc

arm-elf-gcc 跟 arm-linux-gcc 一样,也是是基于 ARM 目标机的交叉编译软件。

但是它们不是同一个交叉编译软件,两者是有区别的,两者区别主要在于使用不同的 C 库文件。

arm-linux-gcc 使用 GNU 的 Glibc,而 arm-elf-gcc 一般使用 uClibc/uC-libc 或者使用 RedHat专门为嵌入式系统的开发的C库newlib。

只是所应用的领域不同而已,Glibc是针对PC开发的,uClibc/uC-libc是与Glibc API兼容的小型化C语言库,实现了Glibc部分功能。

六、uClibc/uC-libc 

1.uClinux 有两个经常使用的libc库:uC-libc 和 uClibc。虽然两者名字很相似,其实有差别,下面就简单的介绍一下二者的不同之处。


(1).uC -libc是最早为uClinux开发的库,是Jeff Dionne和Kenneth Albanowski为在EKLs项目中支持m68000在Linux-8086 C库源码上移植的。

uC-libc是一个完全的libc实现,但其中有一些api是非标准的,有些libc的标准也没有实现。

uC-libc稳定地支持 m68000,ColdFire和没有MMU的ARM。

其主要设计目标是“小”、“轻”,并尽量与标准一致,虽然它的API和很多libc兼容,但是似乎并不像它期望的那样和所有标准一致。

 

(2).uClibc 就是为了解决这个问题从uC-libc中发展出来的。

它的所有API都是标准的(正确的返回类型,参数等等),它弥补了uC-libc中没有实现的libc标准,现在已经被移植到多种架构中。

一般来讲,它尽量兼容glibc以便使应用程序用uClibc改写变的容易。

uClibc 能够在标准的 VM linux 和uClinux上面使用。

为了应用程序的简洁,它甚至可以在许多支持MMU的平台上被编译成共享库。

Erik Anderson在uClibc背后做了很多的工作。

uClibc 支持许多系列的处理器:m68000,Coldfire,ARM,MIPS,v850, x86,i960,Sparc,SuperH,Alpha,PowerPC和Hitachi 8。

不断增加的平台支持显示uClibc能够很容易的适应新的架构。


2.uClinux 发行版提供了环境能够让你选择使用uC-libc或是uClibc编译。

对于m68000和Coldfire平台来说,选择uC-libc还是稍微好一点,因为它支持共享库,而共享库是这些cpu经常使用的 libc。

uClibc 也几乎和所有的平台都能很好的工作。

newlib 是一个用于嵌入式系统的开放源代码的C语言程序库,由libc和libm两个库组成,特点是轻量级,速度快,可移植到很多CPU结构上。

newlib 实现了许多复杂的功能,包括字符串支持,浮点运算,内存分配(如malloc)和I/O流函数(printf,fprinf()等等)。其中libc提供了c 语言库的实现,而libm提供了浮点运算支持。

七、C语言库的选择

1.在为ARM交叉编译gcc编译器时,对gcc指定不同的配置选项时,使用的C语言库就不同,gcc 编译器默认使用Glibc,

也可以使用 uClibc/uC-libc(基本兼容Glibc API),当使用--with-newlib时,gcc 编译器不使用Glibc。

当没有交叉编译Glibc时,可以使用--with-newlib禁止连接Glibc而编译bootstrap gcc编译器。



2.从gcc源目录下的config/arm中的t-linux和t-arm-elf中可以看出,

不同的--target也影响gcc连接C语言库,t-linux(--target=arm-linux)默认使用Glibc,-arm-elf(--target=arm-elf)使用- Dinhibit_libc禁止连接Glibc,

这时我们就可以使用newlib等其他C语言库编译GCC工具链。

虽然GCC工具链配置了不同的的C语言库,但由于这些C语言库都可以用来支持GCC,它们对核心数据的处理上不存在较大出入。

因而arm-linux-* 和 arm-elf-*区别主要表现在C语言库的实现上,例如不同系统调用,不同的函数集实现,不同的ABI/启动代码以及不同系统特性等微小的差别。


3.arm-linux-*和 arm-elf-*的使用没有一个绝对的标准,排除不同库实现的差异,gcc可以编译任何系统。

arm-linux-*和 arm-elf-*都可以用来编译裸机程序和操作系统,只是在遵循下面的描述时系统程序显得更加协调:

  • arm-linux-*针对运行linux的ARM机器,其依赖于指定的C语言库Glibc,因为同样使用Glibc的linux而使得arm-linux-*在运行linux的ARM机器上编译显得更加和谐。
  • arm-elf-*则是一个独立的编译体系,不依赖于指定的C语言库Glibc,可以使用newlib等其他C语言库,不要求操作系统支持.

             当其使用为嵌入式系统而设计的一些轻巧的C语言库时编译裸机程序(没有linux等大型操作系统的程序),如监控程序,bootloader 等能使得系统程序更加小巧快捷。)



0 0
原创粉丝点击