BSS段、数据段、代码段、堆与栈

来源:互联网 发布:4399js下载 编辑:程序博客网 时间:2024/05/19 19:31

BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)。

栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

我觉得BSS段的存在主要是为了减少可执行程序的大小,看下面的例子。

//a.cint ar[800000];void main(){}// b.cint ar[800000] =  {1};void main(){}// c.cint ar[800000] =  {0};void main(){}

abc的大小

我们发现a和c编译后所得的可执行程序比b的要大得多,这里就是BSS段在发挥作用。
全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。
.bss是不占用可执行文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

每个变量的大小放在了符号表里。
bss段的大小,记录在段表里,记录的是所有未初始化变量总共的大小。

用readelf -s 或 objdump -t 查看符号表
用readelf -S 或 objdump -h 查看段表

参考[3]里提到的多文件编译里,未初始化的全局变量int init;,在c里默认是添加了extern关键字的,编译时候是不放到bss里的,链接时如果发现其他obj里都没有这个变量,才把它放到bss里。(部分猜测)
如果直接对init进行了初始化,那就直接放到bss里了。(实测)

部分gcc命令选项(见参考[4]):
预处理(-E)、编译(-S)、汇编(-c)、链接(默认)
-o指定输出文件
-Wall,显示warning消息
编译阶段,gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,gcc把代码翻译成汇编语言。
汇编阶段是把编译阶段生成的”.s”文件转成二进制目标代码。(见参考[5])

该读一下《程序员的自我修养》


参考
[1] BSS段、数据段、代码段、堆与栈
[2] 面试官问我:bss段的大小记录在哪里?
[3] 通过未初始化全局变量,研究BSS段和COMMON段的不同
[4] Linux GCC常用命令
[5] gcc 编译的四大过程(预处理-编译-汇编-链接 )

0 0