BSS段、数据段、代码段、堆栈、指针/引

来源：互联网发布：淘宝网的床罩编辑：程序博客网时间：2024/05/18 01:25

BSS段：BSS段（bss segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

　　数据段：数据段（data segment）通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

　　代码段：代码段（code segment/text segment）通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读, 某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。

　　堆（heap）：堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）

　　栈(stack)：栈又称堆栈，是用户存放程序临时创建的局部变量，也就是说我们函数括弧“{}”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进先出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。

堆栈又称堆栈（stack）在计算机科学中，是一种特殊的链表形式的数据结构，它的特殊之处在于只能允许在链表的一端（称为栈顶，英文为top）进行添加和删除操作。另外堆栈数据结构的实现也可以通过数组来完成。

严格来说堆是指Heap，程序运行时供程序员来支配的一段内存。
而栈Stack,多指函数调用时候参数的相互传递存在的内存区域。

由于堆栈数据结构只允许在一端进行操作，因而按照先进后出（LIFO-Last In First Out）的原理工作。

堆栈数据结构支持两种基本操作：压栈（push）和弹栈（pop）：

1. 压栈（入栈）：将对象或者数据压入栈中，更新栈顶指针，使其指向最后入栈的对象或数据。
2. 弹栈（出栈）：返回栈顶指向的对象或数据，并从栈中删除该对象或数据，更新栈顶。

C++中引用和指针的区别
指针初始化的时候，可以指向一个地址，也可以为空。《----》引用必须初始化为另一个变量.

C/C++中的指针其实就是一个变量，和其他类型的变量是一个样子的，它是一个占用四字节的变量（32位机上），它与其他变量的不同之处就在于它的变量值是一个内存地址，指向内存的另外一个地方。reference我的理解就是一个别名，它和linux操作系统上的alias是一个样子的。再者，一个pointer变量可以指向NULL，表示它不指向任何变量地址，但是reference必须在声明的时候就得和一个已经存在的变量相绑定，而且这种绑定不可改变。

如果是传递指针，那么先复制该指针，在函数内部使用的是复制后的指针，这个指针与原来的指针指向相同的地址，如果在函数内部将复制后的指针指向了另外的新的对象，那么不会影响原有的指针；
但是对于传递指针引用，如果将传递进来的指针指向了新的对象，那么原始的指针也就指向了新的对象，这样就会造成内存泄漏，因为原来指针指向的地方已经不能再引用了，即使没有将传递进来的指针指向新的对象，而是在函数结束的时候释放了指针，那么在函数外部就不能再使用原有的指针了，因为原来的内存已经被释放了。

【例一】

　　用cl编译两个小程序如下：

　　程序1:

　　int ar[30000];

　　void main()

　　{

　　......

　　}

　　程序2:

　　int ar[300000] = {1, 2, 3, 4, 5, 6 };

　　void main()

　　{

　　......

　　}

　　发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解，于是手工编译了一下，并使用了/FAs编译选项来查看了一下其各自的.asm，发现在程序1.asm中ar的定义如下：

　　_BSS SEGMENT

　　?ar@@3PAHA DD 0493e0H DUP (?) ; ar

　　_BSS ENDS

　　而在程序2.asm中，ar被定义为：

　　_DATA SEGMENT

　　?ar@@3PAHA DD 01H ; ar

　　DD 02H

　　DD 03H

　　ORG $+1199988

　　_DATA ENDS 区别很明显，一个位于.bss段，而另一个位于.data段，两者的区别在于：全局的未初始化变量存在于.bss段中，具体体现为一个占位符；全局的已初始化变量存于.data段中；而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的，其内容由操作系统初始化（清零）；而.data却需要占用，其内容由程序初始化，因此造成了上述情况。

　　【例二】

　　编译如下程序（test.cpp）:

　　#include <stdio.h>

　　#define LEN 1002000

　　int inbss[LEN];

　　float fA;

　　int indata[LEN]={1,2,3,4,5,6,7,8,9};

　　double dbB = 100.0;

　　const int cst = 100;

　　int main(void)

　　{

　　int run[100] = {1,2,3,4,5,6,7,8,9};

　　for(int i=0; i<LEN; ++i)

　　printf("%d ", inbss[i]);

　　return 0;

　　}

　　命令：cl /FA test.cpp 回车 (/FA:产生汇编代码)

　　产生的汇编代码(test.asm):

　　TITLE test.cpp

　　.386P

　　include listing.inc

　　if @Version gt 510

　　.model FLAT

　　else

　　_TEXT SEGMENT PARA USE32 PUBLIC 'CODE'

　　_TEXT ENDS

　　_DATA SEGMENT DWORD USE32 PUBLIC 'DATA'

　　_DATA ENDS

　　CONST SEGMENT DWORD USE32 PUBLIC 'CONST'

　　CONST ENDS

　　_BSS SEGMENT DWORD USE32 PUBLIC 'BSS'

　　_BSS ENDS

　　_TLS SEGMENT DWORD USE32 PUBLIC 'TLS'

　　_TLS ENDS

　　FLAT GROUP _DATA, CONST, _BSS

　　ASSUME CS: FLAT, DS: FLAT, SS: FLAT

　　endif

　　PUBLIC ?inbss@@3PAHA ; inbss

　　PUBLIC ?fA@@3MA ; fA

　　PUBLIC ?indata@@3PAHA ; indata

　　PUBLIC ?dbB@@3NA ; dbB

　　_BSS SEGMENT

　　?inbss@@3PAHA DD 0f4a10H DUP (?) ; inbss

　　?fA@@3MA DD 01H DUP (?) ; fA

　　_BSS ENDS

　　_DATA SEGMENT

　　?indata@@3PAHA DD 01H ; indata

　　DD 02H

　　DD 03H

　　DD 04H

　　DD 05H

　　DD 06H

　　DD 07H

　　DD 08H

　　DD 09H

　　ORG $+4007964

　　?dbB@@3NA DQ 04059000000000000r ; 100 ; dbB

　　_DATA ENDS

　　PUBLIC _main

　　EXTRN _printf:NEAR

　　_DATA SEGMENT

　　$SG537 DB '%d ', 00H

　　_DATA ENDS

　　_TEXT SEGMENT

　　_run$ = -400

　　_i$ = -404

　　_main PROC NEAR

　　; File test.cpp

　　; Line 13

　　push ebp

　　mov ebp, esp

　　sub esp, 404 ; 00000194H

　　push edi

　　; Line 14

　　mov DWORD PTR _run$[ebp], 1

　　mov DWORD PTR _run$[ebp+4], 2

　　mov DWORD PTR _run$[ebp+8], 3

　　mov DWORD PTR _run$[ebp+12], 4

　　mov DWORD PTR _run$[ebp+16], 5

　　mov DWORD PTR _run$[ebp+20], 6

　　mov DWORD PTR _run$[ebp+24], 7

　　mov DWORD PTR _run$[ebp+28], 8

　　mov DWORD PTR _run$[ebp+32], 9

　　mov ecx, 91 ; 0000005bH

　　xor eax, eax

　　lea edi, DWORD PTR _run$[ebp+36]

　　rep stosd

　　; Line 15

　　mov DWORD PTR _i$[ebp], 0

　　jmp SHORT $L534

　　$L535:

　　mov eax, DWORD PTR _i$[ebp]

　　add eax, 1

　　mov DWORD PTR _i$[ebp], eax

　　$L534:

　　cmp DWORD PTR _i$[ebp], 1002000 ; 000f4a10H

　　jge SHORT $L536

　　; Line 16

　　mov ecx, DWORD PTR _i$[ebp]

　　mov edx, DWORD PTR ?inbss@@3PAHA[ecx*4]

　　push edx

　　push OFFSET FLAT:$SG537

　　call _printf

　　add esp, 8

　　jmp SHORT $L535

　　$L536:

　　; Line 17

　　xor eax, eax

　　; Line 18

　　pop edi

　　mov esp, ebp

　　pop ebp

　　ret 0

　　_main ENDP

　　_TEXT ENDS

　　END

　　－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

　　通过汇编文件可以看到，数组inbss和indata位于不同的段（inbss位于bss段，而indata位于data段）

　　若把test.cpp中的indata数组拿掉，查看生成的exe文件的大小，可以发现，indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组，exe文件大小跟没拿掉时相差无几。

　　说明了：

　　bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。

　　data（已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。