BSS段、数据段、代码段、堆栈、指针/引

来源:互联网 发布:淘宝网的床罩 编辑:程序博客网 时间:2024/05/18 01:25

BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

  数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

  代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

  堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

  栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
 
    堆栈又称堆栈(stack)在计算机科学中,是一种特殊的链表形式的数据结构,它的特殊之处在于只能允许在链表的一端(称为栈顶,英文为top)进行添加和删除操作。另外堆栈数据结构的实现也可以通过数组来完成。

严格来说堆是指Heap,程序运行时供程序员来支配的一段内存。
而栈Stack,多指函数调用时候参数的相互传递存在的内存区域。

由于堆栈数据结构只允许在一端进行操作,因而按照先进后出(LIFO-Last In First Out)的原理工作。

堆栈数据结构支持两种基本操作:压栈(push)和弹栈(pop):

   1. 压栈(入栈):将对象或者数据压入栈中,更新栈顶指针,使其指向最后入栈的对象或数据。
   2. 弹栈(出栈):返回栈顶指向的对象或数据,并从栈中删除该对象或数据,更新栈顶。

C++中引用和指针的区别
指针初始化的时候,可以指向一个地址,也可以为空。《----》引用必须初始化为另一个变量.

 

C/C++中的指针其实就是一个变量,和其他类型的变量是一个样子的,它是一个占用四字节的变量(32位机上),它与其他变量的不同之处就在于它的变量值是一个内存地址,指向内存的另外一个地方。reference我的理解就是一个别名,它和linux操作系统上的alias是一个样子的。再者,一个pointer变量可以指向NULL,表示它不指向任何变量地址,但是reference必须在声明的时候就得和一个已经存在的变量相绑定,而且这种绑定不可改变。

 

如果是传递指针,那么先复制该指针,在函数内部使用的是复制后的指针,这个指针与原来的指针指向相同的地址,如果在函数内部将复制后的指针指向了另外的新的对象,那么不会影响原有的指针;
但是对于传递指针引用,如果将传递进来的指针指向了新的对象,那么原始的指针也就指向了新的对象,这样就会造成内存泄漏,因为原来指针指向的地方已经不能再引用了,即使没有将传递进来的指针指向新的对象,而是在函数结束的时候释放了指针,那么在函数外部就不能再使用原有的指针了,因为原来的内存已经被释放了。

 

【例一】

  用cl编译两个小程序如下:

  程序1:

  int ar[30000];

  void main()

  {

  ......

  }

  程序2:

  int ar[300000] = {1, 2, 3, 4, 5, 6 };

  void main()

  {

  ......

  }

  发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下:

  _BSS SEGMENT

  ?ar@@3PAHA DD 0493e0H DUP (?) ; ar

  _BSS ENDS

  而在程序2.asm中,ar被定义为:

  _DATA SEGMENT

  ?ar@@3PAHA DD 01H ; ar

  DD 02H

  DD 03H

  ORG $+1199988

  _DATA ENDS 区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

  【例二】

  编译如下程序(test.cpp):

  #include <stdio.h>

  #define LEN 1002000

  int inbss[LEN];

  float fA;

  int indata[LEN]={1,2,3,4,5,6,7,8,9};

  double dbB = 100.0;

  const int cst = 100;

  int main(void)

  {

  int run[100] = {1,2,3,4,5,6,7,8,9};

  for(int i=0; i<LEN; ++i)

  printf("%d ", inbss[i]);

  return 0;

  }

  命令:cl /FA test.cpp 回车 (/FA:产生汇编代码)

  产生的汇编代码(test.asm):

  TITLE test.cpp

  .386P

  include listing.inc

  if @Version gt 510

  .model FLAT

  else

  _TEXT SEGMENT PARA USE32 PUBLIC 'CODE'

  _TEXT ENDS

  _DATA SEGMENT DWORD USE32 PUBLIC 'DATA'

  _DATA ENDS

  CONST SEGMENT DWORD USE32 PUBLIC 'CONST'

  CONST ENDS

  _BSS SEGMENT DWORD USE32 PUBLIC 'BSS'

  _BSS ENDS

  _TLS SEGMENT DWORD USE32 PUBLIC 'TLS'

  _TLS ENDS

  FLAT GROUP _DATA, CONST, _BSS

  ASSUME CS: FLAT, DS: FLAT, SS: FLAT

  endif

  PUBLIC ?inbss@@3PAHA ; inbss

  PUBLIC ?fA@@3MA ; fA

  PUBLIC ?indata@@3PAHA ; indata

  PUBLIC ?dbB@@3NA ; dbB

  _BSS SEGMENT

  ?inbss@@3PAHA DD 0f4a10H DUP (?) ; inbss

  ?fA@@3MA DD 01H DUP (?) ; fA

  _BSS ENDS

  _DATA SEGMENT

  ?indata@@3PAHA DD 01H ; indata

  DD 02H

  DD 03H

  DD 04H

  DD 05H

  DD 06H

  DD 07H

  DD 08H

  DD 09H

  ORG $+4007964

  ?dbB@@3NA DQ 04059000000000000r ; 100 ; dbB

  _DATA ENDS

  PUBLIC _main

  EXTRN _printf:NEAR

  _DATA SEGMENT

  $SG537 DB '%d ', 00H

  _DATA ENDS

  _TEXT SEGMENT

  _run$ = -400

  _i$ = -404

  _main PROC NEAR

  ; File test.cpp

  ; Line 13

  push ebp

  mov ebp, esp

  sub esp, 404 ; 00000194H

  push edi

  ; Line 14

  mov DWORD PTR _run$[ebp], 1

  mov DWORD PTR _run$[ebp+4], 2

  mov DWORD PTR _run$[ebp+8], 3

  mov DWORD PTR _run$[ebp+12], 4

  mov DWORD PTR _run$[ebp+16], 5

  mov DWORD PTR _run$[ebp+20], 6

  mov DWORD PTR _run$[ebp+24], 7

  mov DWORD PTR _run$[ebp+28], 8

  mov DWORD PTR _run$[ebp+32], 9

  mov ecx, 91 ; 0000005bH

  xor eax, eax

  lea edi, DWORD PTR _run$[ebp+36]

  rep stosd

  ; Line 15

  mov DWORD PTR _i$[ebp], 0

  jmp SHORT $L534

  $L535:

  mov eax, DWORD PTR _i$[ebp]

  add eax, 1

  mov DWORD PTR _i$[ebp], eax

  $L534:

  cmp DWORD PTR _i$[ebp], 1002000 ; 000f4a10H

  jge SHORT $L536

  ; Line 16

  mov ecx, DWORD PTR _i$[ebp]

  mov edx, DWORD PTR ?inbss@@3PAHA[ecx*4]

  push edx

  push OFFSET FLAT:$SG537

  call _printf

  add esp, 8

  jmp SHORT $L535

  $L536:

  ; Line 17

  xor eax, eax

  ; Line 18

  pop edi

  mov esp, ebp

  pop ebp

  ret 0

  _main ENDP

  _TEXT ENDS

  END

  ----------------------------------------

  通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段)

  若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。

  说明了:

  bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。

  data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。 数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。

原创粉丝点击