C/C++程序的内存分配(变量存储)

来源:互联网 发布:绵阳网店美工招聘 编辑:程序博客网 时间:2024/05/18 01:14


本文由elikang整理,鉴于本人知识能力的不足,本文许多欠缺之处,欢迎讨论指正。
欢迎加QQ群讨论 :Linux && 技术分享 311078264

C/C++程序的内存分配(变量存储)


=======================================

file://C:\Users\ADMINI~1\AppData\Local\Temp\ct_tmp/1.png

存储时:


可执行程序在存储时(没有调入到内存)分为:
代码区(text)、数据区(data)和未初始化数据区(bss)3个部分.

1、代码区(text segment)。
存放CPU执行的机器指令(machine instructions)。通常,代码区是可共享的(即另外的执行程序可以调用它),因为对于频繁被执行的程序,只需要在内存中有一份代码即可。代码区通常是只读的,使其只读的原因是防止程序意外地修改了它的指令。另外,代码区还规划了局部变量的相关信息。

2、全局初始化数据区/静态数据区(initialized data segment/data segment)。
该区包含了在程序中明确被初始化的全局变量、静态变量(包括全局静态变量和局部静态变量)和常量数据(如字符串常量)。
例如,一个不在任何函数内的声明(全局数据):int maxcount = 99;
使得变量maxcount根据其初始值被存储到初始化数据区中。

static mincount = 100;
这声明了一个静态数据,如果是在任何函数体外声明,则表示其为一个全局静态变量,如果在函数体内(局部),则表示其为一个局部静态变量。
另外,如果在函数名前加上static,则表示此函数只能在当前文件中被调用。

3、未初始化数据区。
亦称BSS区(uninitialized data segment),存入的是全局未初始化变量。BSS这个叫法是根据一个早期的汇编运算符而来,这个汇编运算符标志着一个块的开始。BSS区的数据在程序开始执行之前被内核初始化为0或者空指针(NULL)。
例如一个不在任何函数内的声明:long sum[1000];将变量sum存储到未初始化数据区。


运行时:


(1)代码区(text segment)。
代码区指令根据程序设计流程依次执行,对于顺序指令,则只会执行一次(每个进程),如果反复,则需要使用跳转指令,如果进行递归,则需要借助栈来实现。
代码区的指令中包括操作码和要操作的对象(或对象地址引用)。如果是立即数(即具体的数值,如5),将直接包含在代码中;如果是局部数据,将在栈区分配空间,然后引用该数据地址;如果是BSS区和数据区,在代码中同样将引用该数据地址。

(2)全局初始化数据区/静态数据区(Data Segment),只初始化一次。

(3)未初始化数据区(BSS),在运行时改变其值。

(4)栈区(stack)。
由编译器自动分配释放,存放函数的参数值、局部变量的值等。其操作方式类似于数据结构中的栈。每当一个函数被调用,该函数返回地址和一些关于调用的信息,比如某些寄存器的内容,被存储到栈区。然后这个被调用的函数再为它的自动变量和临时变量在栈区上分配空间,这就是C实现函数递归调用的方法。每执行一次递归函数调用,一个新的栈框架就会被使用,这样这个新实例栈里的变量就不会和该函数的另一个实例栈里面的变量混淆。

(5)堆区(heap)。
用于动态内存分配。堆在内存中位于bss区和栈区之间。一般由程序员分配和释放,若程序员不释放,程序结束时有可能由OS回收。

之所以分成这么多个区域,主要基于以下考虑:
一个进程在运行过程中,代码是根据流程依次执行的,只需要访问一次,当然跳转和递归有可能使代码执行多次,而数据一般都需要访问多次,因此单独开辟空间以方便访问和节约空间。
临时数据及需要再次使用的代码在运行时放入栈区中,生命周期短。
全局数据和静态数据有可能在整个程序执行过程中都需要访问,因此单独存储管理。
堆区由用户自由分配,以便管理。


注意:
  1、自动变量和静态变量的初始化存在一个重要的差别:

在静态变量的初始化是在编译的过程中就定了下来,如果不显式地制定其初始值,静态变量将初始化为0。可以认为静态变量不存在未初始化的情况。

自动变量的初始化需要更多的开销,因为当程序链接时还无法判断自动变量的存储位置。事实上,函数的局部变量在函数的每次调用中可能占据不同的位置。基于这个理由,自动变量没有缺省的初始值,而显式的初始化将在代码块的起始处插入一条隐式的赋值语句。

2、
在函数体中定义的变量通常是在栈上,用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。
在所有函数体外定义的是全局量,加了static修饰符后不管在哪里都存放在全局区(静态区)。
在所有函数体外定义的static变量表示在该文件中有效,不能extern到别的文件用;
在函数体内定义的static表示只在该函数体内有效。

另外,函数中的"abcdef"这样的字符串存放在常量区。

比如:
int a = 0; //全局初始化区
char *p1; //全局未初始化区
static b = 0;//全局静态区
void main()
{
    int b; //栈区
    char *p2; //栈区

    char s[] = "abc"; //s在栈区,"abc"在运行时赋值,不是字符串常量
char *p3 = "123456"; //p3在栈区,“123456”在常量区,编译的时候就确定了

    static int c = 0; //局部静态区

    p1 = (char *)malloc(10); //分配得来得10字节的区域在堆区
    p2 = (char *)malloc(20); //分配得来得20字节的区域在堆区

    strcpy(p1, "123456");//“123456”放在常量区,编译器可能会将它与p3所指向的"123456"优化成一条数据
}

3、
只有全局变量才区分是否初始化,放在全局初始化数据区或者全局未初始化数据区(即BSS区);
静态变量都是初始化的,放在静态区,区分全局还是局部;
局部变量存储时放在代码区,只在运行时临时分配在栈区。

***********************************
在C++中,内存分成5个区,他们分别是堆、栈、自由存储区、全局/静态存储区和常量存储区
1.栈,就是那些由编译器在需要的时候分配,在不需要的时候自动清楚的变量的存储区。里面的变量通常是局部变量、函数参数等。
2.堆,就是那些由new分配的内存块,他们的释放编译器不去管,由我们的应用程序去控制,一般一个new就要对应一个delete。如果程序员没有释放掉,那么在程序结束后,操作系统会自动回收。
3.自由存储区,就是那些由malloc等分配的内存块,他和堆是十分相似的,不过它是用free来结束自己的生命的。
4.全局/静态存储区,全局变量和静态变量被分配到同一块内存中,在以前的C语言中,全局变量又分为初始化的和未初始化的,在C++里面没有这个区分了,他们共同占用同一块内存区。
5.常量存储区,这是一块比较特殊的存储区,他们里面存放的是常量,不允许修改(当然,你要通过非正当手段也可以修改)


0 0
原创粉丝点击