C++ 程序变量作用域生命周期笔记

来源：互联网发布：国外在淘宝买东西编辑：程序博客网时间：2024/06/04 00:23

1.C程序中通常将变量声明在文件的最开始；C++中变量声明较随意，可以在使用的时候声明。

2.C程序中编译的时候将变量写入符号表，变量表，便于在函数方便的使用；C++是类安全处理，不能只在程序最开始的时候声明变量，在构造函数有可能不明确输入参数的定义，这时候就要支持在需要的时候声明，而不是在函数的最开始。这个典例就是for循环中

例：

定义在for循环中，属于临时性的工作，对于一个for循环里面定义的变量，他的生命周期是for循环，C++中标准的定义，编译器会对此的处理是不同的：

对于VC6.0，下面的连续代码是错误的。

for(int i=0; i<10; i++) sum += i;

for(int i=0; i<10; i++) sum += i;

编译器会给出如下提示：error C2374: 'i' : redefinition; multiple initialization

错误时变量i重复生命力额，原因很简单，VC在实现变量i的声明周期是遇到右大括号“}”才结束其定义的。所以上面的程序要改成：

{
for(int i=0; i<10; i++) sum += i;
}
for(int i=0; i<10; i++) sum += i;

才能过编译器那一关。

这一点也让很多程序员犯晕，在鼓励要用才声明的C++里面，竟然会存在for循环的重复定义。如果使用，

for(int i=0; i<10; i++) sum += i;

for(i=0; i<10; i++) sum += i;

的话，这跟我们的逻辑又混乱了，在循环里面声明，却在循环外面使用。如果加上大括号又让程序显得特别奇怪。只能说，这是编译器的错，不是人的错，因为这两种选择都不是很合理。

其实这跟早期编译器实现方式相关，笔者试了最新版本的G++编译器，上面的两段代码都没有问题。即for循环里面的变量的生存周期只在for里面有效。VC6.0的这种错误只能说它并不是一个标准的C++编译器。

3.生命周期和作用域（作用域就是一个变量可以被引用的范围，如：全局作用域、文件作用域、局部作用域；而生命周期就是这个变量可以被引用的时间段）

4.可执行程序在存储时（没有调入到内存）分为代码区（text）、数据区（data）和未初始化数据区（bss）3个部分

（1）代码区（text segment）。存放CPU执行的机器指令（machine instructions）。通常，代码区是可共享的（即另外的执行程序可以调用它），因为对于频繁被执行的程序，只需要在内存中有一份代码即可。代码区通常是只读的，使其只读的原因是防止程序意外地修改了它的指令。另外，代码区还规划了局部变量的相关信息。
（2）全局初始化数据区/静态数据区（initialized data segment/data segment）。该区包含了在程序中明确被初始化的全局变量、静态变量（包括全局静态变量和局部静态变量）和常量数据（如字符串常量）。例如，一个不在任何函数内的声明（全局数据）：
int maxcount = 99;
使得变量maxcount根据其初始值被存储到初始化数据区中。
static mincount=100;
这声明了一个静态数据，如果是在任何函数体外声明，则表示其为一个全局静态变量，如果在函数体内（局部），则表示其为一个局部静态变量。另外，如果在函数名前加上static，则表示此函数只能在当前文件中被调用。
（3）未初始化数据区。亦称BSS区（uninitialized data segment），存入的是全局未初始化变量。BSS这个叫法是根据一个早期的汇编运算符而来，这个汇编运算符标志着一个块的开始。BSS区的数据在程序开始执行之前被内核初始化为0或者空指针（NULL）。例如一个不在任何函数内的声明：
long sum[1000];
将变量sum存储到未初始化数据区。
图3-1所示为可执行代码存储时结构和运行时结构的对照图。一个正在运行着的C编译程序占用的内存分为代码区、初始化数据区、未初始化数据区、堆区和栈区5个部分。

（1）代码区（text segment）。代码区指令根据程序设计流程依次执行，对于顺序指令，则只会执行一次（每个进程），如果反复，则需要使用跳转指令，如果进行递归，则需要借助栈来实现。
代码区的指令中包括操作码和要操作的对象（或对象地址引用）。如果是立即数（即具体的数值，如5），将直接包含在代码中；如果是局部数据，将在栈区分配空间，然后引用该数据地址；如果是BSS区和数据区，在代码中同样将引用该数据地址。
（2）全局初始化数据区/静态数据区（Data Segment）。只初始化一次。
（3）未初始化数据区（BSS）。在运行时改变其值。
（4）栈区（stack）。由编译器自动分配释放，存放函数的参数值、局部变量的值等。其操作方式类似于数据结构中的栈。每当一个函数被调用，该函数返回地址和一些关于调用的信息，比如某些寄存器的内容，被存储到栈区。然后这个被调用的函数再为它的自动变量和临时变量在栈区上分配空间，这就是C实现函数递归调用的方法。每执行一次递归函数调用，一个新的栈框架就会被使用，这样这个新实例栈里的变量就不会和该函数的另一个实例栈里面的变量混淆。
（5）堆区（heap）。用于动态内存分配。堆在内存中位于bss区和栈区之间。一般由程序员分配和释放，若程序员不释放，程序结束时有可能由OS回收。
之所以分成这么多个区域，主要基于以下考虑：

一个进程在运行过程中，代码是根据流程依次执行的，只需要访问一次，当然跳转和递归有可能使代码执行多次，而数据一般都需要访问多次，因此单独开辟空间以方便访问和节约空间。
临时数据及需要再次使用的代码在运行时放入栈区中，生命周期短。
全局数据和静态数据有可能在整个程序执行过程中都需要访问，因此单独存储管理。
堆区由用户自由分配，以便管理。

下面通过一段简单的代码来查看C程序执行时的内存分配情况。相关数据在运行时的位置如注释所述。
//main.cpp
int a = 0; //a在全局已初始化数据区
char *p1; //p1在BSS区（未初始化全局变量）
main()
{
int b; //b在栈区
char s[] = "abc"; //s为数组变量，存储在栈区，
//"abc"为字符串常量，存储在已初始化数据区
char *p1，p2; //p1、p2在栈区
char *p3 = "123456"; //123456\0在已初始化数据区，p3在栈区
static int c =0； //C为全局（静态）数据，存在于已初始化数据区
//另外，静态数据会自动初始化
p1 = (char *)malloc(10);//分配得来的10个字节的区域在堆区
p2 = (char *)malloc(20);//分配得来的20个字节的区域在堆区
free(p1);
free(p2);
}

作用域：全局作用域（全局变量只需在一个源文件中定义，就可以作用于所有的源文件。）
生命周期：程序运行期一直存在
引用方法：其他文件中要使用必须用extern 关键字声明要引用的全局变量。
内存分布：全局数据区
注意：如果在两个文件中都定义了相同名字的全局变量，连接出错：变量重定义
例子：

//defime.cpp
int g_iValue = 1;

//main.cpp
extern int g_iValue;

int main()
{
cout << g_iValue;
return 0;
}

全局静态变量

作用域：文件作用域（只在被定义的文件中可见。）
生命周期：程序运行期一直存在
内存分布：全局数据区
定义方法：static关键字，const 关键字
注意：只要文件不互相包含，在两个不同的文件中是可以定义完全相同的两个静态变量的，它们是两个完全不同的变量
例子：

const int iValue_1;
static const int iValue_2;
static int iValue_3;

int main()
{
return 0;
}

静态局部变量

作用域：局部作用域（只在局部作用域中可见）
生命周期：程序运行期一直存在
内存分布：全局数据区
定义方法：局部作用域用中用static定义
注意：只被初始化一次，多线程中需加锁保护
例子：

void function()
{
static int iREFCounter = 0;
}

局部变量

作用域：局部作用域（只在局部作用域中可见）
生命周期：程序运行出局部作用域即被销毁
内存分布：栈区
注意：auto指示符标示
还有一点要说明，掌握static关键字的使用很关键。以下是引用别人的一些经验之谈：

Tips:

若全局变量仅在单个C文件中访问，则可以将这个变量修改为静态全局变量，以降低模块间的耦合度；
若全局变量仅由单个函数访问，则可以将这个变量改为该函数的静态局部变量，以降低模块间的耦合度；
设计和使用访问动态全局变量、静态全局变量、静态局部变量的函数时，需要考虑重入问题，因为他们都放在静态数据存储区，全局可见；
如果我们需要一个可重入的函数，那么，我们一定要避免函数中使用static变量(这样的函数被称为：带“内部存储器”功能的的函数)
函数中必须要使用static变量情况:比如当某函数的返回值为指针类型时，则必须是static的局部变量的地址作为返回值，若为auto类型，则返回为错指针。

0 0