内存管理

来源：互联网发布：谁有九九网络斗地主编辑：程序博客网时间：2024/05/05 14:47

欢迎进入内存这片雷区。伟大的Bill Gates 曾经失言：
640K ought to be enough for everybody
— Bill Gates 1981
程序员们经常编写内存管理程序，往往提心吊胆。如果不想触雷，唯一的解决办法
就是发现所有潜伏的地雷并且排除它们，躲是躲不了的。本章的内容比一般教科书的要
深入得多，读者需细心阅读，做到真正地通晓内存管理。
7.1 内存分配方式
内存分配方式有三种：
（1）从静态存储区域分配。内存在程序编译的时候就已经分配好，这块内存在程序的
整个运行期间都存在。例如全局变量，static 变量。
（2）在栈上创建。在执行函数时，函数内局部变量的存储单元都可以在栈上创建，函
数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集
中，效率很高，但是分配的内存容量有限。
（3）从堆上分配，亦称动态内存分配。程序在运行的时候用malloc 或new 申请任意多
少的内存，程序员自己负责在何时用free 或delete 释放内存。动态内存的生存期
由我们决定，使用非常灵活，但问题也最多。
7.2 常见的内存错误及其对策
发生内存错误是件非常麻烦的事情。编译器不能自动发现这些错误，通常是在程序
运行时才能捕捉到。而这些错误大多没有明显的症状，时隐时现，增加了改错的难度。
有时用户怒气冲冲地把你找来，程序却没有发生任何问题，你一走，错误又发作了。
常见的内存错误及其对策如下：
.. 内存分配未成功，却使用了它。
编程新手常犯这种错误，因为他们没有意识到内存分配会不成功。常用解决办法是，
在使用内存之前检查指针是否为NULL。如果指针p 是函数的参数，那么在函数的入口
处用assert(p!=NULL)进行检查。如果是用malloc 或new 来申请内存，应该用if(p==NULL)
或if(p!=NULL)进行防错处理。
.. 内存分配虽然成功，但是尚未初始化就引用它。
犯这种错误主要有两个起因：一是没有初始化的观念；二是误以为内存的缺省初值
全为零，导致引用初值错误（例如数组）。
内存的缺省初值究竟是什么并没有统一的标准，尽管有些时候为零值，我们宁可信
高质量C++/C 编程指南，v 1.0
2001 Page 45 of 101
其无不可信其有。所以无论用何种方式创建数组，都别忘了赋初值，即便是赋零值也不
可省略，不要嫌麻烦。
.. 内存分配成功并且已经初始化，但操作越过了内存的边界。
例如在使用数组时经常发生下标“多1”或者“少1”的操作。特别是在for 循环语
句中，循环次数很容易搞错，导致数组操作越界。
.. 忘记了释放内存，造成内存泄露。
含有这种错误的函数每被调用一次就丢失一块内存。刚开始时系统的内存充足，你
看不到错误。终有一次程序突然死掉，系统出现提示：内存耗尽。
动态内存的申请与释放必须配对，程序中malloc 与free 的使用次数一定要相同，否
则肯定有错误（new/delete 同理）。
.. 释放了内存却继续使用它。
有三种情况：
（1）程序中的对象调用关系过于复杂，实在难以搞清楚某个对象究竟是否已经释放了内
存，此时应该重新设计数据结构，从根本上解决对象管理的混乱局面。
（2）函数的return 语句写错了，注意不要返回指向“栈内存”的“指针”或者“引用”，
因为该内存在函数体结束时被自动销毁。
（3）使用free 或delete 释放了内存后，没有将指针设置为NULL。导致产生“野指针”。
.. 【规则7-2-1】用malloc 或new 申请内存之后，应该立即检查指针值是否为NULL。
防止使用指针值为NULL 的内存。
.. 【规则7-2-2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右
值使用。
.. 【规则7-2-3】避免数组或指针的下标越界，特别要当心发生“多1”或者“少1”
操作。
.. 【规则7-2-4】动态内存的申请与释放必须配对，防止内存泄漏。
.. 【规则7-2-5】用free 或delete 释放了内存之后，立即将指针设置为NULL，防止产
生“野指针”。
7.3 指针与数组的对比
C++/C 程序中，指针和数组在不少地方可以相互替换着用，让人产生一种错觉，以
为两者是等价的。
数组要么在静态存储区被创建（如全局数组），要么在栈上被创建。数组名对应着（而
不是指向）一块内存，其地址与容量在生命期内保持不变，只有数组的内容可以改变。
指针可以随时指向任意类型的内存块，它的特征是“可变”，所以我们常用指针来操
作动态内存。指针远比数组灵活，但也更危险。
高质量C++/C 编程指南，v 1.0
2001 Page 46 of 101
下面以字符串为例比较指针与数组的特性。
7.3.1 修改内容
示例7-3-1 中，字符数组a 的容量是6 个字符，其内容为hello/0。a 的内容可以改变，
如a[0]= ‘X’。指针p 指向常量字符串“world”（位于静态存储区，内容为world/0），常
量字符串的内容是不可以被修改的。从语法上看，编译器并不觉得语句p[0]= ‘X’有什么
不妥，但是该语句企图修改常量字符串的内容而导致运行错误。
char a[] = “hello”;
a[0] = ‘X’;
cout << a << endl;
char *p = “world”; // 注意p 指向常量字符串
p[0] = ‘X’; // 编译器不能发现该错误
cout << p << endl;
示例7-3-1 修改数组和指针的内容
7.3.2 内容复制与比较
不能对数组名进行直接复制与比较。示例7-3-2 中，若想把数组a 的内容复制给数
组b，不能用语句 b = a ，否则将产生编译错误。应该用标准库函数strcpy 进行复制。
同理，比较b 和a 的内容是否相同，不能用if(b==a) 来判断，应该用标准库函数strcmp
进行比较。
语句p = a 并不能把a 的内容复制指针p，而是把a 的地址赋给了p。要想复制a
的内容，可以先用库函数malloc 为p 申请一块容量为strlen(a)+1 个字符的内存，再用
strcpy 进行字符串复制。同理，语句if(p==a) 比较的不是内容而是地址，应该用库函
数strcmp 来比较。
// 数组…
char a[] = "hello";
char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)
…
// 指针…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用 p = a;
if(strcmp(p, a) == 0) // 不要用 if (p == a)
…
示例7-3-2 数组和指针的内容复制与比较
高质量C++/C 编程指南，v 1.0
2001 Page 47 of 101
7.3.3 计算内存容量
用运算符sizeof 可以计算出数组的容量（字节数）。示例7-3-3（a）中，sizeof(a)
的值是12（注意别忘了’/0’）。指针p 指向a，但是sizeof(p)的值却是4。这是因为
sizeof(p)得到的是一个指针变量的字节数，相当于sizeof(char*)，而不是p 所指的内
存容量。C++/C 语言没有办法知道指针所指的内存容量，除非在申请内存时记住它。
注意当数组作为函数的参数进行传递时，该数组自动退化为同类型的指针。示例
7-3-3（b）中，不论数组a 的容量是多少，sizeof(a)始终等于sizeof(char *)。
char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12 字节
cout<< sizeof(p) << endl; // 4 字节
示例7-3-3（a）计算数组和指针的内存容量
void Func(char a[100])
{
cout<< sizeof(a) << endl; // 4 字节而不是100 字节
}
示例7-3-3（b）数组退化为指针
7.4 指针参数是如何传递内存的？
如果函数的参数是一个指针，不要指望用该指针去申请动态内存。示例7-4-1 中，
Test 函数的语句GetMemory(str, 200)并没有使str 获得期望的内存，str 依旧是NULL，
为什么？
void GetMemory(char *p, int num)
{
p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
char *str = NULL;
GetMemory(str, 100); // str 仍然为 NULL
strcpy(str, "hello"); // 运行错误
}
示例7-4-1 试图用指针参数申请动态内存
高质量C++/C 编程指南，v 1.0
2001 Page 48 of 101
毛病出在函数GetMemory 中。编译器总是要为函数的每个参数制作临时副本，指针
参数p 的副本是 _p，编译器使 _p = p。如果函数体内的程序修改了_p 的内容，就导致
参数p 的内容作相应的修改。这就是指针可以用作输出参数的原因。在本例中，_p 申请
了新的内存，只是把_p 所指的内存地址改变了，但是p 丝毫未变。所以函数GetMemory
并不能输出任何东西。事实上，每执行一次GetMemory 就会泄露一块内存，因为没有用
free 释放内存。
如果非得要用指针参数去申请内存，那么应该改用“指向指针的指针”，见示例7-4-2。
void GetMemory2(char **p, int num)
{
*p = (char *)malloc(sizeof(char) * num);
}
void Test2(void)
{
char *str = NULL;
GetMemory2(&str, 100); // 注意参数是 &str，而不是str
strcpy(str, "hello");
cout<< str << endl;
free(str);
}
示例7-4-2 用指向指针的指针申请动态内存
由于“指向指针的指针”这个概念不容易理解，我们可以用函数返回值来传递动态
内存。这种方法更加简单，见示例7-4-3。
char *GetMemory3(int num)
{
char *p = (char *)malloc(sizeof(char) * num);
return p;
}
void Test3(void)
{
char *str = NULL;
str = GetMemory3(100);
strcpy(str, "hello");
cout<< str << endl;
free(str);
}
示例7-4-3 用函数返回值来传递动态内存
高质量C++/C 编程指南，v 1.0
2001 Page 49 of 101
用函数返回值来传递动态内存这种方法虽然好用，但是常常有人把return 语句用错
了。这里强调不要用return 语句返回指向“栈内存”的指针，因为该内存在函数结束时
自动消亡，见示例7-4-4。
char *GetString(void)
{
char p[] = "hello world";
return p; // 编译器将提出警告
}
void Test4(void)
{
char *str = NULL;
str = GetString(); // str 的内容是垃圾
cout<< str << endl;
}
示例7-4-4 return 语句返回指向“栈内存”的指针
用调试器逐步跟踪Test4，发现执行str = GetString 语句后str 不再是NULL 指针，
但是str 的内容不是“hello world”而是垃圾。
如果把示例7-4-4 改写成示例7-4-5，会怎么样？
char *GetString2(void)
{
char *p = "hello world";
return p;
}
void Test5(void)
{
char *str = NULL;
str = GetString2();
cout<< str << endl;
}
示例7-4-5 return 语句返回常量字符串
函数Test5 运行虽然不会出错，但是函数GetString2 的设计概念却是错误的。因为
GetString2 内的“hello world”是常量字符串，位于静态存储区，它在程序生命期内
恒定不变。无论什么时候调用GetString2，它返回的始终是同一个“只读”的内存块。
高质量C++/C 编程指南，v 1.0
2001 Page 50 of 101
7.5 free 和delete 把指针怎么啦？
别看free 和delete 的名字恶狠狠的（尤其是delete），它们只是把指针所指的内存给
释放掉，但并没有把指针本身干掉。
用调试器跟踪示例7-5，发现指针p 被free 以后其地址仍然不变（非NULL），只是
该地址对应的内存是垃圾，p 成了“野指针”。如果此时不把p 设置为NULL，会让人误
以为p 是个合法的指针。
如果程序比较长，我们有时记不住p 所指的内存是否已经被释放，在继续使用p 之
前，通常会用语句if (p != NULL)进行防错处理。很遗憾，此时if 语句起不到防错作用，
因为即便p 不是NULL 指针，它也不指向合法的内存块。
char *p = (char *) malloc(100);
strcpy(p, “hello”);
free(p); // p 所指的内存被释放，但是p 所指的地址仍然不变
…
if(p != NULL) // 没有起到防错作用
{
strcpy(p, “world”); // 出错
}
示例7-5 p 成为野指针
7.6 动态内存会被自动释放吗？
函数体内的局部变量在函数结束时自动消亡。很多人误以为示例7-6 是正确的。理
由是p 是局部的指针变量，它消亡的时候会让它所指的动态内存一起完蛋。这是错觉！
void Func(void)
{
char *p = (char *) malloc(100); // 动态内存会自动释放吗？
}
示例7-6 试图让动态内存自动释放
我们发现指针有一些“似是而非”的特征：
（1）指针消亡了，并不表示它所指的内存会被自动释放。
（2）内存被释放了，并不表示指针会消亡或者成了NULL 指针。
这表明释放内存并不是一件可以草率对待的事。也许有人不服气，一定要找出可以
草率行事的理由：
如果程序终止了运行，一切指针都会消亡，动态内存会被操作系统回收。既然如此，
高质量C++/C 编程指南，v 1.0
2001 Page 51 of 101
在程序临终前，就可以不必释放内存、不必将指针设置为NULL 了。终于可以偷懒而不会
发生错误了吧？
想得美。如果别人把那段程序取出来用到其它地方怎么办？
7.7 杜绝“野指针”
“野指针”不是NULL 指针，是指向“垃圾”内存的指针。人们一般不会错用NULL
指针，因为用if 语句很容易判断。但是“野指针”是很危险的，if 语句对它不起作用。
“野指针”的成因主要有两种：
（1）指针变量没有被初始化。任何指针变量刚被创建时不会自动成为NULL 指针，它
的缺省值是随机的，它会乱指一气。所以，指针变量在创建的同时应当被初始化，要么
将指针设置为NULL，要么让它指向合法的内存。例如
char *p = NULL;
char *str = (char *) malloc(100);
（2）指针p 被free 或者delete 之后，没有置为NULL，让人误以为p 是个合法的指针。
参见7.5 节。
（3）指针操作超越了变量的作用范围。这种情况让人防不胜防，示例程序如下：
class A
{
public:
void Func(void){ cout << “Func of class A” << endl; }
};
void Test(void)
{
A *p;
{
A a;
p = &a; // 注意 a 的生命期
}
p->Func(); // p 是“野指针”
}
函数Test 在执行语句p->Func()时，对象a 已经消失，而p 是指向a 的，所以p 就
成了“野指针”。但奇怪的是我运行这个程序时居然没有出错，这可能与编译器有关。
高质量C++/C 编程指南，v 1.0
2001 Page 52 of 101
7.8 有了malloc/free 为什么还要new/delete ？
malloc 与free 是C++/C 语言的标准库函数，new/delete 是C++的运算符。它们都可
用于申请动态内存和释放内存。
对于非内部数据类型的对象而言，光用maloc/free 无法满足动态对象的要求。对象
在创建的同时要自动执行构造函数，对象在消亡之前要自动执行析构函数。由于
malloc/free 是库函数而不是运算符，不在编译器控制权限之内，不能够把执行构造函数
和析构函数的任务强加于malloc/free。
因此C++语言需要一个能完成动态内存分配和初始化工作的运算符new，以及一个
能完成清理与释放内存工作的运算符delete。注意new/delete 不是库函数。
我们先看一看malloc/free 和new/delete 如何实现对象的动态内存管理，见示例7-8。
class Obj
{
public :
Obj(void){ cout << “Initialization” << endl; }
~Obj(void){ cout << “Destroy” << endl; }
void Initialize(void){ cout << “Initialization” << endl; }
void Destroy(void){ cout << “Destroy” << endl; }
};
void UseMallocFree(void)
{
Obj *a = (obj *)malloc(sizeof(obj)); // 申请动态内存
a->Initialize(); // 初始化
//…
a->Destroy(); // 清除工作
free(a); // 释放内存
}
void UseNewDelete(void)
{
Obj *a = new Obj; // 申请动态内存并且初始化
//…
delete a; // 清除并且释放内存
}
示例7-8 用malloc/free 和new/delete 如何实现对象的动态内存管理
类Obj 的函数Initialize 模拟了构造函数的功能，函数Destroy 模拟了析构函数的功
能。函数UseMallocFree 中，由于malloc/free 不能执行构造函数与析构函数，必须调用
成员函数Initialize 和Destroy 来完成初始化与清除工作。函数UseNewDelete 则简单得多。
高质量C++/C 编程指南，v 1.0
2001 Page 53 of 101
所以我们不要企图用malloc/free 来完成动态对象的内存管理，应该用new/delete。
由于内部数据类型的“对象”没有构造与析构的过程，对它们而言malloc/free 和new/delete
是等价的。
既然new/delete 的功能完全覆盖了malloc/free，为什么C++不把malloc/free 淘
汰出局呢？这是因为C++程序经常要调用C 函数，而C 程序只能用malloc/free 管理动
态内存。
如果用free 释放“new 创建的动态对象”，那么该对象因无法执行析构函数而可能
导致程序出错。如果用delete 释放“malloc 申请的动态内存”，理论上讲程序不会出错，
但是该程序的可读性很差。所以new/delete 必须配对使用，malloc/free 也一样。
7.9 内存耗尽怎么办？
如果在申请动态内存时找不到足够大的内存块，malloc 和new 将返回NULL 指针，
宣告内存申请失败。通常有三种方式处理“内存耗尽”问题。
（1）判断指针是否为NULL，如果是则马上用return 语句终止本函数。例如：
void Func(void)
{
A *a = new A;
if(a == NULL)
{
return;
}
…
}
（2）判断指针是否为NULL，如果是则马上用exit(1)终止整个程序的运行。例如：
void Func(void)
{
A *a = new A;
if(a == NULL)
{
cout << “Memory Exhausted” << endl;
exit(1);
}
…
}
（3）为new 和malloc 设置异常处理函数。例如Visual C++可以用_set_new_hander 函数
为new 设置用户自己定义的异常处理函数，也可以让malloc 享用与new 相同的异常处
高质量C++/C 编程指南，v 1.0
2001 Page 54 of 101
理函数。详细内容请参考C++使用手册。
上述（1）（2）方式使用最普遍。如果一个函数内有多处需要申请动态内存，那么方
式（1）就显得力不从心（释放内存很麻烦），应该用方式（2）来处理。
很多人不忍心用exit(1)，问：“不编写出错处理程序，让操作系统自己解决行不行？”
不行。如果发生“内存耗尽”这样的事情，一般说来应用程序已经无药可救。如果
不用exit(1) 把坏程序杀死，它可能会害死操作系统。道理如同：如果不把歹徒击毙，歹
徒在老死之前会犯下更多的罪。
有一个很重要的现象要告诉大家。对于32 位以上的应用程序而言，无论怎样使用
malloc 与new，几乎不可能导致“内存耗尽”。我在Windows 98 下用Visual C++编写了
测试程序，见示例7-9。这个程序会无休止地运行下去，根本不会终止。因为32 位操作
系统支持“虚存”，内存用完了，自动用硬盘空间顶替。我只听到硬盘嘎吱嘎吱地响，
Window 98 已经累得对键盘、鼠标毫无反应。
我可以得出这么一个结论：对于32 位以上的应用程序，“内存耗尽”错误处理程序
毫无用处。这下可把Unix 和Windows 程序员们乐坏了：反正错误处理程序不起作用，
我就不写了，省了很多麻烦。
我不想误导读者，必须强调：不加错误处理将导致程序的质量很差，千万不可因小
失大。
void main(void)
{
float *p = NULL;
while(TRUE)
{
p = new float[1000000];
cout << “eat memory” << endl;
if(p==NULL)
exit(1);
}
}
示例7-9 试图耗尽操作系统的内存
7.10 malloc/free 的使用要点
函数malloc 的原型如下：
void * malloc(size_t size);
用malloc 申请一块长度为length 的整数类型的内存，程序如下：
int *p = (int *) malloc(sizeof(int) * length);
高质量C++/C 编程指南，v 1.0
2001 Page 55 of 101
我们应当把注意力集中在两个要素上：“类型转换”和“sizeof”。
.. malloc 返回值的类型是void *，所以在调用malloc 时要显式地进行类型转换，将
void * 转换成所需要的指针类型。
.. malloc 函数本身并不识别要申请的内存是什么类型，它只关心内存的总字节数。我
们通常记不住int, float 等数据类型的变量的确切字节数。例如int 变量在16 位系统
下是2 个字节，在32 位下是4 个字节；而float 变量在16 位系统下是4 个字节，在
32 位下也是4 个字节。最好用以下程序作一次测试：
cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;
在malloc 的“()”中使用sizeof 运算符是良好的风格，但要当心有时我们会昏了
头，写出 p = malloc(sizeof(p))这样的程序来。
.. 函数free 的原型如下：
void free( void * memblock );
为什么free 函数不象malloc 函数那样复杂呢？这是因为指针p 的类型以及它所指
的内存的容量事先都是知道的，语句free(p)能正确地释放内存。如果p 是NULL 指针，
那么free 对p 无论操作多少次都不会出问题。如果p 不是NULL 指针，那么free 对p
连续操作两次就会导致程序运行错误。
7.11 new/delete 的使用要点
运算符new 使用起来要比函数malloc 简单得多，例如：
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
这是因为new 内置了sizeof、类型转换和类型安全检查功能。对于非内部数据类型
的对象而言，new 在创建动态对象的同时完成了初始化工作。如果对象有多个构造函数，
那么new 的语句也可以有多种形式。例如
class Obj
{
public :
Obj(void); // 无参数的构造函数
Obj(int x); // 带一个参数的构造函数
高质量C++/C 编程指南，v 1.0
2001 Page 56 of 101
…
}
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1); // 初值为1
…
delete a;
delete b;
}
如果用new 创建对象数组，那么只能使用对象的无参数构造函数。例如
Obj *objects = new Obj[100]; // 创建100 个动态对象
不能写成
Obj *objects = new Obj[100](1);// 创建100 个动态对象的同时赋初值1
在用delete 释放对象数组时，留意不要丢了符号‘[]’。例如
delete []objects; // 正确的用法
delete objects; // 错误的用法
后者相当于delete objects[0]，漏掉了另外99 个对象。
7.12 一些心得体会
我认识不少技术不错的C++/C 程序员，很少有人能拍拍胸脯说通晓指针与内存管理
（包括我自己）。我最初学习C 语言时特别怕指针，导致我开发第一个应用软件（约1
万行C 代码）时没有使用一个指针，全用数组来顶替指针，实在蠢笨得过分。躲避指针
不是办法，后来我改写了这个软件，代码量缩小到原先的一半。
我的经验教训是：
（1）越是怕指针，就越要使用指针。不会正确使用指针，肯定算不上是合格的程序员。
（2）必须养成“使用调试器逐步跟踪程序”的习惯，只有这样才能发现问题的本质。