浅析C++内存分配与释放操作过程

来源：互联网发布：基于linux实践编辑：程序博客网时间：2024/06/05 19:55

引言：C++中总共有三种方式可以分配内存，new operator， operator new，placement new。

一，new operator

这就是我们最常使用的 new 操作符。查看汇编码可以看出：它不是一个函数，所以没有堆栈信息，而且它不能被重载。

请看下面一段代码：

#include <iostream>class A{public:A(int x):m_x(x){std::cout << "constructor of A" << std::endl;}~A(){std::cout << "destructor of A" << std::endl;}private:int m_x;};int main(int argc, char* argv[]){A *pa = new A(1);delete pa;return 0;}

调用 A *pa = new A(1); 的过程共总分为三步

1，调用 void* operator new(size_t size)分配sizeof(A)大小的内存；

2，在第一步返回的地址上调用A的构造函数；

3，将第一步返回的地址赋值给pa；

与 new operator 对应的是 delete operator，它也是操作符，同样不能被重载。

调用 delete pa;的过程大致分为两步

1，在 pa 所指的地址上调用A类的析构函数；

2，调用void operator delete(void *pUserData)函数释放pa所指内存；

如果A类没有声明析构函数，编译器也没有不要合成析构函数，上述delete过程就只有第二步。

对基本数据类型也只有第二部。

现在思考一个问题：考虑上诉代码，下面的代码会有内存泄漏吗？

void *pvoid = pa;

delete pvoid;

上述问题可以表述为执行 delete pa 时释放的是sizeof(A)的内存吗？

答案是肯定的，因为不管是 delete pa 还是 delete pvoid 最后执行的都是 void operator delete(void *pUserData)，

唯一的区别是delete pvoid 时不会调用A类的构造函数。

二，operator new

这个函数是 new opertor 必定会调用的，其定义为

void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)        {       // try to allocate size bytes        void *p;        while ((p = malloc(size)) == 0)                if (_callnewh(size) == 0)                {       // report no memory                static const std::bad_alloc nomem;                _RAISE(nomem);                }        return (p);        }

其中 _RAISE 宏定义为

#define _RAISE(x) throw x

可以看出，这个函数最终会调用C语言中的 malloc 函数，而且分配内存失败的话会抛出 std::bad_alloc 异常。

与之对应的是 operator delete，其定义为

void operator delete(        void *pUserData        ){        _CrtMemBlockHeader * pHead;        RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));        if (pUserData == NULL)            return;        _mlock(_HEAP_LOCK);  /* block other threads */        __TRY            /* get a pointer to memory block header */            pHead = pHdr(pUserData);             /* verify block type */            _ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));            _free_dbg( pUserData, pHead->nBlockUse );        __FINALLY            _munlock(_HEAP_LOCK);  /* release other threads */        __END_TRY_FINALLY        return;}

可以看出，这个函数会调用 _free_dgb。再看看C语言中的 free 函数定义

extern "C" _CRTIMP void __cdecl free(
void * pUserData
)
{
_free_dbg(pUserData, _NORMAL_BLOCK);
}

所以，operator delete 最终的释放过程和 free 函数相同。

而且这两个函数都可以被重载

#include <iostream>class A{public:A(int x):m_x(x){std::cout << "constructor of A" << std::endl;}~A(){std::cout << "destructor of A" << std::endl;}void* operator new(size_t size){std::cout << "operator new of A" << std::endl;return ::operator new(size);}void operator delete(void* pUserData){std::cout << "operator delete of A" << std::endl;::operator delete(pUserData);}private:int m_x;};int main(int argc, char* argv[]){A *pa = new A(1);delete pa;return 0;}

需要注意的是，重载的时候要能保证其原有的行为，而且重载时不管有没有加static，这两个函数都是static类型的。

现在思考两个问题：

1，如何保证一个类不能在堆上创建。（比如考虑到性能因素）

2，如何保证一个类对象不能被delete。（比如有时候全局作用域的单一实例不能被delete）

答案是只需将类的operator new 和 operator delete 重载为非public 类型的就可以了。这样的话这两行代码

A *pa = new A(1);delete pa;

根本不能通过编译。

顺便提另一个问题：如果保证一个类不能在栈上创建？

答案同样是是将该类的析构函数声明为非 public 类型的就可以了。

这样的话即便是创建该类的 global 对象也会导致编译失败。

三，placement new

这是一个全局函数，其定义为：

inline void *__CRTDECL operator new(size_t, void *_Where) _THROW0(){// construct array with placement at _Wherereturn (_Where);}

它同样可以被重载

class A{public:A(int x):m_x(x){std::cout << "constructor of A" << std::endl;}~A(){std::cout << "destructor of A" << std::endl;}void *operator new(size_t size){std::cout << "operator new of A" << std::endl;return ::operator new(size);}void* operator new(size_t size, void* p){std::cout << "placement new of A" << std::endl;return ::operator new(size, p);}void operator delete(void* pUserData){std::cout << "operator delete of A" << std::endl;::operator delete(pUserData);}

但需要注意的是，如果只重载了 void *operator new(size_t size) ，调用placement new 的时候将会调到编译错误。

同样，如果如果只重载了 void *operator new(size_t size, void*p)，执行new 操作的时候也会调到编译错误。

placement new 的执行忽略了size_t参数，只返还第二个参数。其结果是允许用户把一个对象放到一个特定的地方，达到调用构造函数的效果。

和其他普通的new不同的是，它在调用时括号里多了另外一个参数。比如：

void *ptr = operator new(sizeof(A));//operator newA *pa = new(ptr)A(2);//placement new

pa->~A();

括号里的参数ptr是一个指针，它指向一个内存缓冲器，placement new 将在这个缓冲器上分配一个对象。

placement new 的返回值是这个被构造对象的地址(比如括号中的传递参数)。

placement new是operator new重载的一个版本。它并不分配内存，只是返回指向已经分配好的某段内存的一个指针。因此不能删除它，也没有对应的delete函数。

但需要调用对象的析构函数。因此，最后应该需要执行pa->~A();

placement new主要适用于：

1，在对时间要求非常高的应用程序中，因为这些程序分配的时间是确定的；

2，长时间运行而不被打断的程序；

3，执行一个垃圾收集器 (garbage collector)。

还有一点需要注意的是，看如下代码中：

class A{public:A(int x = 1):m_x(x){}~A(){}private:int m_x;};int main(int argc, char* argv[]){const int N = 8;void *ptr = operator new(sizeof(A) * N);A *pa = new(ptr)A[N];return 0;}

这是一段隐藏巨大错误的代码，很容易造成运行时内存错误。

因为使用placement new分配自定义对象的数组时，如果该类定义了析构函数（这点很重要），应该多分配4个字节用于存储元素个数。

所以上述main函数应该改成

int main(int argc, char* argv[]){const int N = 8;void *ptr = operator new(sizeof(A) * N + sizeof(int));A *pa = new(ptr)A[N];return 0;}

下面是我调试时的截图。

ptr指向内存：

pa指向内存：

从中可以看出ptr所指内存的头4个字节存储元素个数。pa 实际指向 ptr + 4 的地址。

总结：

1，new 和 delete 最终都会调用C语言中的 malloc 和 free 过程。

2，想要将对象构造在指定的内存地址上时可以使用placement new，但使用时要格外小心。

3，只想分配指定大小的内存而不构造对象时，可以用operator new 取代 new operator。

4，可以重载类的operator new 来跟踪类对象在堆上创建的过程及总数。

5，在C++中应该尽量使用new operator，因为这个操作符自动检查需要分配的内存大小。