C++ STL Vector容器学习 (Boolan学习笔记第7周)

来源：互联网发布：李荣浩杨丞琳知乎编辑：程序博客网时间：2024/06/06 06:00

C++的vector容器可以说是Array的一个Advanced Version。我们知道C和C++里面的Array都是不能动态增加大小的，所以我们在编C程序的时候要么先预先设好一个大数组，要么在需要的时候再根据所需大小在堆上malloc，事后还要记得free。

我觉得C++的vector容器的好处就是它可以实现动态增长。vector一开始申明的时候会有个初始大小n。然后我们开始给vector添加新的元素，比如push_back()，慢慢的元素越来越多，初始vector空间不够用了，这时候再调用push_back()的话，其内部代码就会向内存管理系统索要大小为*Kn的内存空间。这期间用到了vector的allocator，其内部实际上也是调用的malloc()。如果内存管理系统没有办法满足vector的新size需求，则将增长空间设为刚好能容纳原有的数据和新增的数据。* 要是这点需求还不能满足的话，那就只能抛出异常了。

当新的内存分配好了之后，原vector的内容会被拷贝到新的空间(注意这里每拷贝一个元素都会调用一次拷贝构造函数)，也就是新的vector所指向的空间，并且原vector的内容会被清空，(注意这里每清空一个元素都会调用一次析构函数)。注意最后还要把原vector的内存清掉，这里会用到vector的deallocator，里面实际上会调用free()。

这里有好几点需要注意：
1）上面的K跟具体的平台有关。比如说Linux下面的STL源码采用K=2，而Windows的Visual Studio里面采用K=1.5。
1）vector空间不够用时，每次申请2倍或1.5倍的内存。当vector size很大时，可能会把系统内存耗尽，严重影响效率。
2）vector数据的移动会涉及到大量的拷贝构造函数和析构函数，所以效率会很低。
2）对vector的操作如果导致空间重新配置，指向原vector的所有iterator就都失效，因为iterator其实就是指针。

下面谈谈K常数的选取。其实这个以2或1.5为底的指数增长是一种对可用空间试探性的探测，在工程应用中很多地方都会用到这种以2为底的指数增长（因为速度快嘛)，比如说TCP的拥塞控制机制里面，slow start过程一开始带宽也是以2为底的指数增长，直到遇到丢包或达到一个门限值带宽才开始线性增长。

不过这种以２为底数有个问题，那就是每次的新size会大于以前所有的size的和，比如说1->2->4->8，那么8>1+2+4。这样，以前分配的内存就不能重用了。

但是凡事皆有利弊。以２为底数也是有好处的，每次增长一倍，所以可以用的空间也比较多，下次再需要分配空间的可能性也就变小了。

在Windows的Visual Studio下面Vector size的增长采用的底数是1.5，好处是以前分配的内存可以重用，缺点是较保守，新开空间比较小，下次再需要分配空间的可能性变大。

事实上我个人觉得到底是用2还是1.5，跟本地操作系统的内存管理系统很有关系。比如说Linux的buddy system，其将所有的空闲Page(每个页大小 4KB )分组为11个块链表组，每个块链表的块的size大小分别为1，2，4，8，…，1024个连续的Page。内核会把内核大小为b的一对空闲Page合并为一个大小为2b的单独块，然后挂在对应大小为2b的块链表上。可以想象这种内存管理系统会很适合以2为底数的指数增长。

另外还有一点可以思考一下，如果vector的size可以在原地增长1.5倍或2倍，那么是不是就不需要把vector的数据再拷贝一次呢？我的理解是这当然是可以的，但是一般这种情况很难发生。以Linux的buddy system内存管理系统为例，allocator分配内存的时候通常就在块链表组中找比所需size稍大的块所在的那个链表中来分配，所以不太可能这个块能够满足2*size的要求。

0 0