C++ STL Vector容器学习 (Boolan学习笔记第7周)

来源:互联网 发布:李荣浩 杨丞琳 知乎 编辑:程序博客网 时间:2024/06/06 06:00

C++的vector容器可以说是Array的一个Advanced Version。我们知道C和C++里面的Array都是不能动态增加大小的,所以我们在编C程序的时候要么先预先设好一个大数组,要么在需要的时候再根据所需大小在堆上malloc,事后还要记得free。

我觉得C++的vector容器的好处就是它可以实现动态增长。vector一开始申明的时候会有个初始大小n。然后我们开始给vector添加新的元素,比如push_back(),慢慢的元素越来越多,初始vector空间不够用了,这时候再调用push_back()的话,其内部代码就会向内存管理系统索要大小为*Kn的内存空间。这期间用到了vector的allocator,其内部实际上也是调用的malloc()。如果内存管理系统没有办法满足vector的新size需求, 则将增长空间设为刚好能容纳原有的数据和新增的数据。* 要是这点需求还不能满足的话,那就只能抛出异常了。

当新的内存分配好了之后,原vector的内容会被拷贝到新的空间(注意这里每拷贝一个元素都会调用一次拷贝构造函数),也就是新的vector所指向的空间,并且原vector的内容会被清空,(注意这里每清空一个元素都会调用一次析构函数)。注意最后还要把原vector的内存清掉,这里会用到vector的deallocator,里面实际上会调用free()。

这里有好几点需要注意:
1)上面的K跟具体的平台有关。比如说Linux下面的STL源码采用K=2,而Windows的Visual Studio里面采用K=1.5
1)vector空间不够用时,每次申请2倍或1.5倍的内存。当vector size很大时,可能会把系统内存耗尽,严重影响效率。
2)vector数据的移动会涉及到大量的拷贝构造函数和析构函数,所以效率会很低。
2)对vector的操作如果导致空间重新配置,指向原vector的所有iterator就都失效,因为iterator其实就是指针。

下面谈谈K常数的选取。其实这个以2或1.5为底的指数增长是一种对可用空间试探性的探测,在工程应用中很多地方都会用到这种以2为底的指数增长(因为速度快嘛),比如说TCP的拥塞控制机制里面,slow start过程一开始带宽也是以2为底的指数增长,直到遇到丢包或达到一个门限值带宽才开始线性增长。

不过这种以2为底数有个问题,那就是每次的新size会大于以前所有的size的和,比如说1->2->4->8, 那么8>1+2+4。这样,以前分配的内存就不能重用了。

但是凡事皆有利弊。以2为底数也是有好处的,每次增长一倍,所以可以用的空间也比较多,下次再需要分配空间的可能性也就变小了。

在Windows的Visual Studio下面Vector size的增长采用的底数是1.5,好处是以前分配的内存可以重用,缺点是较保守,新开空间比较小,下次再需要分配空间的可能性变大。

事实上我个人觉得到底是用2还是1.5,跟本地操作系统的内存管理系统很有关系。比如说Linux的buddy system,其将所有的空闲Page(每个页大小 4KB )分组为11个块链表组,每个块链表的块的size大小分别为1,2,4,8,…,1024个连续的Page。内核会把内核大小为b的一对空闲Page合并为一个大小为2b的单独块,然后挂在对应大小为2b的块链表上。可以想象这种内存管理系统会很适合以2为底数的指数增长。

另外还有一点可以思考一下,如果vector的size可以在原地增长1.5倍或2倍,那么是不是就不需要把vector的数据再拷贝一次呢?我的理解是这当然是可以的,但是一般这种情况很难发生 。以Linux的buddy system内存管理系统为例,allocator分配内存的时候通常就在块链表组中找比所需size稍大的块所在的那个链表中来分配,所以不太可能这个块能够满足2*size的要求。

0 0
原创粉丝点击