c++stl vector源码简析

来源:互联网 发布:免费下载图片软件 编辑:程序博客网 时间:2024/04/29 21:17

c++stl vector源码简析

vector是我们经常用的容易之一,我们现在来简单看一下vector的部分源码理解vector的行为以便我们在使用过程中更得心应手

首先看一下vector的alloc基类:

template <class _Tp, class _Allocator, bool _IsStatic>class _Vector_alloc_base {public:  typedef typename _Alloc_traits<_Tp, _Allocator>::allocator_type          allocator_type;  allocator_type get_allocator() const { return _M_data_allocator; }  _Vector_alloc_base(const allocator_type& __a)    : _M_data_allocator(__a), _M_start(0), _M_finish(0), _M_end_of_storage(0)   {}protected:  allocator_type _M_data_allocator;  _Tp* _M_start;  _Tp* _M_finish;  _Tp* _M_end_of_storage;  _Tp* _M_allocate(size_t __n)    { return _M_data_allocator.allocate(__n); }  void _M_deallocate(_Tp* __p, size_t __n)    { if (__p) _M_data_allocator.deallocate(__p, __n); }};

可以看到成员变量部分有start,finish ,end

首先说明一点vector是一个长度可变的容器,为了保证它在末尾插入的效率 它实际的存储空间是大于它的size的

size大小为start到finish,实际容量是start到end;

成员变量还有一个分配器,源码中有这样的注释

// Base class for ordinary allocators.

这是一个普通的分配器

源码中还定义了另一个类

// Specialization for allocators that have the property that we don't// actually have to store an allocator object.

在这个类里面是通过调用函数返回一个分配器对象 目前他们两个的区别和作用我还不了解 等以后了解过后再来补充

接下来是vector的基类

template <class _Tp, class _Alloc> class _Vector_base {public:  typedef _Alloc allocator_type;  allocator_type get_allocator() const { return allocator_type(); }  _Vector_base(const _Alloc&)    : _M_start(0), _M_finish(0), _M_end_of_storage(0) {}  _Vector_base(size_t __n, const _Alloc&)    : _M_start(0), _M_finish(0), _M_end_of_storage(0)   {    _M_start = _M_allocate(__n);    _M_finish = _M_start;    _M_end_of_storage = _M_start + __n;  }  ~_Vector_base() { _M_deallocate(_M_start, _M_end_of_storage - _M_start); }protected:  _Tp* _M_start;  _Tp* _M_finish;  _Tp* _M_end_of_storage;  typedef simple_alloc<_Tp, _Alloc> _M_data_allocator;  _Tp* _M_allocate(size_t __n)    { return _M_data_allocator::allocate(__n); }  void _M_deallocate(_Tp* __p, size_t __n)     { _M_data_allocator::deallocate(__p, __n); }};

可以看见有两种构造函数一种传入了分配空间的大小,一种没有传入大小

传入大小的构造函数和析构函数分别调用了下面的分配内存的函数和清空内存的函数

接下来就是vector类的,因为vecotor类代码较长我就拆解下来看

public:  typedef _Tp value_type;  typedef value_type* pointer;  typedef const value_type* const_pointer;  typedef value_type* iterator;  typedef const value_type* const_iterator;  typedef value_type& reference;  typedef const value_type& const_reference;  typedef size_t size_type;  typedef ptrdiff_t difference_type;  typedef typename _Base::allocator_type allocator_type;  allocator_type get_allocator() const { return _Base::get_allocator(); }#ifdef __STL_CLASS_PARTIAL_SPECIALIZATION  typedef reverse_iterator<const_iterator> const_reverse_iterator;  typedef reverse_iterator<iterator> reverse_iterator;#else /* __STL_CLASS_PARTIAL_SPECIALIZATION */  typedef reverse_iterator<const_iterator, value_type, const_reference,                            difference_type>  const_reverse_iterator;  typedef reverse_iterator<iterator, value_type, reference, difference_type>          reverse_iterator;#endif /* __STL_CLASS_PARTIAL_SPECIALIZATION */

看到typedef有我们熟悉的iterator和size_t等等 并且还有反向迭代器的的声明

接下来是我们常用的vector内置函数:

iterator begin() { return _M_start; }  const_iterator begin() const { return _M_start; }  iterator end() { return _M_finish; }  const_iterator end() const { return _M_finish; }  reverse_iterator rbegin()    { return reverse_iterator(end()); }  const_reverse_iterator rbegin() const    { return const_reverse_iterator(end()); }  reverse_iterator rend()    { return reverse_iterator(begin()); }  const_reverse_iterator rend() const    { return const_reverse_iterator(begin()); }  size_type size() const    { return size_type(end() - begin()); }  size_type max_size() const    { return size_type(-1) / sizeof(_Tp); }  size_type capacity() const    { return size_type(_M_end_of_storage - begin()); }  bool empty() const    { return begin() == end(); }  reference operator[](size_type __n) { return *(begin() + __n); }  const_reference operator[](size_type __n) const { return *(begin() + __n); }

这部分应该比较简单明了不需要过多地解释,我们继续往下看

  void _M_range_check(size_type __n) const {    if (__n >= this->size())      __stl_throw_range_error("vector");  }  reference at(size_type __n)    { _M_range_check(__n); return (*this)[__n]; }  const_reference at(size_type __n) const    { _M_range_check(__n); return (*this)[__n]; }

这里是范围检查函数如果范围超出size就抛出异常at函数就是取回下标为n的元素。不过这里我有个疑问,为什么返回(*this)[n]而不是 (*start)[n]并且this指针指向实例对象的位置,难道是在实例对象内部先存放的vector元素的数组? 这个问题求证后再来说明

下面是vector的构造函数:

  explicit vector(const allocator_type& __a = allocator_type())    : _Base(__a) {}  vector(size_type __n, const _Tp& __value,         const allocator_type& __a = allocator_type())     : _Base(__n, __a)    { _M_finish = uninitialized_fill_n(_M_start, __n, __value); }  explicit vector(size_type __n)    : _Base(__n, allocator_type())    { _M_finish = uninitialized_fill_n(_M_start, __n, _Tp()); }  vector(const vector<_Tp, _Alloc>& __x)     : _Base(__x.size(), __x.get_allocator())    { _M_finish = uninitialized_copy(__x.begin(), __x.end(), _M_start); }  template <class _InputIterator>  vector(_InputIterator __first, _InputIterator __last,         const allocator_type& __a = allocator_type()) : _Base(__a) {    typedef typename _Is_integer<_InputIterator>::_Integral _Integral;    _M_initialize_aux(__first, __last, _Integral());  }  vector(const _Tp* __first, const _Tp* __last,         const allocator_type& __a = allocator_type())    : _Base(__last - __first, __a)     { _M_finish = uninitialized_copy(__first, __last, _M_start); }

其中explicit是声明为显示的意思

不懂可以参考一下:http://www.cnblogs.com/ymy124/p/3632634.html

注意第四个构造函数 用一个vector去初始化另一个vector实际上是把原始vector的size个大小的数据copy到新的vector里面并且新的vector实际容量为size而不是原始vectror的容量

最后一个构造函数同理

我们继续看reserve函数的行为:

 void reserve(size_type __n) {    if (capacity() < __n) {      const size_type __old_size = size();      iterator __tmp = _M_allocate_and_copy(__n, _M_start, _M_finish);      destroy(_M_start, _M_finish);      _M_deallocate(_M_start, _M_end_of_storage - _M_start);      _M_start = __tmp;      _M_finish = __tmp + __old_size;      _M_end_of_storage = _M_start + __n;    }  }

可以看出当容量小于n时reserve函数是重新分配一个大小为n的内存并且把原来的数据复制过去然后把原来的内存(注意:这里大小是容量不是size)销毁

  // assign(), a generalized assignment member function.  Two  // versions: one that takes a count, and one that takes a range.  // The range version is a member template, so we dispatch on whether  // or not the type is an integer.  //assign有两个版本一个输入数字一个输入范围  范围的是一个模板所以不管参数是不是整型都可以调用 void vector<_Tp, _Alloc>::_M_fill_assign(size_t __n, const value_type& __val) {  if (__n > capacity()) {    vector<_Tp, _Alloc> __tmp(__n, __val, get_allocator());    __tmp.swap(*this);  }  else if (__n > size()) {    fill(begin(), end(), __val);    _M_finish = uninitialized_fill_n(_M_finish, __n - size(), __val);  }  else    erase(fill_n(begin(), __n, __val), end());}template <class _Tp, class _Alloc> template <class _InputIter>void vector<_Tp, _Alloc>::_M_assign_aux(_InputIter __first, _InputIter __last,                                        input_iterator_tag) {  iterator __cur = begin();  for ( ; __first != __last && __cur != end(); ++__cur, ++__first)    *__cur = *__first;  if (__first == __last)    erase(__cur, end());  else    insert(end(), __first, __last);}  template <class _InputIterator>  void assign(_InputIterator __first, _InputIterator __last) {    typedef typename _Is_integer<_InputIterator>::_Integral _Integral;    _M_assign_dispatch(__first, __last, _Integral());  }

关于assign还有很多函数这里就不一一列出了,继续分析我们常用的部分

接下来是front ,back ,push_back

  reference front() { return *begin(); }  const_reference front() const { return *begin(); }  reference back() { return *(end() - 1); }  const_reference back() const { return *(end() - 1); }  void push_back(const _Tp& __x) {    if (_M_finish != _M_end_of_storage) {      construct(_M_finish, __x);      ++_M_finish;    }    else      _M_insert_aux(end(), __x);  }  void push_back() {    if (_M_finish != _M_end_of_storage) {      construct(_M_finish);      ++_M_finish;    }    else      _M_insert_aux(end());  }

前面都很简单,不过没有参数的那个push_back是个什么鬼,我居然之前不知道有这个东西。那就来看一下吧,嗯,区别就是两个调用的construct参数不一样,可能会给一个默认值吧。可是找了半天居然这个文件的源码里面没找到construct,不管了,继续。

  void swap(vector<_Tp, _Alloc>& __x) {    __STD::swap(_M_start, __x._M_start);    __STD::swap(_M_finish, __x._M_finish);    __STD::swap(_M_end_of_storage, __x._M_end_of_storage);  }

swap就很简单了,只是把他们指针的值交换了一下

下面是insert

  iterator insert(iterator __position, const _Tp& __x) {    size_type __n = __position - begin();    if (_M_finish != _M_end_of_storage && __position == end()) {      construct(_M_finish, __x);      ++_M_finish;    }    else      _M_insert_aux(__position, __x);    return begin() + __n;  }  iterator insert(iterator __position) {    size_type __n = __position - begin();    if (_M_finish != _M_end_of_storage && __position == end()) {      construct(_M_finish);      ++_M_finish;    }    else      _M_insert_aux(__position);    return begin() + __n;  }

插入同push_back判断一下插入位置是不是end是end就执行push_back一样的操作,否则就正儿八经地插入进去

下面是pop_back,erase

  void pop_back() {    --_M_finish;    destroy(_M_finish);  }  iterator erase(iterator __position) {    if (__position + 1 != end())      copy(__position + 1, _M_finish, __position);    --_M_finish;    destroy(_M_finish);    return __position;  }  iterator erase(iterator __first, iterator __last) {    iterator __i = copy(__last, _M_finish, __first);    destroy(__i, _M_finish);    _M_finish = _M_finish - (__last - __first);    return __first;  }

pop_back简单吧,erase删除一个节点的时候是把position+1到finish的内存复制到position到finish-1

而erase删除范围的时候是把last+1到finish的内存复制到first到finish-last+first,说起来有点绕,你们画个图就明白了

继续resize和clear

  void resize(size_type __new_size, const _Tp& __x) {    if (__new_size < size())       erase(begin() + __new_size, end());    else      insert(end(), __new_size - size(), __x);  }  void resize(size_type __new_size) { resize(__new_size, _Tp()); }  void clear() { erase(begin(), end()); }

如果新的size小于当前的size就会裁剪为新的size并且把其余部分的数据清空撒删除

否则就会用x把未赋值的部分填充使得size等于new size

  template <class _InputIterator>  void _M_range_initialize(_InputIterator __first,                             _InputIterator __last, input_iterator_tag)  {    for ( ; __first != __last; ++__first)      push_back(*__first);  }

范围初始化就是按序把元素push_back(注意这里的inputiterator只能迭代一次所以要按序插入)再看下面

template <class _ForwardIterator>  void _M_range_initialize(_ForwardIterator __first,                           _ForwardIterator __last, forward_iterator_tag)  {    size_type __n = 0;    distance(__first, __last, __n);    _M_start = _M_allocate(__n);    _M_end_of_storage = _M_start + __n;    _M_finish = uninitialized_copy(__first, __last, _M_start);  }

这里就是forwarditerator可以反复使用 我们通过distance++遍历就可以预先知道长度然后用内存拷贝的方式初始化

下面是运算符重载

==

template <class _Tp, class _Alloc>inline bool operator==(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y){  return __x.size() == __y.size() &&         equal(__x.begin(), __x.end(), __y.begin());}

<

template <class _Tp, class _Alloc>inline bool operator<(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y){  return lexicographical_compare(__x.begin(), __x.end(),                                  __y.begin(), __y.end());}

其余的比较运算符重载函数都是调用这两个来运算的

如x>y等价于y

vector<_Tp,_Alloc>::operator=(const vector<_Tp, _Alloc>& __x){  if (&__x != this) {    const size_type __xlen = __x.size();    if (__xlen > capacity()) {      iterator __tmp = _M_allocate_and_copy(__xlen, __x.begin(), __x.end());      destroy(_M_start, _M_finish);      _M_deallocate(_M_start, _M_end_of_storage - _M_start);      _M_start = __tmp;      _M_end_of_storage = _M_start + __xlen;    }    else if (size() >= __xlen) {      iterator __i = copy(__x.begin(), __x.end(), begin());      destroy(__i, _M_finish);    }    else {      copy(__x.begin(), __x.begin() + size(), _M_start);      uninitialized_copy(__x.begin() + size(), __x.end(), _M_finish);    }    _M_finish = _M_start + __xlen;  }  return *this;}

先判断防止自我赋值

接下来比较大小如果容量小于x的size则重新分配内存

如果容量大于x的size直接复制并把多余的内存清空

如果容量大于x的size并且自己的size小于x的size则先把自己已初始化的内存复制在把未初始化的部分初始化

下面是一个指定位置插入元素的函数

template <class _Tp, class _Alloc>void vector<_Tp, _Alloc>::_M_insert_aux(iterator __position, const _Tp& __x){  if (_M_finish != _M_end_of_storage) {    construct(_M_finish, *(_M_finish - 1));    ++_M_finish;    _Tp __x_copy = __x;    copy_backward(__position, _M_finish - 2, _M_finish - 1);    *__position = __x_copy;  }  else {    const size_type __old_size = size();    //这里可以看出vector增长是指数增长的    const size_type __len = __old_size != 0 ? 2 * __old_size : 1;    iterator __new_start = _M_allocate(__len);    iterator __new_finish = __new_start;    __STL_TRY {      __new_finish = uninitialized_copy(_M_start, __position, __new_start);      construct(__new_finish, __x);      ++__new_finish;      __new_finish = uninitialized_copy(__position, _M_finish, __new_finish);    }    __STL_UNWIND((destroy(__new_start,__new_finish),                   _M_deallocate(__new_start,__len)));    destroy(begin(), end());    _M_deallocate(_M_start, _M_end_of_storage - _M_start);    _M_start = __new_start;    _M_finish = __new_finish;    _M_end_of_storage = __new_start + __len;  }}

这里我们看出在插入元素的时候如果内存不足则vector的增长模式为翻倍,和我之前在网上看到的不同

网上的说法是增长当前容量的一半也就是new storage=1.5 old storage这里可能是c++11对内存增长策略做出了调整 保留两种说法

再接下来就是jinsert函数的集中重载,代码较多但是原理都和其他函数差不多,这里就不再讲解了

到这里就把vector的源码简单过了一遍,其中掠过了很多细节,但了解大体对我们的提升也很大,以后有时间和精力再回过头来抠细节,相信对我们提升回更大。

0 0