STL中的set和map

来源：互联网发布：万税知乎编辑：程序博客网时间：2024/05/21 06:47

原文：http://blog.csdn.net/terence1212/article/details/52487656

STL的set和map都是基于红黑树实现的，和stack和queue都是基于deque一样，它们仅仅是调用了RBTree提供的接口函数，然后进行外层封装即可。本篇博客理解起来比较轻松，set和map的源代码也不多，大家可以慢慢“品味”。另外，还会介绍multiset和multimap这两个容器，并给出它们的区别和应用等。还等什么呢？走吧，带你理解理解set和map吧！

set

set是一种关联式容器，其特性如下：

set以RBTree作为底层容器

所得元素的只有key没有value，value就是key
不允许出现键值重复
所有的元素都会被自动排序
不能通过迭代器来改变set的值，因为set的值就是键

针对这五点来说，前四点都不用再多作说明，第五点需要做一下说明。如果set中允许修改键值的话，那么首先需要删除该键，然后调节平衡，在插入修改后的键值，再调节平衡，如此一来，严重破坏了set的结构，导致iterator失效，不知道应该指向之前的位置，还是指向改变后的位置。所以STL中将set的迭代器设置成const，不允许修改迭代器的值。

set的数据结构

// 比较器默认采用less，内部按照升序排列，配置器默认采用alloctemplate <class Key, class Compare = less<Key>, class Alloc = alloc>class set{public:  //  在set中key就是value, value同时也是key  typedef Key key_type;  typedef Key value_type;  // 用于比较的函数  typedef Compare key_compare;  typedef Compare value_compare;private:  // 内部采用RBTree作为底层容器  typedef rb_tree<key_type, value_type,                  identity<value_type>, key_compare, Alloc> rep_type;  rep_type t;   // t为内部RBTree容器public:  // 用于提供iterator_traits<I>支持  typedef typename rep_type::const_pointer pointer;              typedef typename rep_type::const_pointer const_pointer;  typedef typename rep_type::const_reference reference;          typedef typename rep_type::const_reference const_reference;  typedef typename rep_type::difference_type difference_type;   // 设置成const迭代器，set的键值不允许修改  typedef typename rep_type::const_iterator iterator;            typedef typename rep_type::const_iterator const_iterator;  // 反向迭代器  typedef typename rep_type::const_reverse_iterator reverse_iterator;  typedef typename rep_type::const_reverse_iterator const_reverse_iterator;  typedef typename rep_type::size_type size_type;  iterator begin() const { return t.begin(); }  iterator end() const { return t.end(); }  reverse_iterator rbegin() const { return t.rbegin(); }  reverse_iterator rend() const { return t.rend(); }  bool empty() const { return t.empty(); }  size_type size() const { return t.size(); }  size_type max_size() const { return t.max_size(); }  // 返回用于key比较的函数  key_compare key_comp() const { return t.key_comp(); }  // 由于set的性质, value比较和key使用同一个比较函数  value_compare value_comp() const { return t.key_comp(); }  // 声明了两个友元函数，重载了==和<操作符  friend bool operator== __STL_NULL_TMPL_ARGS (const set&, const set&);  friend bool operator< __STL_NULL_TMPL_ARGS (const set&, const set&);  // ...}

set的构造函数

set提供了如下几个构造函数用于初始化一个set

// 注：下面相关函数都在set类中定义，为了介绍方便才抽出来单独讲解// 空构造函数，初始化一个空的setset() : t(Compare()) {}// 支持自定义比较器，如set<int,greater<int> > myset的初始化explicit set(const Compare& comp) : t(comp) {}// 实现诸如set<int> myset(anotherset.begin(),anotherset.end())这样的初始化template <class InputIterator>set(InputIterator first, InputIterator last): t(Compare()) { t.insert_unique(first, last); }// 支持自定义比较器的初始化操作template <class InputIterator>set(InputIterator first, InputIterator last, const Compare& comp): t(comp) { t.insert_unique(first, last); }// 以另一个set来初始化set(const set<Key, Compare, Alloc>& x) : t(x.t) {}// 赋值运算符函数set<Key, Compare, Alloc>& operator=(const set<Key, Compare, Alloc>& x){    t = x.t;    return *this;}

set的操作函数

insert

插入函数，调用RBTree的插入函数即可

typedef  pair<iterator, bool> pair_iterator_bool;// 由于set不允许键值重复，所以必须调用RBTree的insert_unique函数// second表示插入操作是否成功pair<iterator,bool> insert(const value_type& x){  pair<typename rep_type::iterator, bool> p = t.insert_unique(x);  return pair<iterator, bool>(p.first, p.second);}// 在position处插入元素, 但是position仅仅是个提示, 如果给出的位置不能进行插入,// STL会进行查找, 这会导致很差的效率iterator insert(iterator position, const value_type& x){  typedef typename rep_type::iterator rep_iterator;  return t.insert_unique((rep_iterator&)position, x);}// 将[first，last)区间内的元素插入到set中template <class InputIterator>void insert(InputIterator first, InputIterator last){  t.insert_unique(first, last);}

erase

擦除函数，用于擦除单个元素或者区间内的元素，直接调用RBTree的函数即可

// 擦除指定位置的元素, 会导致内部的红黑树重新排列void erase(iterator position){  typedef typename rep_type::iterator rep_iterator;  t.erase((rep_iterator&)position);}// 会返回擦除元素的个数, 其实就是标识set内原来是否有指定的元素size_type erase(const key_type& x){  return t.erase(x);}// 擦除指定区间的元素, 会导致红黑树有较大变化void erase(iterator first, iterator last){  typedef typename rep_type::iterator rep_iterator;  t.erase((rep_iterator&)first, (rep_iterator&)last);}

clean清除整个set容器，直接调用RBTree的clean函数即可  void clear() { t.clear(); }1find查找函数，RBTree也提供了，直接调用即可  // 查找指定的元素  iterator find(const key_type& x) const { return t.find(x); }count查找制定元素的个数  // 返回指定元素的个数, set不允许键值重复，其实就是测试元素是否在set中  size_type count(const key_type& x) const { return t.count(x); }重载操作符set重载了==和<操作符，基本上都是调用RBTree的接口函数即可，如下所示：template <class Key, class Compare, class Alloc>inline bool operator==(const set<Key, Compare, Alloc>& x,                       const set<Key, Compare, Alloc>& y) {  return x.t == y.t;}template <class Key, class Compare, class Alloc>inline bool operator<(const set<Key, Compare, Alloc>& x,                      const set<Key, Compare, Alloc>& y) {  return x.t < y.t;}其他操作函数// 返回小于当前元素的第一个可插入的位置iterator lower_bound(const key_type& x) const{  return t.lower_bound(x);}// 返回大于当前元素的第一个可插入的位置iterator upper_bound(const key_type& x) const{  return t.upper_bound(x);}// 返回与指定键值相等的元素区间pair<iterator,iterator> equal_range(const key_type& x) const{  return t.equal_range(x);}

multiset

multiset相对于set来说，区别就是multiset允许键值重复，在multiset中调用的是RBTree的insert_equal函数，其他的基本与set相同。

其他的就不赘述了，下面列举一下跟set不同的地方：

// 初始化函数，// 注意！！！！插入操作采用的是RBTree的insert_equal，而不是insert_uniquetemplate <class InputIterator>multiset(InputIterator first, InputIterator last)  : t(Compare()) { t.insert_equal(first, last); }template <class InputIterator>multiset(InputIterator first, InputIterator last, const Compare& comp)  : t(comp) { t.insert_equal(first, last); }// 插入元素, 注意, 插入的元素key允许重复iterator insert(const value_type& x){  return t.insert_equal(x);}// 在position处插入元素, 但是position仅仅是个提示, 如果给出的位置不能进行插入,// STL会进行查找, 这会导致很差的效率iterator insert(iterator position, const value_type& x){  typedef typename rep_type::iterator rep_iterator;  return t.insert_equal((rep_iterator&)position, x);}

map

map和set一样是关联式容器，它们的底层容器都是红黑树，区别就在于map的值不作为键，键和值是分开的。它的特性如下：

map以RBTree作为底层容器
所有元素都是键+值存在
不允许键重复
所有元素是通过键进行自动排序的
map的键是不能修改的，但是其键对应的值是可以修改的

在map中，一个键对应一个值，其中键不允许重复，不允许修改，但是键对应的值是可以修改的，原因可以看上面set中的解释。下面就一起来看看STL中的map的源代码。

// 默认比较器为less<key>,元素按照键的大小升序排列template <class Key, class T, class Compare = less<Key>, class Alloc = alloc>class map {public:  typedef Key key_type;                         // key类型  typedef T data_type;                          // value类型  typedef T mapped_type;  typedef pair<const Key, T> value_type;        // 元素类型, 要保证key不被修改  typedef Compare key_compare;                  // 用于key比较的函数private:  // 内部采用RBTree作为底层容器  typedef rb_tree<key_type, value_type,                  identity<value_type>, key_compare, Alloc> rep_type;  rep_type t; // t为内部RBTree容器public:  // 用于提供iterator_traits<I>支持  typedef typename rep_type::const_pointer pointer;              typedef typename rep_type::const_pointer const_pointer;  typedef typename rep_type::const_reference reference;          typedef typename rep_type::const_reference const_reference;  typedef typename rep_type::difference_type difference_type;   // 注意：这里与set不一样，map的迭代器是可以修改的  typedef typename rep_type::iterator iterator;            typedef typename rep_type::const_iterator const_iterator;  // 反向迭代器  typedef typename rep_type::const_reverse_iterator reverse_iterator;  typedef typename rep_type::const_reverse_iterator const_reverse_iterator;  typedef typename rep_type::size_type size_type;  // 常规的返回迭代器函数  iterator begin() { return t.begin(); }  const_iterator begin() const { return t.begin(); }  iterator end() { return t.end(); }  const_iterator end() const { return t.end(); }  reverse_iterator rbegin() { return t.rbegin(); }  const_reverse_iterator rbegin() const { return t.rbegin(); }  reverse_iterator rend() { return t.rend(); }  const_reverse_iterator rend() const { return t.rend(); }  bool empty() const { return t.empty(); }  size_type size() const { return t.size(); }  size_type max_size() const { return t.max_size(); }  // 返回用于key比较的函数  key_compare key_comp() const { return t.key_comp(); }  // 由于map的性质, value和key使用同一个比较函数, 实际上我们并不使用value比较函数  value_compare value_comp() const { return value_compare(t.key_comp()); }  // 注意: 这里有一个常见的陷阱, 如果访问的key不存在, 会新建立一个  T& operator[](const key_type& k)  {    return (*((insert(value_type(k, T()))).first)).second;  }  // 重载了==和<操作符，后面会有实现  friend bool operator== __STL_NULL_TMPL_ARGS (const map&, const map&);  friend bool operator< __STL_NULL_TMPL_ARGS (const map&, const map&);}

multimap和map的关系就跟multiset和set的关系一样，multimap允许键的值相同，因此在插入操作的时候用到insert_equal()，除此之外，基本上与map相同。

总结

总的来说，这四类容器仅仅只是在RBTree上进行了一层封装，首先，set和map的区别就在于键和值是否相同，set中将值作为键，支持STL的提供的一些交集、并集和差集等运算；map的键和值不同，每个键都有自己的值，键不能重复，但是值可以重复。

multimap和multiset就在map和set的基础上，使他们的键可以重复，除此之外基本等同

阅读全文

0 0