STL中改变map的默认比较方式

来源:互联网 发布:mysql count 性能 编辑:程序博客网 时间:2024/05/17 07:41

大家知道,STL中的map底层是用红黑树实现的,其泛型原型如下:

template <class _Key, class _Tp, class _Compare, class _Alloc>class map {              ......              }

其中_Key表示比较的键(key),_Tp表示值(value),_Compare表示比较方式,_Alloc表示内存分配器。

一般我们在写map的时候总是类似于写出如下代码:

map<int, char*>* my_map = new map<int, char*>;

表示键为int类型,值为字符串类型。这里之所以不对_Compare和_Alloc加以限制,是因为int是C++内置类型,有默认比较方式,_Alloc也采用STL的

默认的内存方案。但是如果有如下结构体:

struct Term{    char* str;    int   hashCode;};

现在我们要将该Term作为map的键,并假设Term所对应的值为Term出现的频率(int型),那么能不能这样写:

map<Term, int>* my_map = new map<Term, int>;

显然这样写map是无法正常运作的,原因是struct Term并非C++的内置类型,默认不知道如何去比较它。这时候就需要修改map的默认比较方式:

复制代码
template <class T>struct Compare{  int operator()(const T& x, const T& k) const{    if(x.hashCode >= k.hashCode) return 0;    else return 1;  }};
复制代码

这里采用的是函数对象(function object)的方式去加载map的比较方式,表示使用Term的hashCode作为比较方式,以对红黑树进行查找、插入等操作。

这样我们就可以把map写成下面的形式:

map<Term, int, Compare<Term> >* my_map = new map<Term, int, Compare<Term> >;

这样map就可以正常运作了,比如进行插入操作:

Term my_term;my_map->insert(make_pair(my_term, 1));

但是上面的struct Compare为什么要写成这样的形式,写成这样行不行:

复制代码
template <class T>struct Compare{  int operator()(const T& x, const T& k) const{    if(x.hashCode >= k.hashCode) return 1;    else return 0;  }};
复制代码

这是不行的。为什么不行,首先来看一看map中find的源代码:

复制代码
template <class _Key, class _Value, class _KeyOfValue,           class _Compare, class _Alloc>typename _Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::iterator _Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::find(const _Key& __k){  _Link_type __y = _M_header;      // Last node which is not less than __k.   _Link_type __x = _M_root();      // Current node.   while (__x != 0)     if (!_M_key_compare(_S_key(__x), __k))      __y = __x, __x = _S_left(__x);    else      __x = _S_right(__x);  iterator __j = iterator(__y);     return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;}
复制代码

上面的代码中_M_key_compare就表示我们的那个比较函数对象,_S_key(__x)表示取__x节点的key,并和__k比较。

if (!_M_key_compare(_S_key(__x), __k))      __y = __x, __x = _S_left(__x);

表示如果_S_key(__x) >= __k即,如果节点的key大于或等于查找的key那么就__x就等于它的左子节点,否则就为右子节点。

但为什么等于的时候不直接返回呢,却在继续查找?举个例子来说:

如果我们要查找key为10的节点是否在树中时,首先从根节点开始查找,由于8<10,这时_M_key_compare返回1,那么此时,

转向root的右子树,然后由于10==10,_M_key_compare返回0,这时转向左子树,但左子树是空的,循环停止。

 return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;

由于此时__j表示"10"这个节点(其实是个迭代器),由于__k为10,而__j._M_node的key为10,_M_key_compare返回0,有三元运算符可知,

此时返回是__j,即表示找到了。因此我们的比较函数对象必需写成:

当节点键大于等于所要查找或插入的键时,返回0(false),反之为1(true),这是由内部源代码所决定的。




from: http://www.cnblogs.com/zjfdlut/archive/2011/08/12/2135698.html