hashCode和equals详解

来源:互联网 发布:李昌钰蓝可儿 知乎 编辑:程序博客网 时间:2024/05/15 14:11

最近在重温java源码,一边看一边总结下,并且分享下自己的心得,共同学习,欢迎指点。这一篇说下hashCode和equals的源码中的一些注意点,争取把原理讲透彻:

源码

平时用hashMap多会用到get,put,iterator等方法,在这些方法里面都能发现hashCode()和equals的身影,它是生成hashMap的key的重要步骤,所以在这里做下深入并延伸下。
public native int hashCode();
这是Object中的方法,可以发现是个本地方法。但是许多类都会覆盖这个方法比如String,Integer,Long等基础类。所以不同的类有不同的散列方式,如Integer类只是单纯的返回了value;
public int hashCode() {return value; }

而String则会遍历每个字符,并且做【h = 31*h + val[off++]】这样一个运算,h=0,value为char数组。
public int hashCode() {int h = hash;        int len = count;if (h == 0 && len > 0) {    int off = offset;    char val[] = value;            for (int i = 0; i < len; i++) {                h = 31*h + val[off++];            }            hash = h;        }        return h;    }


而默认的本地方法实现方式是./hotspot/src/share/vm/runtime/synchronizer.cpp +530  get_next_hash方法
static inline intptr_t get_next_hash(Thread * Self, oop obj) {  intptr_t value = 0 ;  if (hashCode == 0) {     value = os::random() ;  } else  if (hashCode == 1) {     intptr_t addrBits = intptr_t(obj) >> 3 ;     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;  } else  if (hashCode == 2) {     value = 1 ;            // for sensitivity testing  } else  if (hashCode == 3) {     value = ++GVars.hcSequence ;  } else  if (hashCode == 4) {     value = intptr_t(obj) ;  } else {     unsigned t = Self->_hashStateX ;     t ^= (t << 11) ;     Self->_hashStateX = Self->_hashStateY ;     Self->_hashStateY = Self->_hashStateZ ;     Self->_hashStateZ = Self->_hashStateW ;     unsigned v = Self->_hashStateW ;     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;     Self->_hashStateW = v ;     value = v ;  }  value &= markOopDesc::hash_mask;  if (value == 0) value = 0xBAD ;  assert (value != markOopDesc::no_hash, "invariant") ;  TEVENT (hashCode: GENERATE) ;  return value;}
根据hashCode的不同情况做不同处理,如1的时候返回随机数,2则返回跟地址有关的一个数值。具体逻辑含义需要仔细看下jvm源码。

public boolean equals(Object obj) {return (this == obj);}
这是equals的源码,没有特殊,判断地址。


注意项:

1:一个好的hash算法和一个差的hash算法相差很多,好的hash算法可以使HashMap的get无限趋于O(1),而差的hash算法可以无限趋于O(n)。
好的hash算法为不同的对象产生不同的hashCode。
2:覆盖equals时候的约定:
自反性:对于任何非null的引用值x,x.equals(x)必须返回true。
对称行:对于非空x,y  当且仅当y.equals(x)返回true时,x.equals(y)必须返回true
传递性:对于任何非null的引用x,y,z,如果x.equals(y)返回true,并且y.equals(z)也返回true,那么x.equals(z)也必须返回true
一致性:如果对于非空x,y,并且没有修改,多次调用x.equals(y)必须相等
对于任何非null的x,x.equals(null)必须返回false
3:当覆盖equals时总要覆盖hashCode
考虑如下代码
public class MyInt {public int value ;MyInt(int value){this.value=value; }public boolean equals(Object o){if(this == o)return true;if(!(o instanceof MyInt))return false;MyInt mi = (MyInt)o;return (this.value == mi.value);}}

假设此时你想用这个类作为key与hashmap一起使用:
Map<MyInt,String> map = new HashMap<MyInt,String>();map.put(new MyInt(2), "test");System.out.println(map.get(new MyInt(2)));
如果你期望返回test那么就错了。你可能以为重写了equals方法,用hashmap就会对应到一个key上。不会的 。hashmap用的是hashcode进行散列的。两个不一样的对象在hashCode看来是不一样的。如果hashMap的hashCode恰巧也相等了,好吧恭喜你,中奖了。
e.hash == hash && ((k = e.key) == key || key.equals(k))

hashMap中的判断条件是这样的,因为MyInt重写了equals,又恰巧hashCode也相同,所以可以返回。但是千万不要抱这种侥幸心里。
所以通过以上分析,在重写equals方法后一定要重写HashCode
4:总结性的,没有特别必要的情况不要重写equals方法;如果一定要重写equals方法,那么一定要重写hashCode方法,并且要找一个效率高的hash算法。如果你不是一个大牛可以考虑看下《effective java》,里面介绍了一种比较通用的效率也很高的算法。如果是大牛,求分享算法。






0 0
原创粉丝点击