Java 中的 hashcode一

来源：互联网发布：淘宝超低价宝贝集锦编辑：程序博客网时间：2024/06/04 01:07

哈希表这个数据结构我们都很清楚，而且在很多地方都会利用hash表来提高查询效率。在Java的Object类中有一个方法：

public native int hashCode();

根据这个方法的声明可知：该方法返回一个int 类型的值，并且是本地方法。

为什么在Object中会有这样一个方法，他有什么作用？

一、hashcode方法的作用

对于包含容器类型的程序设计语言，基本上都会涉及到hashCode。在Java中也一样，hashCode方法的作用是为了配合基于散列的集合一起正常运行，这样的散列集合包括HashSet、HashMap和Hashtable。

为什么这么说？考虑一种情况，当向集合中插入对象的时候，如何判断在集合中是否已经存在该对象？（注意：集合中不允许存在重复的元素）

也许大多数人都会想到调用 equals 方法类逐个去比较，这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据，如果采用equals 方法去逐一比较，效率必然

是一个问题。此时hashCode方法的作用就体现出来了，当集合要添加新对象的时候，先调用这个对象的hashCode方法，得到对应的hashCode值，实际上在HashMap的具体实现

中会用一个table保存已经存进去的对象的hashCode值，如果table中没有该hashCode值，他就可以直接存进去，不用再进行任何比较了；如果存在该hashCode值，就调用他的

equals方法与新元素进行比较，相同的话就不存了，不同就散列其他的地址，所以这里存在一个冲突解决的办法，这样一来实际调用equals方法的次数就大大降低了，说通俗点：

Java中的hashCode方法就是根据一定的规则将与对象相关的信息（比如对象存储的地址，对象的字段等）映射成一个值，这个数值称为散列值。

下面这段代码就是Java.util.HashMap的put方法的具体实现：

public V put(K paramK, V paramV)  {    if (paramK == null) {      return putForNullKey(paramV);    }    int i = hash(paramK);    int j = indexFor(i, this.table.length);    for (Entry localEntry = this.table[j]; localEntry != null; localEntry = localEntry.next)    {      Object localObject1;      if ((localEntry.hash == i) && (((localObject1 = localEntry.key) == paramK) || (paramK.equals(localObject1))))      {        Object localObject2 = localEntry.value;        localEntry.value = paramV;        localEntry.recordAccess(this);        return localObject2;      }    }    this.modCount += 1;    addEntry(i, paramK, paramV, j);    return null;  }

put方法是用来向HashMap中添加新元素的，从put方法的具体实现可知：会先调用hashCode方法得到该元素的hashCode值，然后查看table中是否有该hashCode值，如果

存在则调用equals方法重新确定是否存在该元素，如果存在，则更新value，否则将新的元素添加到HashMap中。从这里可以看出，hashCode方法的存在是为了减少equals

方法的调用次数，从而提高效率。

有些朋友误以为默认情况下，hashCode返回的就是对象的存储地址，事实上这种看法是不全面的，确实有些JVM在实现是直接返回对象的存储地址，但大多数并不是这样，

只能说可能与存储地址有一定关联、下面是HotSpot JVM中生成hash散列值的实现：

static inline intptr_t get_next_hash(Thread * Self, oop obj) {  intptr_t value = 0 ;  if (hashCode == 0) {     // This form uses an unguarded global Park-Miller RNG,     // so it's possible for two threads to race and generate the same RNG.     // On MP system we'll have lots of RW access to a global, so the     // mechanism induces lots of coherency traffic.     value = os::random() ;  } else  if (hashCode == 1) {     // This variation has the property of being stable (idempotent)     // between STW operations.  This can be useful in some of the 1-0     // synchronization schemes.     intptr_t addrBits = intptr_t(obj) >> 3 ;     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;  } else  if (hashCode == 2) {     value = 1 ;            // for sensitivity testing  } else  if (hashCode == 3) {     value = ++GVars.hcSequence ;  } else  if (hashCode == 4) {     value = intptr_t(obj) ;  } else {     // Marsaglia's xor-shift scheme with thread-specific state     // This is probably the best overall implementation -- we'll     // likely make this the default in future releases.     unsigned t = Self->_hashStateX ;     t ^= (t << 11) ;     Self->_hashStateX = Self->_hashStateY ;     Self->_hashStateY = Self->_hashStateZ ;     Self->_hashStateZ = Self->_hashStateW ;     unsigned v = Self->_hashStateW ;     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;     Self->_hashStateW = v ;     value = v ;  }  value &= markOopDesc::hash_mask;  if (value == 0) value = 0xBAD ;  assert (value != markOopDesc::no_hash, "invariant") ;  TEVENT (hashCode: GENERATE) ;  return value;}

该实现位于 hotspot\src\share\vm\runtime\synchronizer.cpp文件下。

因此有人会说，可以直接根据hashCode值判断俩个对象相等吗？肯定不可以。因为不同的对象可能会生成相同的hashCode值。虽然不能根据hashCode值判断俩个对象是否

相等，但是可以直接根据hashCode值判断俩个对象不等，如果俩个对象的hashCode值不等，则必定是俩个不同对象，如果要判断俩个对象是否相等，必须通过equals 方法。

也就是说，如果俩个对象调用equals方法得到的结果为true，则俩个对象的hashCode值必定相等；

如果equals 方法得到的结果为false，则俩个对象的hashCode值不一定相等；

如果俩个对象的hashCode值不等，则equals 方法得到的结果必定为false；

如果俩个对象的hashCode值相等；则equals 方法得到的结果未知。

未完。。。。

0 0