Java 中的 hashcode一

来源:互联网 发布:淘宝超低价宝贝集锦 编辑:程序博客网 时间:2024/06/04 01:07

  哈希表这个数据结构我们都很清楚,而且在很多地方都会利用hash表来提高查询效率。在Java的Object类中有一个方法:

public native int hashCode();

  根据这个方法的声明可知:该方法返回一个int 类型的值,并且是本地方法。

  为什么在Object中会有这样一个方法,他有什么作用?

一、hashcode方法的作用

   对于包含容器类型的程序设计语言,基本上都会涉及到hashCode。在Java中也一样,hashCode方法的作用是为了配合基于散列的集合一起正常运行,这样的散列集合包括HashSet、HashMap和Hashtable。

  为什么这么说?考虑一种情况,当向集合中插入对象的时候,如何判断在集合中是否已经存在该对象?(注意:集合中不允许存在重复的元素)

  也许大多数人都会想到调用 equals 方法类逐个去比较,这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据,如果采用equals 方法去逐一比较,效率必然

是一个问题。此时hashCode方法的作用就体现出来了,当集合要添加新对象的时候,先调用这个对象的hashCode方法,得到对应的hashCode值,实际上在HashMap的具体实现

中会用一个table保存已经存进去的对象的hashCode值,如果table中没有该hashCode值,他就可以直接存进去,不用再进行任何比较了;如果存在该hashCode值,就调用他的

equals方法与新元素进行比较,相同的话就不存了,不同就散列其他的地址,所以这里存在一个冲突解决的办法,这样一来实际调用equals方法的次数就大大降低了,说通俗点:

Java中的hashCode方法就是根据一定的规则将与对象相关的信息(比如对象存储的地址,对象的字段等)映射成一个值,这个数值称为散列值。

  下面这段代码就是Java.util.HashMap的put方法的具体实现:

public V put(K paramK, V paramV)  {    if (paramK == null) {      return putForNullKey(paramV);    }    int i = hash(paramK);    int j = indexFor(i, this.table.length);    for (Entry localEntry = this.table[j]; localEntry != null; localEntry = localEntry.next)    {      Object localObject1;      if ((localEntry.hash == i) && (((localObject1 = localEntry.key) == paramK) || (paramK.equals(localObject1))))      {        Object localObject2 = localEntry.value;        localEntry.value = paramV;        localEntry.recordAccess(this);        return localObject2;      }    }    this.modCount += 1;    addEntry(i, paramK, paramV, j);    return null;  }

  put方法是用来向HashMap中添加新元素的,从put方法的具体实现可知:会先调用hashCode方法得到该元素的hashCode值,然后查看table中是否有该hashCode值,如果

存在则调用equals方法重新确定是否存在该元素,如果存在,则更新value,否则将新的元素添加到HashMap中。从这里可以看出,hashCode方法的存在是为了减少equals

方法的调用次数,从而提高效率。

  有些朋友误以为默认情况下,hashCode返回的就是对象的存储地址,事实上这种看法是不全面的,确实有些JVM在实现是直接返回对象的存储地址,但大多数并不是这样,

只能说可能与存储地址有一定关联、下面是HotSpot JVM中生成hash散列值的实现:

static inline intptr_t get_next_hash(Thread * Self, oop obj) {  intptr_t value = 0 ;  if (hashCode == 0) {     // This form uses an unguarded global Park-Miller RNG,     // so it's possible for two threads to race and generate the same RNG.     // On MP system we'll have lots of RW access to a global, so the     // mechanism induces lots of coherency traffic.     value = os::random() ;  } else  if (hashCode == 1) {     // This variation has the property of being stable (idempotent)     // between STW operations.  This can be useful in some of the 1-0     // synchronization schemes.     intptr_t addrBits = intptr_t(obj) >> 3 ;     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;  } else  if (hashCode == 2) {     value = 1 ;            // for sensitivity testing  } else  if (hashCode == 3) {     value = ++GVars.hcSequence ;  } else  if (hashCode == 4) {     value = intptr_t(obj) ;  } else {     // Marsaglia's xor-shift scheme with thread-specific state     // This is probably the best overall implementation -- we'll     // likely make this the default in future releases.     unsigned t = Self->_hashStateX ;     t ^= (t << 11) ;     Self->_hashStateX = Self->_hashStateY ;     Self->_hashStateY = Self->_hashStateZ ;     Self->_hashStateZ = Self->_hashStateW ;     unsigned v = Self->_hashStateW ;     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;     Self->_hashStateW = v ;     value = v ;  }  value &= markOopDesc::hash_mask;  if (value == 0) value = 0xBAD ;  assert (value != markOopDesc::no_hash, "invariant") ;  TEVENT (hashCode: GENERATE) ;  return value;}

  该实现位于 hotspot\src\share\vm\runtime\synchronizer.cpp文件下。

  因此有人会说,可以直接根据hashCode值判断俩个对象相等吗?肯定不可以。因为不同的对象可能会生成相同的hashCode值。虽然不能根据hashCode值判断俩个对象是否

相等,但是可以直接根据hashCode值判断俩个对象不等,如果俩个对象的hashCode值不等,则必定是俩个不同对象,如果要判断俩个对象是否相等,必须通过equals 方法。

  也就是说,如果俩个对象调用equals方法得到的结果为true,则俩个对象的hashCode值必定相等;

  如果equals 方法得到的结果为false,则俩个对象的hashCode值不一定相等;

  如果俩个对象的hashCode值不等,则equals 方法得到的结果必定为false;

  如果俩个对象的hashCode值相等;则equals 方法得到的结果未知。


未完。。。。



 


0 0
原创粉丝点击