Java、Android工程师必备知识（二）：hashCode（）方法的作用

来源：互联网发布：算法工程师的基本要求编辑：程序博客网时间：2024/06/06 02:05

前言

今天掐指一算，果然是一个写博客的良辰吉日，所以早上来就开始准备，之前我们聊了聊哈西算法的优点和好处，并且意识到如果没有哈西表，在我们庞大的内存里面查询一个对象，是有多么的蛋疼。

例如我们常用的HashMap，把一些不在连续的内存空间的对象放在一起，这个时候你再去想遍历，那不是要蛋疼的飞起？，所以今天我们先来看看hashCode方法。

正文

再次回忆起Java老师曾经跟我们说的话：如果要判断两个对象相等，一定要同时重写equals和hashCode方法。

老师说，同时重写才是真正意义上的相等，这个定义太抽象了，到底什么是真正意义？今天我们就老看一看。

首先看一下equals方法：

 public boolean equals(Object obj) {     return (this == obj); }

注释太长了，我就不贴了，直接简单的总结一下，想看英文的朋友可以直接去看源码：

== 这个判断符，是判断对象的内存地址是否相等，相等表示是同一个对象，而内存地址是我们无法改变的，所以简单的说equals和hashcode并没有什么卵关系，但是hashCode与内存地址可能有关系。

注释最重要的一句话：请注意，它一般是要重写hashCode方法，每当重写此方法时，以保持为相等对象必须hashCode相等的协议。

接下来再看看hashCode：

public int hashCode() {        int lockWord = shadow$_monitor_;        final int lockWordStateMask = 0xC0000000;  // Top 2 bits.        final int lockWordStateHash = 0x80000000;  // Top 2 bits are value 2 (kStateHash).        final int lockWordHashMask = 0x0FFFFFFF;  // Low 28 bits.        if ((lockWord & lockWordStateMask) == lockWordStateHash) {            return lockWord & lockWordHashMask;        }        return System.identityHashCode(this);    }

我发现百度百科对hashCode的注释翻译的不错，就直接用了：

public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表（例如 java.util.Hashtable 提供的哈希表）的性能。

在 Java 应用程序执行期间，在对同一对象多次调用 hashCode 方法时，必须一致地返回相同的整数，前提是将对象进行hashcode比较时所用的信息没有被修改。

如果根据 equals(Object) 方法，两个对象是相等的，那么对这两个对象中的每个对象调用 hashCode 方法都必须生成相同的整数结果，注：这里说的equals(Object) 方法是指Object类中未被子类重写过的equals方法。如果两个hashCode()返回的结果相等，则两个对象的equals方法不一定相等。

如果根据equals(java.lang.Object)方法，两个对象不相等，那么对这两个对象中的任一对象上调用 hashCode 方法不一定生成不同的整数结果。但是，程序员应该意识到，为不相等的对象生成不同整数结果可以提高哈希表的性能。

两边都要同时重写这两个方法，相同对象hashCode必须相同，这是默认协议，这样可以提高哈希表的效率。

所以只重写equals方法，一样可以达到判断是否是同一对象的目的，但是Java要求我们必须重写相应的hashCode方法，来维持两者之间的协议，从而提高在哈希表中的效率，虽然我们可以不去遵守。

每一个对象的hashCode都是不同的吗？

这个最经典的面试题之一了，答案很明显，肯定是否定的：不同对象也可能得到相同的hashCode。

首先不讨论我们自己去重写hashCode方法出现的hashCode相同的情况，Java内部会出现这样的情况吗？

大家可以试着去运行一个例子，在两个hashMap中，放入相同的key和value，那么这两个hashMap的hashCode是相同的，所以我们看一下hashMap的hashCode源码：

public int hashCode() {        int h = 0;        Iterator<Entry<K,V>> i = entrySet().iterator();        while (i.hasNext())            h += i.next().hashCode();        return h;    }

就是把内部的HashMapEntry的hashCode累加就得到了HashMap的hashCode，我们put进去的键值对都是放在hashMapEntry中的，这个之后我们再仔细的聊，那么就去看看HashMapEntry的hashCode方法：

public final int hashCode() {            return Objects.hashCode(getKey()) ^ Objects.hashCode(getValue());        }

就是把key的hashCode和value的hashCode进行运算，得到HashCode，如果key和value的hashCode相同，那么HashMapEntry的hashCode就会相同，也就是说HashMap的hashCode也会相同。

其实从理论上我们是可以理解这种hashCode的算法的道理，既然HashMap里面的内容是完全一样的，所以使用哪一个都是无所谓的，也就是理论他们是相等，给予他们相同的HashCode也是合情合理，但是两个HashMap是不同对象，equals就会返回false。

总结

最后来举个例子来加深一下理解，我们把hashCode看成宿舍门牌号，equals是我们具体的床位位置：

开学了，我们带着满怀激动的心情，梦想着美丽大方的学姐，来到大学宿舍报道：

首先为我分配宿舍（HashCode，室友和我相同）14号楼315房间，床位（内存地址）右上。

终于有一位身材高挑，气质美人，巨乳肥臀的学姐看上了我，准备到男生宿舍找我表白，一个一个宿舍的去找吗？别闹了，肯定不可能，所以首先她先找到我的宿舍门牌号（通过hashCode迅速定位），然后通过床位（例如四人间）上的床位卡，就可以找到我的位置了。

完美，首先我们要区别hashCode和内存地址，不要把他们当成相同的东西，hashCode仅仅是一种标识，我们尽量让他具有唯一性，但是并不保证这一点，标识可以帮助我们迅速找到他，提高查找的效率，仅此而已，如果具有相同标识有多人，之后再其他手段继续查找，例如哈希表嵌套哈希表，哈西表嵌套列表等等，总之效率才是最重要的。

ok，现在我们已经对hashCode又有了新的理解，接下来我们看看再hashMap中是如何使用hashCode的。

阅读全文

0 0