Java的hashCode()函数

来源:互联网 发布:机器人算法有哪些 编辑:程序博客网 时间:2024/05/01 10:02

这几天在看HashMap的源码时,发现这个Map的实现类里面大量的用到了hashCode的知识,以前也经常的听到这个函数,知道是Object类的方法,以前也看过关于这个函数的知识,但是没有做过记录,这次正好就做个记录,方便后面理解HashMap和LinkedHashMap源码。

hashCode

所谓的hashCode也就是hash码。

Hash是散列的意思,就是把任意长度的输入,通过散列算法变换成固定长度的输出,该输出就是散列值。关于散列值,有以下几个关键结论:
1. 如果散列表中存在和散列原始输入K相等的记录,那么K必定在f(K)的存储位置上
2. 不同关键字经过散列算法变换后可能得到同一个散列地址,这种现象称为碰撞
3. 如果两个Hash值不同(前提是同一Hash算法),那么这两个Hash值对应的原始输入必定不同

HashCode

什么是HashCode?总结几个关键点:
1. HashCode的存在主要是为了查找的快捷性,HashCode是用来在散列存储结构中确定对象的存储地址的
2. 如果两个对象equals相等,那么这两个对象的HashCode一定也相同
3. 如果对象的equals方法被重写,那么对象的HashCode方法也尽量重写.
4. 如果两个对象的HashCode相同,不代表两个对象就相同,只能说明这两个对象在散列存储结构中,存放于同一个位置。具体判断两个对象是不是相同,需要判断equals()函数。

HashCode有什么用

回到最关键的问题,HashCode有什么用?不妨举个例子:
1. 假设内存中有0 1 2 3 4 5 6 7 这8个位置,如果我有个字段叫做ID,那么我要把这个字段存放在以上8个位置之一,如果不用HashCode而任意存放,那么当查找时就需要到8个位置中去挨个查找
2. 使用HashCode则效率会快很多,把ID的HashCode%8,然后把ID存放在取得余数的那个位置,然后每次查找该类的时候都可以通过ID的HashCode%8求余数直接找到存放的位置了
3. 如果ID的HashCode%8算出来的位置上本身已经有数据了怎么办?这就取决于算法的实现了,比如ThreadLocal中的做法就是从算出来的位置向后查找第一个为空的位置,放置数据;HashMap的做法就是通过链式结构连起来。反正,只要保证放的时候和取的时候的算法一致就行了。
4. 如果ID的HashCode%8相等怎么办(这种对应的是第三点说的链式结构的场景)?这时候就需要定义equals了。先通过HashCode%8来判断类在哪一个位置,再通过equals来在这个位置上寻找需要的类。对比两个类的时候也差不多,先通过HashCode比较,假如HashCode相等再判断equals。如果两个类的HashCode都不相同,那么这两个类必定是不同的。

举个实际的例子:Set。我们知道Set里面的元素是不可以重复的,那么如何做到?Set是根据equals()方法来判断两个元素是否相等的。比方说Set里面已经有1000个元素了,那么第1001个元素进来的时候,最多可能调用1000次equals方法,如果equals方法写得复杂,对比的东西特别多,那么效率会大大降低。使用HashCode就不一样了,比方说HashSet,底层是基于HashMap实现的,先通过HashCode取一个模,这样一下子就固定到某个位置了,如果这个位置上没有元素,那么就可以肯定HashSet中必定没有和新添加的元素equals的元素,就可以直接存放了,都不需要比较;如果这个位置上有元素了,逐一比较,比较的时候先比较HashCode,HashCode都不同接下去都不用比了,肯定不一样,HashCode相等,再equals比较,没有相同的元素就存,有相同的元素就不存。如果原来的Set里面有相同的元素,只要HashCode的生成方式定义得好(不重复),不管Set里面原来有多少元素,只需要执行一次的equals就可以了。这样一来,实际调用equals方法的次数大大降低,提高了效率。

0 0
原创粉丝点击