HashCode与equals

来源:互联网 发布:tk cf域名注册 编辑:程序博客网 时间:2024/06/03 21:13

首先,想要明白hashCode的作用,必须要先知道Java中的集合。  

总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。 前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。

那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢? 这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。 也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。

于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。 哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。

这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。 如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了, 就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。 所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。

所以,Java对于eqauls方法和hashCode方法是这样规定的:
1、如果两个对象相同,那么它们的hashCode值一定要相同;
2、如果两个对象的hashCode相同,它们并不一定相同

何时需要重写equals()

当一个类有自己特有的“逻辑相等”概念(不同于对象身份的概念)。

设计equals()

[1]使用instanceof操作符检查“实参是否为正确的类型”。
[2]对于类中的每一个“关键域”,检查实参中的域与当前对象中对应的域值。
[2.1]对于非float和double类型的原语类型域,使用==比较;
[2.2]对于对象引用域,递归调用equals方法;
[2.3]对于float域,使用Float.floatToIntBits(afloat)转换为int,再使用==比较;
[2.4]对于double域,使用Double.doubleToLongBits(adouble) 转换为int,再使用==比较;
[2.5]对于数组域,调用Arrays.equals方法。

当改写equals()的时候,总是要改写hashCode()

根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode方法,它们仅仅是两个对象。因此,违反了“相等的对象必须具有相等的散列码”。

设计hashCode()

[1]把某个非零常数值,例如17,保存在int变量result中;
[2]对于对象中每一个关键域f(指equals方法中考虑的每一个域):
[2.1]boolean型,计算(f ? 0 : 1);
[2.2]byte,char,short型,计算(int);
[2.3]long型,计算(int) (f ^ (f>>>32));
[2.4]float型,计算Float.floatToIntBits(afloat);
[2.5]double型,计算Double.doubleToLongBits(adouble)得到一个long,再执行[2.3];
[2.6]对象引用,递归调用它的hashCode方法;
[2.7]数组域,对其中每个元素调用它的hashCode方法。
[3]将上面计算得到的散列码保存到int变量c,然后执行 result=37*result+c;
[4]返回result。

示例

package com.zj.unit;import java.util.Arrays;public class Unit {    private short ashort;    private char achar;    private byte abyte;    private boolean abool;    private long along;    private float afloat;    private double adouble;    private Unit aObject;    private int[] ints;    private Unit[] units;    public boolean equals(Object o) {       if (!(o instanceof Unit))           return false;       Unit unit = (Unit) o;       return unit.ashort == ashort              && unit.achar == achar              && unit.abyte == abyte              && unit.abool == abool              && unit.along == along              && Float.floatToIntBits(unit.afloat) == Float                     .floatToIntBits(afloat)              && Double.doubleToLongBits(unit.adouble) == Double                     .doubleToLongBits(adouble)              && unit.aObject.equals(aObject)&& equalsInts(unit.ints)              && equalsUnits(unit.units);    }    private boolean equalsInts(int[] aints) {       return Arrays.equals(ints, aints);    }    private boolean equalsUnits(Unit[] aUnits) {       return Arrays.equals(units, aUnits);    }    public int hashCode() {       int result = 17;       result = 37 * result + (int) ashort;       result = 37 * result + (int) achar;       result = 37 * result + (int) abyte;       result = 37 * result + (abool ? 0 : 1);       result = 37 * result + (int) (along ^ (along >>> 32));       result = 37 * result + Float.floatToIntBits(afloat);       long tolong = Double.doubleToLongBits(adouble);       result = 37 * result + (int) (tolong ^ (tolong >>> 32));       result = 37 * result + aObject.hashCode();       result = 37 * result + intsHashCode(ints);       result = 37 * result + unitsHashCode(units);       return result;    }    private int intsHashCode(int[] aints) {       int result = 17;       for (int i = 0; i < aints.length; i++)           result = 37 * result + aints[i];       return result;    }    private int unitsHashCode(Unit[] aUnits) {       int result = 17;       for (int i = 0; i < aUnits.length; i++)           result = 37 * result + aUnits[i].hashCode();       return result;    }}

为何要选择37和17做基数?
http://blog.csdn.net/steveguoshao/article/details/12576849
这篇文章写的是31啊。。。

0 0
原创粉丝点击