equals与hashCode

来源:互联网 发布:linux mysql 配置详解 编辑:程序博客网 时间:2024/06/17 20:18

默认情况下,Object中的hashCode() 返回对象的32位jvm内存地址。

重写equals():

public boolean equals(Object o) {        if(o == null)        {            return false;        }        if (o == this)        {           return true;        }        if (getClass() != o.getClass())        {            return false;        }        Employee e = (Employee) o;        return (this.getId() == e.getId());}

在子类中定义equals时首先调用超类的equals,如果检测失败就不可能相等。如果超类中的域都相等,就要比较子类中的实例域:

public class Manager extends Employee{<span style="white-space:pre"></span>public boolean equals(Object o){<span style="white-space:pre"></span>if(!super.equals(o))<span style="white-space:pre"></span>return false;<span style="white-space:pre"></span>Manager obj=(Manager) o;<span style="white-space:pre"></span>return this.bonus==obj.bonus;<span style="white-space:pre"></span>}}
许多人喜欢用if(!o instanceof Employee) return false;

例如employee.equals(manager),如果用instanceof,则会返回true,根据对称性原则manager.equals(employee)也要返回true,但会对Manager的equals方法有限制,需要忽略Manager的特殊性。即manager必须能使他与任何employee比较

使用getClass:只要对应的域相等,就认为两个对象相等。在经理与雇员的例子中,姓名、薪水等域都相等,但奖金不等,就认为他们不等

使用instanceof:假设使用雇员的id作为判断相等的标准,并且这个标准试用于所有子类。并应该讲Employee.equals()设置成final

所以,优化:

public boolean equals(Object o) {        if(o == null)//显式对象是否为空        {            return false;        }<pre name="code" class="javascript">if (o == this)//两个对象是引用同一个对象        {           return true;        }
//下面这两个根据需要选择其一 if (getClass() != o.getClass()) //是否属于同一类,如果equals语义在子类中有所改变就使用getClass { return false; }if(!o instanceof Employee)return false;//如果所有子类的语义都相等,则用instanceof,java 中的instanceof 运算符是用来在运行时指出对象是否是特定类的一个实例Employee e = (Employee) o; //对所有需要比较的域进行比较,基本类型用==,对象域用equalsreturn this.getId() == e.getId()&&this.fields.equals(e.fields);}




而HashSet等还需要重写hashCode,因为Set中不能有重复元素

public int hashCode() {    final int PRIME = 31;    int result = 1;    result = PRIME * result + getId();    return result; }

Apache Commons 包提供了两个非常优秀的类来生成hashCode()和equals()方法。看下面的程序。

import org.apache.commons.lang3.builder.EqualsBuilder;import org.apache.commons.lang3.builder.HashCodeBuilder;

@Override public int hashCode() {    final int PRIME = 31;    return new HashCodeBuilder(getId()%2==0?getId()+1:getId(), PRIME).           toHashCode(); }@Override public boolean equals(Object o) {    if (o == null)       return false;    if (o == this)       return true;    if (o.getClass() != getClass())       return false;    Employee e = (Employee) o;       return new EqualsBuilder().              append(getId(), e.getId()).              isEquals(); }

hash散列算法,使得在hash表中查找一个记录速度变O(1). 每个记录都有自己的hashcode,散列算法按照hashcode把记录放置在合适的位置. 在查找一个记录,首先先通过hashcode快速定位记录的位置.然后再通过equals来比较是否相等. 没有hashcode,一个一个比较过来,时间就变O(N)了。

一个set有一万个元素,再加入一个不同的新元素,则需要执行一万次的equal方法,这个效率太低了。所以采用先比较hashcode,由于是64位整数,可以建立索引查找。如果hashcode没找到,则必定不equal,加入set当中;即使找到了,也只需执行hashcode相同的几个元素的equal。这是一种性能设计。



hashCode()方法要求:

当对象状态未改变即不论第几次调用,那么多次调用返回的值必须相等
两个对象equals为true,则hashCode()的返回值一定相等;equals为false,hashCode()可能相等可能不等

两个对象hashCode()相等,equals可能相等可能不等;hashCode()不等,equals一定不相等

equals()方法要求:

自反性:x.equals(x)为true

对称性:若x.equals(y)为true,则y.equals(x)为true

传递性:若x.equals(y)为true,y.equals(z)true,则x.equals(z)true

一致性:若x、y没有变,不论多少次调用x.equals(y),结果都相同

对任何不为null的x,x.equals(null)为false




在一般的应用中你不需要了解hashCode的用法,但当你用到HashMap,HashSet等集合类时要注意下hashCode。
     你想通过一个object的key来拿HashMap的value,HashMap的工作方法是,通过你传入的object的hashcode在内存中找地址,当找到这个地址后再通过equals方法来比较这个地址中的内容是否和你原来放进去的一样,一样就取出value。

      hashCode()方法使用来提高Map里面的搜索效率的,Map会根据不同的hashCode()来放在不同的桶里面,Map在搜索一个对象的时候先通过hashCode()找到相应的桶,然后再根据equals()方法找到相应的对象.要正确的实现Map里面查找元素必须满足一下两个条件:
(1)当obj1.equals(obj2)为true时obj1.hashCode() == obj2.hashCode()必须为true
(2)当obj1.hashCode() != obj2.hashCode()为true时obj.equals(obj2)必须为false

1、 为什么要重载equal方法?

因为Object的equal方法默认是两个对象的引用的比较,意思就是指向同一内存,地址则相等,否则不相等;如果你现在需要利用对象里面的值来判断是否相等,则重载equal方法。

2、 为什么重载hashCode方法?

一般的地方不需要重载hashCode,只有当类需要放在HashTable、HashMap、HashSet等等hash结构的集合时才会重载hashCode,那么为什么要重载hashCode呢?就HashMap来说,好比HashMap就是一个大内存块,里面有很多小内存块,小内存块里面是一系列的对象,可以利用hashCode来查找小内存块hashCode%size(小内存块数量),所以当equal相等时,hashCode必须相等,而且如果是object对象,必须重载hashCode和equal方法。

3、 为什么equals()相等,hashCode就一定要相等,而hashCode相等,却不要求equals相等?

(1)、因为是按照hashCode来访问小内存块,所以hashCode必须相等

(2)、HashMap获取一个对象是比较key的hashCode相等和equal为true。


hashCode()方法在重写时,通常按照以下设计原则实现: 
1. 把某个非零常数值,例如17,保存在int类型变量result中。 
2. 对对象中每一个关键域f(指在equals()方法中考虑的每一个域)参照以下原则处理: 
- boolean型,计算(f ? 0 : 1); 
- byte、char、和short型,计算(int); 
- long型,计算(int)(f^(f>>>32)); 
- float型,计算Double.doubleToLongBits(double域名称)得到一个long域,再执行long的处理; 
- 对象类型,递归调用它的hashCode()方法; 
- 数组域,对其中每个元素调用他的hashCode()方法。 
3. 将上面计算的到的散列码保存到int型变量c,再执行result=37*result+c。 
4. 返回resul。

重写hashCode()方法的实例代码如下:

public class Person {    private String id;    private String name;    public String getId() {        return id;    }    public String getName() {        return name;    }    //覆盖equals方法    public boolean equals(Object o) {        if(o == null) {            return false;        }        if(this == o) {            return true;        }        if(this.getClass() != o.getClass()) {            return false;        }        Person p = (Person)o;        return id.equals(p.getId()) && name.equals(p.getName());    }}




先看下java源码中对hashcode()方法里面用到的变量的声明。也是String类中的变量

[java] view plaincopy

  1.    private final char value[];//定义一个字符数组value,用于存储字符串里面的字符,所以字符串不可变  
  2.   
  3.    private final int offset;//定义offset变量表示字符串第一个字符的下标索引  
  4.   
  5.    private final int count;//定义count变量表示字符串中字符的个数  
  6.   
  7.    private int hash; // Default to 0,默认值为0  

下面就是hashcode()方法的源码

[java] view plaincopy

  1.     public int hashCode() {  
  2.         int h = hash;  
  3.         if (h == 0 && count > 0) {  
  4.             int off = offset;  
  5.             char val[] = value;  
  6.             int len = count;  
  7.   
  8.             for (int i = 0; i < len; i++) {  
  9.                 h = 31*h + val[off++];  
  10.             }  
  11.             hash = h;  
  12.         }  
  13.         return h;  
  14.     }  

下面以cat为例。根据hashcode()源码中的循环部分的算法,计算一下cat的hashcode值

首先,c,a,t 的ascii码值分别为99,97,116;字符个数3,所以循环部分的代码变成如下所示

[java] view plaincopy
  1. public int hashCode() {  
  2.         int h = hash;  
  3.         if (h == 0 && count > 0) {  
  4.             int off = 0;  
  5.             char val[] = value;  
  6.             int len = 3;  
  7.   
  8.             for (int i = 0; i < 3; i++) {  
  9.                 h = 31*h + val[off++];  
  10.             }  
  11.             hash = h;  
  12.         }  
  13.         return h;  
  14.     }  

也就是总共3次循环

第一次循环:h1=31*0+val[0]=val[0]='c'=99

第二次循环:h2=31*h1+val[1]=31*99+'a'=31*99+97=3166

第三次循环:h3=31*h2+val[2]=31*3166+'t'=31*3166+116=98262

所以cat的hashcode值为98262

再用多项式的表示方法检验一下s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

99*31的平方+97*31+116结果也等于98262

所以计算正确。

看下面的例子,没有重写hashCode方法的类,直接返回32位对象在JVM中的地址;Long类重写了hashCode方法,返回计算出的hashCode数值:

public class ComHashcode{    public static void main(String[] args) throws Exception {        ComHashcode a = new ComHashcode();        ComHashcode b = new ComHashcode();        System.out.println(a.hashCode());    //870919696        System.out.println(b.hashCode());    //298792720                Long num1 = new Long(8);        Long num2 = new Long(8);        System.out.println(num1.hashCode());    //8        System.out.println(num2.hashCode());    //8    }}


[plain] view plaincopy在CODE上查看代码片派生到我的代码片
  1. hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。   
  2.   
  3. hashCode 的常规协定是:   
  4. 在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。   
  5. 如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。   
  6. 以下情况不 是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。   
  7. 实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)   
  8.   
  9. 当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。  


以上这段官方文档的定义,我们可以抽出成以下几个关键点:

1、hashCode的存在主要是用于查找的快捷性,如Hashtable,HashMap等,hashCode是用来在散列存储结构中确定对象的存储地址的;

2、如果两个对象相同,就是适用于equals(java.lang.Object) 方法,那么这两个对象的hashCode一定要相同;

3、如果对象的equals方法被重写,那么对象的hashCode也尽量重写,并且产生hashCode使用的对象,一定要和equals方法中使用的一致,否则就会违反上面提到的第2点;

4、两个对象的hashCode相同,并不一定表示两个对象就相同,也就是不一定适用于equals(java.lang.Object) 方法,只能够说明这两个对象在散列存储结构中,如Hashtable,他们“存放在同一个篮子里”


再归纳一下就是hashCode是用于查找使用的,而equals是用于比较两个对象的是否相等的。以下这段话是从别人帖子回复拷贝过来的:

[plain] view plaincopy
  1. 1.hashcode是用来查找的,如果你学过数据结构就应该知道,在查找和排序这一章有  
  2. 例如内存中有这样的位置  
  3. 0  1  2  3  4  5  6  7    
  4. 而我有个类,这个类有个字段叫ID,我要把这个类存放在以上8个位置之一,如果不用hashcode而任意存放,那么当查找时就需要到这八个位置里挨个去找,或者用二分法一类的算法。  
  5. 但如果用hashcode那就会使效率提高很多。  
  6. 我们这个类中有个字段叫ID,那么我们就定义我们的hashcode为ID%8,然后把我们的类存放在取得得余数那个位置。比如我们的ID为9,9除8的余数为1,那么我们就把该类存在1这个位置,如果ID是13,求得的余数是5,那么我们就把该类放在5这个位置。这样,以后在查找该类时就可以通过ID除 8求余数直接找到存放的位置了。  
  7.   
  8. 2.但是如果两个类有相同的hashcode怎么办那(我们假设上面的类的ID不是唯一的),例如9除以8和17除以8的余数都是1,那么这是不是合法的,回答是:可以这样。那么如何判断呢?在这个时候就需要定义 equals了。  
  9. 也就是说,我们先通过 hashcode来判断两个类是否存放某个桶里,但这个桶里可能有很多类,那么我们就需要再通过 equals 来在这个桶里找到我们要的类。  
  10. 那么。重写了equals(),为什么还要重写hashCode()呢?  
  11. 想想,你要在一个桶里找东西,你必须先要找到这个桶啊,你不通过重写hashcode()来找到桶,光重写equals()有什么用啊  



附加hashcode和equals的标准写法:

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. @Override  
  2. public int hashCode() {  
  3.     final int prime = 31;  
  4.     int result = 1;  
  5.     result = prime * result + ((name == null) ? 0 : name.hashCode());  
  6.     result = prime * result + ((address == null) ? 0 : address.hashCode());  
  7.     result = prime * result + ((number == null) ? 0 : number.hashCode());  
  8.     return result;  
  9. }  
  10.   
  11. @Override  
  12. public boolean equals(Object obj) {  
  13.     if (this == obj) {  
  14.         return true;  
  15.     }  
  16.     if (obj == null) {  
  17.         return false;  
  18.     }  
  19.     if(getClass() != obj.getClass()) {  
  20.         return false;  
  21.     }  
  22.     Person p = (Person)obj;  
  23.       
  24.     if (name == null) {  
  25.         if(p.name != null) {  
  26.             return false;  
  27.         }  
  28.     } else if (!name.equals(p.name)) {  
  29.         return false;  
  30.     }  
  31.       
  32.     if (address == null) {  
  33.         if (p.address != null) {  
  34.             return false;  
  35.         }  
  36.     } else if (!address.equals(p.address)) {  
  37.         return false;  
  38.     }  
  39.       
  40.     if (number == null) {  
  41.         if (p.number != null) {  
  42.             return false;  
  43.         }  
  44.     } else if (!number.equals(p.number)) {  
  45.         return false;  
  46.     }  
  47.       
  48.     return true;  
  49. }  




if (o == this)//两个对象是引用同一个对象        {           return true;        }
0 0