HashSet中equals()与hashCode()方法的重写

来源：互联网发布：老舍的人品知乎编辑：程序博客网时间：2024/04/20 07:29

大家都知道，集合是一种容器，生活中容器就是用来装东西的，那么在计算机语言中的容器就是用来装数据的。在生活中，我们有各式各样的容器，不同容器有不同的优缺点。比如可以用篮子来装馒头，也可以用塑料袋装馒头。用篮子来装呢比较干净，如果盖上布就能保温，而用塑料袋既便宜又轻便，大家买馒头时，由卖家提供。在Java类库中提供了很多衫的集合类，他们是通过接口（Collection、Map）组织起来的。这些集合各有特点，List中的数据有索引，访问方便，Set 中的数据不允许重复，Map中的数据是以键-值对的形式进行存储的。由于这不是这篇文章的重点，所以不在过多解释。

       对于Set接口的实现类HashSet，它是按照哈希算法来存取集合中的对象，并且因为其继承了Set接口，所以不允许插入相同的数据。那么它如何来保证不插入相同的数据，这就要使用到equals()和hashCode()方法了。在我们往HashSet里面添加对象（add()方法里的参数都是对象）的时候，在Add()的方法内部，它首先调用该对象的hashCode()方法（hashCode方法用来计算该对象的哈希码），如果返回的哈希码与集合已存在对象的哈希码不一致，则add()方法认定该对象没有与集合中的其它对象重复，那么该对象将被添加进集合中。如果hashCode()方法返回的哈希码与集合已存在对象的哈希码一致，那么将调用该对象的equals方法，进一步判断其是否为同一对象。之所以在进行了hashcode（哈希码）的比较后，又调用equals()方法进行比较，是因为虽然HashSet采用的是通过hashcode来区分对象，但是在java中hashcode会重码（即不同的对象，其hashcode可能会相同，可以参看附例1.1）。通过hashCode()和equals()方法就能快速且准确的判断在集合中是否存在与添加对象相同的对象。

       在如下的例子中，我向集合set1中添加了两个相同的对象1，因为1为类Integer的对象，所以当我调用add()方法插入第2个1时，它会自动调用Integer对象的hashCode()和equals()方法。Integer对象的这两个方法是重写其父类Object的。在JavaAPI中Integer的hashCode()方法的返回值是这样描述的：该对象的哈希码值，它的值即为该 Integer 对象表示的基本 int 类型的数值。很显示第一次添加的1与第2添加的1它们的hashCode()是相同的。Integer的equals()方法是这样描述的：比较此对象与指定对象，当且仅当参数不为 null，并且是一个与该对象包含相同 int 值的 Integer 对象时，结果为 true。1与1的int值也是相同的，所以它们equals()为true。最终判定他们为相同对象，无法插入第2个1。

import java.util.HashSet;

import java.util.Iterator;

import java.util.Set;

public class TestHashSet1 {

    public static void main(String[] args) {

       Set<Integer> set = new HashSet<Integer>();

       set.add(1);

       set.add(1);



       Iterator<Integer> it = set.iterator();

       while(it.hasNext()){

           System.out.println(it.next());

       }

    }

}

    下面我们来谈一下hashCode()与equals()方法的重写。首先我们先看一个例子。

import java.util.HashSet;

import java.util.Iterator;

import java.util.Set;

class Person {

    private String name;

    private int id;

    Person(String name,int id) {

       this.name = name;

       this.id = id;

    }



    public void setName(String name){

       this.name = name;

    }

    public String getName(){

       return name;

    }

    public void setId(int id){

       this.id = id;

    }

    public int getId(){

       return id;

    }

}

public class TestHashSet2 {

    public static void main(String[] args) {

       Person p1 = new Person("chen",1001);

       Person p2 = new Person("chen",1001);



       Set<Person> set = new HashSet<Person>();

       set.add(p1);

       set.add(p2);



       Iterator<Person> it = set.iterator();

       while(it.hasNext()){

           System.out.println(it.next().getName());

       }

    }

}

在上面的例子中我向集合中添加两个Person对象p1,p2，它们的姓名和id号都是一样，当我们执行下面的例子时，会发现p1和p2都添加进了集合。这是因为，此时我们没有重写Person的hashCode()方法，这时执行add(p2)时,他会调用Person父类（即Object）的hashCode()方法，Object的hashCode()是这样定义的：由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数（这一般是通过将该对象的内部地址转换成一个整数来实现的）。我们创建的对象p1和p2他们的内部地址不同，因此返回的哈希码也不相同，那么add()方法执行时就会将p2看成是不同于p1的对象。这显然不是我们需求的，为了满足我们的需求，我们则需要重写hashCode()方法。下面我给出一种重写hashCode()的方法。

    public int hashCode(){

       return name.hashCode()+id; //这种写法重码率高，不推荐使用

    }

在这个方法中我返回的哈希值是字符串name的哈希码（字符串的哈希码算法，可查阅JavaAPI）加上id值（Integer对象的hashcode就是其int值）。在Person类中加入上述代码后，我们还需要重写其equals()方法(hashcode会重码)。代码如下：

    public boolean equals(Object obj){

       if(obj instanceof Person){

           Person p = (Person)obj;

           return(name.equals(p.name) && id == p.id);

       }

       return super.equals(obj);

}

    此equals()方法的运行过程是这样的，当我使用add()方法时，首先进行hashCode()的计算，因为p2的hashcode与集合中对象的hashcode有重复（p1的），所以在此时调用equals()方法判断他们是否真的相等。在此例中obj的值即为p1,首先判断p1是否为Person对象，若是，则行强制转换成Person类型（传进来的是Object类型），然后返回name.equals(p.name) && id == p.id 的值。若传进来的obj不是Person类型，则调用父类的equals()方法。

    至此，我们在运行上述程序，则只添加进一个对象。

   总结如下：hashCode不同时，则必为不同对象。hashCode相同时，根据equlas()方法判断是否为同一对象。

   附1.1：下述程序中，p1与p2的hashCode相同，但并不是同一对象。

import java.util.HashSet;

import java.util.Iterator;

import java.util.Set;

class Person {

    private String name;

    private int id;

    Person(String name,int id) {

       this.name = name;

       this.id = id;

    }



    public void setName(String name){

       this.name = name;

    }

    public String getName(){

       return name;

    }

    public void setId(int id){

       this.id = id;

    }

    public int getId(){

       return id;

    }



    public int hashCode(){

       return name.hashCode()+id; //这种写法重码率高，不推荐使用

    }



    public boolean equals(Object obj){

       if(obj instanceof Person){ //

           Person p = (Person)obj;

           return(name.equals(p.name) && id == p.id);

       }

       return super.equals(obj);

    }

}

public class TestHashSet2 {

    public static void main(String[] args) {

       Person p1 = new Person("a",1);

       Person p2 = new Person("b",0);



       Set<Person> set = new HashSet<Person>();

       set.add(p1);

       set.add(p2);



       Iterator<Person> it = set.iterator();

       while(it.hasNext()){

           System.out.println(it.next().getName());

       }

    }

}

在网上提供了很多hashcode的算法，但若要绝对避免哈希码的重码我认为是不可能的，我们也不必那么做。说句大白话，有equals()在后面等着呢，咱怕啥。