HashSet如何保证元素的唯一性-跟踪源码解析

来源:互联网 发布:广东省发票打印软件 编辑:程序博客网 时间:2024/05/17 07:36

自己的理解:HashSet的底层数据结构用的是哈希表(HashMap),当往HashSet上添加一条元素时。

  public boolean add(E e) {
        return map.put(e, PRESENT)==null;//PRESENT是一个一样的Object对象,调用HashMap的put方法
    }

点进put方法如下:

 public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key ||key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

进入hash(key)方法:

   //利用hashCode()方法返回一个hash值

    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }
        h ^= k.
hashCode();
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

答案明显易见:当HashSet添加一条元素时,调用HashMap的put方法先调用hashCode()方法判断key的hash值是否一样,再调用对象的equals方法。

总结:

当HashSet中放入了两个对象后,默认他们的hashCode都是不一样的,因此不需要调用equals方法就能确定这两个对象不是同一个,但是如果这两个对象的值是一样的,这种判断结果就不符合要求了,因此需要重写hashcode方法,将两个对象的hashcode值设为相同,这样就可以进入equals判断阶段,equals方法是继承自object类的,比较的是对象的地址值,所以判断的结果也必定不同,这又不符合要求了,因此也需要重写equals方法。经过改写以上两个方法,可以完成两个对象的比较,只要两个对象的内容(值)相同,就判断为同一个对象,不得重复存储。哈希表就像一个个桶,每个桶都有一个hashcode,只要元素的hashcode相同,equals如果为false,那么这些元素都挂在这个桶里。

 

另外,判断是否包含某元素(contains),list和set也是不同的:

ArrayList:判断包含,以及删除,都是依据元素的equals方法。

HashSet:判断包含,以及删除,都是依据元素的hashCode方法。当hashCode值相同时,在判断一次equals方法。

0 0
原创粉丝点击