HashMap源码剖析

来源:互联网 发布:明星网络暴力 编辑:程序博客网 时间:2024/06/09 19:20

HashMap源码剖析

本文参考自:http://blog.csdn.net/chenssy/article/details/18323767

简介

  1. HashMap是基于哈希表实现的,每一个元素是一个key-value对,其内部通过单链表解决冲突问题,容量不足(超过了阀值)时,同样会自动增长。
  2. HashMap是非线程安全的,只是用于单线程环境下,多线程环境下可以采用concurrent并发包下的concurrentHashMap。
  3. HashMap实现了Map接口,继承AbstractMap。其中Map接口定义了键映射到值的规则,而AbstractMap类提供 Map 接口的骨干实现,以最大限度地减少实现此接口所需的工作。

构造方法

  1. HashMap():构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。
  2. HashMap(int initialCapacity):构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。
  3. HashMap(int initialCapacity, float loadFactor):构造一个带指定初始容量和加载因子的空 HashMap。
  4. 上面提到了两个参数:初始容量,加载因子。这两个参数是影响HashMap性能的重要参数,其中容量表示哈希表中桶的数量,初始容量是创建哈希表时的容量,加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度,它衡量的是一个散列表的空间的使用程度,负载因子越大表示散列表的装填程度越高,反之愈小。对于使用链表法的散列表来说,查找一个元素的平均时间是O(1+a),因此如果负载因子越大,对空间的利用更充分,但是单个链表的长度也会更长,因此查找效率会降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。系统默认负载因子为0.75,一般情况下我们是无需修改的。

hashMap存入元素的过程

  1. 首先, 根据存入Key元素的内容, 通过hashCode()计算出哈希值。哈希值实质上就是指元素在容器中的映射位置。我们在计算hashcode的时候,要遵循为速度而散列。哈希值不同,则对应的元素一定不相同。但是不同的元素的哈希值确实有可能相同的,此时我们就只能通过equals()方法来判断了。
  2. 根据哈希值和数组的长度,计算出该元素应该存入的链表在数组中的索引位置。如何保证元素能在数组中均匀分布?我们最先想到的可能就是对数组长度取余, 这也正是HashTable采用的做法,但是在hashMap中做了改进。HashMap采用的是 hashcode & (length-1)方式,采用这种方式也有一个前提条件,那就是数组的长度必须为2的n次幂。这样做同样可以保证均匀的分布,并且效率大大提升了。
  3. 取出该索引位置对象的元素Entry(key, value, hash, next)链表;
    1. 遍历该链表; 如果出现key值和准备加入的key相等, 则用新的value替换原来的value;
    2. 遍历完链表, 未出现key值相同, 则创建一个新的Entry对象; 并将该对象添加到链表额头部;
public V put(K key, V value) {    //当key为null,调用putForNullKey方法,保存null与table第一个位置中,这是HashMap允许为null的原因    if (key == null)        return putForNullKey(value);    //计算key的hash值    int hash = hash(key.hashCode());                  ------(1)    //计算key hash 值在 table 数组中的位置    int i = indexFor(hash, table.length);             ------(2)    //从i出开始迭代 e,找到 key 保存的位置    for (Entry<K, V> e = table[i]; e != null; e = e.next) {        Object k;        //判断该条链上是否有hash值相同的(key相同)        //若存在相同,则直接覆盖value,返回旧value        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {            V oldValue = e.value;    //旧值 = 新值            e.value = value;            e.recordAccess(this);            return oldValue;     //返回旧值        }    }    //修改次数增加1    modCount++;    //将key、value添加至i位置处    addEntry(hash, key, value, i);    return null;}

hashMap取出元素的过程

取出元素的过程和存入的过程类似,也是根据key先去对应的结点。如果找到的话,就取出该结点中的value值;如果没有找到的话就返回null。

public V get(Object key) {    // 若为null,调用getForNullKey方法返回相对应的value    if (key == null)        return getForNullKey();    // 根据该 key 的 hashCode 值计算它的 hash 码      int hash = hash(key.hashCode());    // 取出 table 数组中指定索引处的值    for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {        Object k;        //若搜索的key与查找的key相同,则返回相对应的value        if (e.hash == hash && ((k = e.key) == key || key.equals(k)))            return e.value;    }    return null;}

关于扩容

扩容操作新建了一个HashMap的底层数组,而后调用transfer方法,将就HashMap的全部元素添加到新的HashMap中(要重新计算元素在新的数组中的索引位置)。很明显,扩容是一个相当耗时的操作,因为它需要重新计算这些元素在新的数组中的位置并进行复制处理。因此,我们在用HashMap的时,最好能提前预估下HashMap中元素的个数,这样有助于提高HashMap的性能。

// 重新调整HashMap的大小,newCapacity是调整后的单位  void resize(int newCapacity) {      Entry[] oldTable = table;      int oldCapacity = oldTable.length;      if (oldCapacity == MAXIMUM_CAPACITY) {          threshold = Integer.MAX_VALUE;          return;      }      // 新建一个HashMap,将“旧HashMap”的全部元素添加到“新HashMap”中,      // 然后,将“新HashMap”赋值给“旧HashMap”。      Entry[] newTable = new Entry[newCapacity];      transfer(newTable);      table = newTable;      threshold = (int)(newCapacity * loadFactor);  } // 将HashMap中的全部元素都添加到newTable中    void transfer(Entry[] newTable) {        Entry[] src = table;        int newCapacity = newTable.length;        for (int j = 0; j < src.length; j++) {            Entry<K,V> e = src[j];            if (e != null) {                src[j] = null;                do {                    Entry<K,V> next = e.next;                    int i = indexFor(e.hash, newCapacity);                    e.next = newTable[i];                    newTable[i] = e;                    e = next;                } while (e != null);            }        }    } 
原创粉丝点击