HashMap源码剖析

来源：互联网发布：明星网络暴力编辑：程序博客网时间：2024/06/09 19:20

HashMap源码剖析

本文参考自：http://blog.csdn.net/chenssy/article/details/18323767

简介

HashMap是基于哈希表实现的，每一个元素是一个key-value对，其内部通过单链表解决冲突问题，容量不足（超过了阀值）时，同样会自动增长。
HashMap是非线程安全的，只是用于单线程环境下，多线程环境下可以采用concurrent并发包下的concurrentHashMap。
HashMap实现了Map接口，继承AbstractMap。其中Map接口定义了键映射到值的规则，而AbstractMap类提供 Map 接口的骨干实现，以最大限度地减少实现此接口所需的工作。

构造方法

HashMap()：构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity)：构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity, float loadFactor)：构造一个带指定初始容量和加载因子的空 HashMap。
上面提到了两个参数：初始容量，加载因子。这两个参数是影响HashMap性能的重要参数，其中容量表示哈希表中桶的数量，初始容量是创建哈希表时的容量，加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度，它衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小。对于使用链表法的散列表来说，查找一个元素的平均时间是O(1+a)，因此如果负载因子越大，对空间的利用更充分，但是单个链表的长度也会更长，因此查找效率会降低；如果负载因子太小，那么散列表的数据将过于稀疏，对空间造成严重浪费。系统默认负载因子为0.75，一般情况下我们是无需修改的。

hashMap存入元素的过程

首先, 根据存入Key元素的内容, 通过hashCode()计算出哈希值。哈希值实质上就是指元素在容器中的映射位置。我们在计算hashcode的时候，要遵循为速度而散列。哈希值不同，则对应的元素一定不相同。但是不同的元素的哈希值确实有可能相同的，此时我们就只能通过equals()方法来判断了。
根据哈希值和数组的长度,计算出该元素应该存入的链表在数组中的索引位置。如何保证元素能在数组中均匀分布？我们最先想到的可能就是对数组长度取余, 这也正是HashTable采用的做法，但是在hashMap中做了改进。HashMap采用的是 hashcode & (length-1)方式，采用这种方式也有一个前提条件，那就是数组的长度必须为2的n次幂。这样做同样可以保证均匀的分布，并且效率大大提升了。
取出该索引位置对象的元素Entry(key, value, hash, next)链表;
1. 遍历该链表; 如果出现key值和准备加入的key相等, 则用新的value替换原来的value;
2. 遍历完链表, 未出现key值相同, 则创建一个新的Entry对象; 并将该对象添加到链表额头部;

public V put(K key, V value) {    //当key为null，调用putForNullKey方法，保存null与table第一个位置中，这是HashMap允许为null的原因    if (key == null)        return putForNullKey(value);    //计算key的hash值    int hash = hash(key.hashCode());                  ------(1)    //计算key hash 值在 table 数组中的位置    int i = indexFor(hash, table.length);             ------(2)    //从i出开始迭代 e,找到 key 保存的位置    for (Entry<K, V> e = table[i]; e != null; e = e.next) {        Object k;        //判断该条链上是否有hash值相同的(key相同)        //若存在相同，则直接覆盖value，返回旧value        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {            V oldValue = e.value;    //旧值 = 新值            e.value = value;            e.recordAccess(this);            return oldValue;     //返回旧值        }    }    //修改次数增加1    modCount++;    //将key、value添加至i位置处    addEntry(hash, key, value, i);    return null;}

hashMap取出元素的过程

取出元素的过程和存入的过程类似，也是根据key先去对应的结点。如果找到的话，就取出该结点中的value值；如果没有找到的话就返回null。

public V get(Object key) {    // 若为null，调用getForNullKey方法返回相对应的value    if (key == null)        return getForNullKey();    // 根据该 key 的 hashCode 值计算它的 hash 码      int hash = hash(key.hashCode());    // 取出 table 数组中指定索引处的值    for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {        Object k;        //若搜索的key与查找的key相同，则返回相对应的value        if (e.hash == hash && ((k = e.key) == key || key.equals(k)))            return e.value;    }    return null;}

关于扩容

扩容操作新建了一个HashMap的底层数组，而后调用transfer方法，将就HashMap的全部元素添加到新的HashMap中（要重新计算元素在新的数组中的索引位置）。很明显，扩容是一个相当耗时的操作，因为它需要重新计算这些元素在新的数组中的位置并进行复制处理。因此，我们在用HashMap的时，最好能提前预估下HashMap中元素的个数，这样有助于提高HashMap的性能。

// 重新调整HashMap的大小，newCapacity是调整后的单位  void resize(int newCapacity) {      Entry[] oldTable = table;      int oldCapacity = oldTable.length;      if (oldCapacity == MAXIMUM_CAPACITY) {          threshold = Integer.MAX_VALUE;          return;      }      // 新建一个HashMap，将“旧HashMap”的全部元素添加到“新HashMap”中，      // 然后，将“新HashMap”赋值给“旧HashMap”。      Entry[] newTable = new Entry[newCapacity];      transfer(newTable);      table = newTable;      threshold = (int)(newCapacity * loadFactor);  } // 将HashMap中的全部元素都添加到newTable中    void transfer(Entry[] newTable) {        Entry[] src = table;        int newCapacity = newTable.length;        for (int j = 0; j < src.length; j++) {            Entry<K,V> e = src[j];            if (e != null) {                src[j] = null;                do {                    Entry<K,V> next = e.next;                    int i = indexFor(e.hash, newCapacity);                    e.next = newTable[i];                    newTable[i] = e;                    e = next;                } while (e != null);            }        }    }

阅读全文

0 0