HashMap原理，以及HashMap的非线程安全

来源：互联网发布：mac秋冬色号推荐编辑：程序博客网时间：2024/05/21 01:45

1、HashMap简单描述：

1.1、HashMap是基于哈希表的Map接口实现，支持null值和null键，根据key的hashCode来确定元素的存储位置，不支持重复的键；

1.2、当计算出的hashCode位置已经有元素时，HashMap采用链地址法在其后面追加一个新的节点；

1.3、在根据key来get元素是，如果之前存入的hashCode有冲突，会遍历bucket中的Entry链，保证e.hash==hash && ((k = e.key) == key || (key != null && key.equals(k))；

1.4、Entry对象：HashMap其实相当于是一个Entry数组，Entry包含键和值，当hash冲突时，形成链表。

2、HashMap的线程不安全

都说HashMap是线程不安全的，到底为什么不安全呢。看了jdk源码就会明白，原来是多线程resize()操作的时候可能会造成死循环，下面就来研究下，多线程resize()的时候是怎么造成死循环的，贴上源码：

void resize(int newCapacity) {        Entry[] oldTable = table;        int oldCapacity = oldTable.length;        if (oldCapacity == MAXIMUM_CAPACITY) {            threshold = Integer.MAX_VALUE;            return;        }        Entry[] newTable = new Entry[newCapacity];        transfer(newTable, initHashSeedAsNeeded(newCapacity));        table = newTable;        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);}

void transfer(Entry[] newTable, boolean rehash) {        int newCapacity = newTable.length;        for (Entry<K,V> e : table) {            while(null != e) {                Entry<K,V> next = e.next;                if (rehash) {                    e.hash = null == e.key ? 0 : hash(e.key);                }                int i = indexFor(e.hash, newCapacity);                e.next = newTable[i];                newTable[i] = e;                e = next;            }        }}

我们都知道HashMap的默认容量是16，在插入元素的时候先要计算有没有超过thredhold，如果超过要增大hash表的尺寸，进行rehash。性能开销还是比较大的。

先看看transfer方法主要执行的操作吧：

2.1、对索引数组中元素进行遍历

2.2、对链表遍历上面的每一个节点：用 next 取得要转移那个元素的下一个，将 e 转移到新 Hash 表的头部，使用头插法插入节点。

2.3、循环2，直到链表节点全部转移

2.4、循环1，直到所有索引数组全部转移

会发现转移的时候是逆序的，加入之前链表顺序是A-B-C,转移完成后会变成C-B-A。这个时候就会发现死锁可能是因为A-B的时候B-A造成的。

2.5 单线程安全的resize()

假设最开始hash表的长度是2，hashCode=value mod length;

接下来是把Hash表resize到4，并将所有<key,value>重新rehash到新hash表的过程

可以看出单线程的resize并不会出错

2.6 多线程resize演示

提出关键部分代码

while(null != e) {    Entry<K,V> next = e.next;    e.next = newTable[i];    newTable[i] = e;    e = next;}

1)Entry<K,V> next = e.next; 单链表，记住头节点

2)e.next = newTable[i]; e要插到链表的头部(复杂度O(1)，不插到尾部的原因(O(N)))，所以要先用e.next指向新的hash表的第一个元素；

3)newTable[i] = e; 将新Hash表的头指针指向e;

4)e = next;转移e的下一个节点

假设这里有两个线程同时执行了 put() 操作，并进入了 transfer() 环节

while(null != e) {    Entry<K,V> next = e.next; //线程1执行到这里被调度挂起了    e.next = newTable[i];    newTable[i] = e;    e = next;}

那么现在的状态为：

从上面的图我们可以看到，因为线程1的 e 指向了 key(3)，而 next 指向了 key(7)，在线程2 rehash 后，就指向了线程2 rehash 后的链表。

然后线程1被唤醒了：

执行 e.next = newTable[i] ，于是 key(3)的 next 指向了线程1的新 Hash 表，因为新 Hash 表为空，所以 e.next = null ，
执行 newTable[i] = e ，所以线程1的新 Hash 表第一个元素指向了线程2新 Hash 表的 key(3)。好了，e 处理完毕。
执行 e = next ，将 e 指向 next，所以新的 e 是 key(7)

然后该执行 key(3)的 next 节点 key(7)了:

现在的 e 节点是 key(7)，首先执行 Entry<K,V> next = e.next ,那么 next 就是 key(3)了
执行 e.next = newTable[i] ，于是key(7) 的 next 就成了 key(3)
执行 newTable[i] = e ，那么线程1的新 Hash 表第一个元素变成了 key(7)
执行 e = next ，将 e 指向 next，所以新的 e 是 key(3)

这时候的状态图为：

然后又该执行 key(7)的 next 节点 key(3)了：

现在的 e 节点是 key(3)，首先执行 Entry<K,V> next = e.next ,那么 next 就是 null
执行 e.next = newTable[i] ，于是key(3) 的 next 就成了 key(7)
执行 newTable[i] = e ，那么线程1的新 Hash 表第一个元素变成了 key(3)
执行 e = next ，将 e 指向 next，所以新的 e 是 key(7)

这时候的状态如图所示：

很明显，环形链表出现了！！当然，现在还没有事情，因为下一个节点是 null，所以 transfer() 就完成了，等 put() 的其余过程搞定后，HashMap 的底层实现就是线程1的新 Hash 表了。

阅读全文

0 0