【JDK源码阅读8-util】Map接口----HashMap
来源:互联网 发布:淘宝奢侈品 编辑:程序博客网 时间:2024/05/16 01:13
HashMap
HashMap要聊的东西太多了,而且由于HashSet接口中底层实现就是用的HashMap,所以建议先看HashMap的源码。这里就直接转载别人的文章中的总结;毕竟别人总结 的非常到位。先说下结构,对HashMap的结构有个大概的了解后,再说些其工作原理以及其中涉及到的哈希算法。
参考:【http://blog.csdn.net/qq_27093465/article/details/52207152】
public class HashMap<K,V>
数组的特点是:寻址容易,插入和删除困难;而链表的特点是:寻址困难,插入和删除容易。那么我们能不能
综合两者的特性,做出一种寻址容易,插入删除也容易的数据结构?答案是肯定的,这就是我们要提起的哈希表。
HashMap实现了Map接口,继承AbstractMap。其中Map接口定义了键映射到值的规则,而AbstractMap类提供
Map 接口的骨干实现,以最大限度地减少实现此接口所需的工作。
一 HashMap结构
上图 可能很直观清晰的介绍了HashMap的结构:从上图我们可以发现哈希表是由数组+链表组成的,HashMap其实也是一个线性的数组实现的,所以可以理解为其存储数据的容器就是一个线性数组。这可能让我们很不解,一个线性的数组怎么实现按键值对来存取数据呢?
1 .首先HashMap里面实现一个静态内部类Entry,其重要的属性有 key , value, next,从属性key,value。
我们就能很明显的看出来Entry就是HashMap键值对实现的一个基础bean,我们上面说到HashMap的基础就是一个线性数组,
这个数组就是Entry[],Map里面的内容都保存在Entry[]里面。
static class Entry<K,V> implements Map.Entry<K,V> { final K key;//键 V value;//值 Entry<K,V> next;//下个元素指针 int hash;//key的hash值
}
2 两个概念:
1).这里面有个Hash冲突的概念:就像上面的一个数组的位置上出现了一条链,即一个链表的出现,这就是所谓的
hash冲突,解决hash冲突,就是让链表的长度变短,或者干脆就是不产生链表,一个好的hash算法应该是让数据很好的
散列到数组的各个位置,即一个位置存一个数据就是最好的散列,下面说的链地址法,说的就是在hashmap里面冲突的时候,
一个节点可以存多个数据。
2).还有个桶:bucket,就是上面的数组的每一个成员,数组的每个位置就叫一个桶。对应前面的单词。
二 HashMap基本定义
HashMap也是我们使用非常多的Collection,它是基于哈希表的 Map 接口的实现,以key-value的形式存在。
HashMap可以接受null键值和值,而HashTable则不能;HashMap是非synchronized;HashMap很快;HashMap储存的是键值对。
三 构造函数
HashMap提供了三个构造函数:
HashMap():构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity):构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity, float loadFactor):构造一个带指定初始容量和加载因子的空 HashMap。
在这里提到了两个参数:初始容量,加载因子。这两个参数是影响HashMap性能的重要参数,其中容量表示哈希表中桶的数量,初始容量是创建哈希表时的容量,加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度,它衡量的是一个散列表的空间的使用程度,负载因子越大表示散列表的装填程度越高,反之愈小。
对于使用链表法的散列表来说,查找一个元素的平均时间是O(1+a),因此如果负载因子越大,对空间的利用更充分,然而后果是查找效率的降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。系统默认负载因子为0.75,一般情况下我们是无需修改的。
四、工作原理
1 存储的实现put(K key,V value)
核心就是:根据key的hashcode得到桶的位置,往里面添加值;若发现有对应的键存在就覆盖。
当我们想一个HashMap中添加一对key-value时,系统首先会计算key的hash值,然后根据hash值确认在table中存储的位置。若该位置没有元素,则直接插入。否则迭代该处元素链表并依此比较其key的hash值。如果两个hash值相等且key值相等(e.hash == hash && ((k = e.key) == key || key.equals(k))),则用新的Entry的value覆盖原来节点的value。如果两个hash值相等但key值不等 ,则将该节点插入该链表的链头。
①首先判断key==null?,若为null,就调用putForNullKey方法。
②若 key != null ,对key调用hashCode()方法,根据hash值确认在table中存储的位置,即桶的位置,确定数据要插入到那个桶中。(bucket位置来储存Entry对象)。
若桶中有元素,(hash值相同时说明在同个桶中,这时再比较有没有相同 的key(调用equals())),
则遍历桶中元素,看看是否有相同的key,
若存在则覆盖原来key的value,否则将该元素保存在链头(最先保存的元素放在链尾)。
若table在该处没有元素,则直接保存。
注意:
a 迭代处:此处迭代原因就是为了防止存在相同的key值,若发现两个hash值(key)相同时,HashMap的处理方式是用新value替换旧value,
这里并没有处理key,这就解释了HashMap中没有两个相同的key;
b 再看如何计算key的hash值,HashMap的精华所在。
//计算键key的hash值(String类的key做了优化) final int hash(Object k) { int h = hashSeed; //这里针对String类的key值做了优化,调用不同的函数(???) if (0 != h && k instanceof String) { return sun.misc.Hashing.stringHash32((String) k); } h ^= k.hashCode(); // This function ensures that hashCodes that differ only by // constant multiples at each bit position have a bounded // number of collisions (approximately 8 at default load factor). h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); }
计算hash值后,怎么才能保证table元素分布均与呢?我们会想到取模,但是由于取模的消耗较大,
HashMap是这样处理的:调用indexFor方法。HashMap的底层数组长度总是2的n次方,在构造函数中存在:capacity <<= 1;这样做总是能够保证HashMap的底层数组长度为2的n次方。
当length为2的n次方时,h&(length - 1)就相当于对length取模,而且速度比直接取模快得多,这是HashMap在速度上的一个优化。
我们回到indexFor方法,该方法仅有一条语句:h&(length - 1),这句话除了上面的取模运算外还有一个非常重要的责任:
均匀分布table数据和充分利用空间。
//??? 根据Hash值和Hash表的大小选择合适的桶??? static int indexFor(int h, int length) { // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2"; return h & (length-1); }<span style="font-family: verdana, Arial, Helvetica, sans-serif; line-height: 25.2px; background-color: rgb(249, 249, 249);"></span>
c “当两个对象的hashcode相同会发生什么?”
当hashcode相同时,它们的bucket位置相同,‘碰撞’会发生。
因为HashMap使用LinkedList存储对象,这个Entry(包含有键值对的Map.Entry对象)会存储在LinkedList中。所以即使bucket位置相同,插入到同个bucket位置的结点以链表形式所连接。即:
打个比方, 第一个键值对A进来,通过计算其key的hash得到的index=0,记做:Entry[0] = A。一会后又进来一个键值对B,通过计算其index也等于0,现在怎么办?HashMap会这样做:
B.next = A,Entry[0] = B,如果又进来C,index也等于0,那么C.next = B,Entry[0] = C;(即将先加入的结点next指针指向新加入的结点)
这样我们发现index=0的地方其实存取了A,B,C三个键值对,他们通过next这个属性链接在一起。所以疑问不用担心。也就是说数组中存储的是最后插入的元素。
下面是put的源码;
//将指定value值存放在指定key处;若key处以前有值,就将其覆盖; public V put(K key, V value) { if (table == EMPTY_TABLE) { inflateTable(threshold);//是空表的话,就直接初始化底层结构 } //key为null的时候,就放入null键(这里可以看出hashmap集合中可以有null键) if (key == null) return putForNullKey(value); //计算键的哈希值 int hash = hash(key); //获取桶的位置 int i = indexFor(hash, table.length); //因为表中保存的是桶中结点的头指针;所以找到对应的桶以后就可以从头指针开始进行遍历 for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; //先判断该条链上有没有hash相同的(hash相同后再比较key值) //有相同的key,就直接覆盖其值 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { V oldValue = e.value;//获取旧值 e.value = value;//覆盖旧值 e.recordAccess(this);//当集合中以前有值的时候,就调用这个方法 return oldValue;//返回旧值 } } modCount++; addEntry(hash, key, value, i);//将新加入的键值添加到指定位置i处,i为桶的位置;保存在链头部分 return null; }<strong></strong>
2 读取的实现:get(key)
核心:通过key的hash值找到在table数组中的索引处的Entry,然后返回该key对应的value即可。
//根据键key值获得对应的值 //若key==null,调用getForNullKey函数,返回null键对应的值value //若key!=null,先根据key得到对应的entry结点,再得到对应的值 public V get(Object key) { if (key == null) return getForNullKey(); Entry<K,V> entry = getEntry(key); return null == entry ? null : entry.getValue(); }
//根据指定的key找到对应的entry结点 final Entry<K,V> getEntry(Object key) { if (size == 0) { return null;//如果集合为空,就直接返回null } //计算key的哈希值; //key==null>>>0; //key!= null >> hash(key),调用hash方法计算key值 int hash = (key == null) ? 0 : hash(key); //先根据哈希值找到桶的位置,再遍历桶中的rntry结点 for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; //先比价哈希值,哈希值相同再调用equals //这里就是map中为什么重写equals方法时一定要重写hashCode()方法; if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } return null; }
在这里能够根据key快速的取到value除了和HashMap的数据结构密不可分外,还和Entry有莫大的关系,
在前面就提到过,HashMap在存储过程中并没有将key,value分开来存储,而是当做一个整体key-value来处理的,这个整体就是Entry对象。
同时value也只相当于key的附属而已。在存储的过程中,系统根据key的hashcode来决定Entry在table数组中的存储位置,
在取的过程中同样根据key的hashcode取出相对应的Entry对象。
注: “如果两个键的hashcode相同,你如何获取值对象?”
正常情况下获取结点值是根据key的hashcode找到对应的entry结点,然后再返回entry对应的结点。
若两个键的hashcode相同时,找到bucket位置之后(两个键的hashcode相同说明在同一个桶中),
会调用keys.equals()方法去找到LinkedList中正确的节点,最终找到要找的值对象。
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
3 再哈希操作:默认的负载因子大小为0.75,也就是说,当一个map填满了75%的bucket时候,和其它集合类(如ArrayList等)一样,
将会创建原来HashMap大小的两倍的bucket数组,来重新调整map的大小,并将原来的对象放入新的bucket数组中。
这个过程叫作rehashing,因为它调用hash方法找到新的bucket位置。
//当集合到大阈值threshold时,就对集合进行扩容 //在HashMap中当数据量很多时,并且已经达到了负载限度时,会重新做一次哈希,也就是说会再散列。 //调用的方法为resize(),并且java默认传入的参数为2*table.length //resize:再哈希是重新建一个指定容量的数组,然后将每个元素重新计算它要放的位置 void resize(int newCapacity) { Entry[] oldTable = table;//老的表(集合) int oldCapacity = oldTable.length;//获取老的hashmap集合容量 if (oldCapacity == MAXIMUM_CAPACITY) {//若老的hashmap集合容量为最大值,就将阈值设置为最大值并返回 threshold = Integer.MAX_VALUE; return; } Entry[] newTable = new Entry[newCapacity];//建一个新的表结构 //将老的表中数据拷贝的新表中 transfer(newTable, initHashSeedAsNeeded(newCapacity)); table = newTable;//修改表的底层结构 //修改阈值:newCapacity * loadFactor(不能超过最大值) threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1); } //将旧表中的entry结点拷贝到新表中 void transfer(Entry[] newTable, boolean rehash) { int newCapacity = newTable.length;//获取新表容量 for (Entry<K,V> e : table) {//遍历表中结点 while(null != e) { Entry<K,V> next = e.next; if (rehash) {//如果需要重新计算hash值。就重新计算 e.hash = null == e.key ? 0 : hash(e.key); } int i = indexFor(e.hash, newCapacity);//获取桶的位置 // ???元素连接到桶中,相当于单链表的插入 e.next = newTable[i]; newTable[i] = e; e = next; } }
4.解决hash冲突的办法
- 开放定址法(线性探测再散列,二次探测再散列,伪随机探测再散列)
- 再哈希法
- 链地址法
- 建立一个公共溢出区
Java中hashmap的解决办法就是采用的链地址法。
5 重新调整HashMap大小存在什么问题
当重新调整HashMap大小的时候,确实存在条件竞争,因为如果两个线程都发现HashMap需要重新调整大小了,它们会同时试着调整大小。
在调整大小的过程中,存储在LinkedList中的元素的次序会反过来,因为移动到新的bucket位置的时候,HashMap并不会将元素放在LinkedList的尾部,
而是放在头部,这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了,那么就死循环了。
6 面试题
1为什么String, Interger这样的wrapper类适合作为键?
String, Interger这样的wrapper类作为HashMap的键是再适合不过了,而且String最为常用。因为String是不可变的,也是final的,
而且已经重写了equals()和hashCode()方法了。其他的wrapper类也有这个特点。
不可变性是必要的,因为为了要计算hashCode(),就要防止键值改变,如果键值在放入时和获取时返回不同的hashcode的话,
那么就不能从HashMap中找到你想要的对象。
不可变性还有其他的优点如线程安全。如果你可以仅仅通过将某个field声明成final就能保证hashCode是不变的,那么请这么做吧。
因为获取对象的时候要用到equals()和hashCode()方法,那么键对象正确的重写这两个方法是非常重要的。
如果两个不相等的对象返回不同的hashcode的话,那么碰撞的几率就会小些,这样就能提高HashMap的性能。
2我们可以使用自定义的对象作为键吗?
这是前一个问题的延伸。当然你可能使用任何对象作为键,只要它遵守了equals()和hashCode()方法的定义规则,并且当对象插入到Map中
之后将不会再改变了。如果这个自定义对象时不可变的,那么它已经满足了作为键的条件,因为当它创建之后就已经不能改变了。
3我们可以使用CocurrentHashMap来代替HashTable吗?
这是另外一个很热门的面试题,因为ConcurrentHashMap越来越多人用了。我们知道HashTable是synchronized的,
但是ConcurrentHashMap同步性能更好,因为它仅仅根据同步级别对map的一部分进行上锁。ConcurrentHashMap当然可以代替HashTable,
但是HashTable提供更强的线程安全性。
整个HashMap的源码:
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable{ //初始化容量;2^4=16;必须为2的幂 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //最大容量:2^30 static final int MAXIMUM_CAPACITY = 1 << 30; //初始化加载因子:0.75 static final float DEFAULT_LOAD_FACTOR = 0.75f; //HashMap内部的存储结构是一个数组,在未初始化前数组为空 static final Entry<?,?>[] EMPTY_TABLE = {}; //建一个空的entry数组:即桶,添加entry结点(键值映射对) transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE; //集合中键值映射对的数量;永久化防止被序列化 transient int size; //HashMap下次扩容的阈值:即超过这个值就扩容 int threshold; //加载因子 //final:一次赋值就不再修改 final float loadFactor; //Map集合中结构改变的次数 transient int modCount; //默认的threshold值 static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE; //???不太懂这个 //通过虚拟机配置来修改threshold值 private static class Holder { static final int ALTERNATIVE_HASHING_THRESHOLD; static { String altThreshold = java.security.AccessController.doPrivileged( new sun.security.action.GetPropertyAction( "jdk.map.althashing.threshold"));//读取阈值 int threshold; try { threshold = (null != altThreshold)//修改threshold值 ? Integer.parseInt(altThreshold) : ALTERNATIVE_HASHING_THRESHOLD_DEFAULT; // disable alternative hashing if -1 if (threshold == -1) { threshold = Integer.MAX_VALUE; } if (threshold < 0) { throw new IllegalArgumentException("value must be positive integer."); } } catch(IllegalArgumentException failed) { throw new Error("Illegal value for 'jdk.map.althashing.threshold'", failed); } ALTERNATIVE_HASHING_THRESHOLD = threshold; } } //计算Hash值时的key transient int hashSeed = 0; //构造一个带有指定初试容量和加载因子的HashMap public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; //加载因子非负,且是一个数 if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; threshold = initialCapacity; init(); } //构造一个有初始化大小的HashMap,此时加载因子默认为0.75 public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR); } //构造一个空的HashMap,初试容量为默认的16,加载因子为0.75 public HashMap() { this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR); } //构建一个指定映射关系与Map集合相同的新的HashMap public HashMap(Map<? extends K, ? extends V> m) { this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1, DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR); inflateTable(threshold);//初始化HashMap底层的数组结构 putAllForCreate(m);//添加集合m中的元素 } //选择合适的容量值,取最接近number的2的幂 private static int roundUpToPowerOf2(int number) { // assert number >= 0 : "number must be non-negative"; return number >= MAXIMUM_CAPACITY ? MAXIMUM_CAPACITY : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1; } //初始化HashMap的底层数据结构 private void inflateTable(int toSize) { // Find a power of 2 >= toSize int capacity = roundUpToPowerOf2(toSize);//选合适的容量:比toSize大的2的整数幂次方 //选取合适的threshold(扩容阈值) threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1); table = new Entry[capacity];//初始化底层数据结构 initHashSeedAsNeeded(capacity);//选择合适的Hash因子 } //初始化 void init() { } //????选择合适的Hash因子,这里和虚拟机的配置有关 final boolean initHashSeedAsNeeded(int capacity) { boolean currentAltHashing = hashSeed != 0; boolean useAltHashing = sun.misc.VM.isBooted() && (capacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD); boolean switching = currentAltHashing ^ useAltHashing; if (switching) { hashSeed = useAltHashing ? sun.misc.Hashing.randomHashSeed(this) : 0; } return switching; } //计算键key的hash值(String类的key做了优化) final int hash(Object k) { int h = hashSeed; //这里针对String类的key值做了优化,调用不同的函数(???) if (0 != h && k instanceof String) { return sun.misc.Hashing.stringHash32((String) k); } h ^= k.hashCode(); h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); } //均匀分布table数据和充分利用空间。 //这个方法在HashMap中非常重要,凡是与查询、添加、删除有关的方法中都有调用该方法,为什么这么短的一个代码使用率这么高? //根据代码注释我们知道, //这个方法是根据hashCode及当前table的长度(数组的长度,不是map的size)得到该元素应该存放的位置,或者在table中的索引。 static int indexFor(int h, int length) { // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2"; return h & (length-1); } //返回集合的大小 public int size() { return size; } //判断集合是否非空 public boolean isEmpty() { return size == 0; } //根据键key值获得对应的值:先根据key得到结点entry,再获取其对应的值 //若key==null,调用getForNullKey函数,返回null键对应的值value //*若key!=null,先根据key得到对应的entry结点,再得到对应的值 public V get(Object key) { if (key == null) return getForNullKey(); Entry<K,V> entry = getEntry(key); return null == entry ? null : entry.getValue(); } //key==null时,分三种情况讨论 private V getForNullKey() { if (size == 0) {//1 集合为空,value为null return null; } //2 key==null,value!=null for (Entry<K,V> e = table[0]; e != null; e = e.next) { if (e.key == null) return e.value; } //3 key==null,value==null return null; } //判断是否包含键key;实际上是调用getEntry,看key对应的entry结点是否存在 public boolean containsKey(Object key) { return getEntry(key) != null; } //根据指定的key找到对应的entry结点 final Entry<K,V> getEntry(Object key) { if (size == 0) { return null;//如果集合为空,就直接返回null } //计算key的哈希值; //key==null == 0; //key!= null >> hash(key),调用hash方法计算key值 int hash = (key == null) ? 0 : hash(key); //先根据哈希值找到桶的位置,再遍历桶中的rntry结点 for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; //因为在同个桶中,这里的哈希值肯定相同:e.hash == hash //再遍历桶中的结点;寻找结点中的key与要找到key相同的结点: //调用equals方法(k = e.key) == key || (key != null && key.equals(k)) //这里解释了:当hashcode相同时(在同个桶中),需要调用equals进一步进行比较,所以hashcode、equals都需要重写 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } return null; } //将指定value值存放在指定key处;若key处以前有值,就将其覆盖; public V put(K key, V value) { if (table == EMPTY_TABLE) { inflateTable(threshold);//是空表的话,就直接初始化底层结构 } //key为null的时候,就放入0号桶中中(这里可以看出hashmap集合中可以有null键) if (key == null) return putForNullKey(value); //计算键的哈希值 int hash = hash(key); //获取桶的位置 int i = indexFor(hash, table.length); //因为表中保存的是桶中结点的头指针;所以找到对应的桶以后就可以从头指针开始进行遍历 for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; //首先确保遍历结点的哈希值与要插入的键的哈希值相同:e.hash == hash //有相同的key,就直接覆盖其值 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { V oldValue = e.value;//获取旧值 e.value = value;//覆盖旧值 e.recordAccess(this);//当集合中以前有值的时候,就调用这个方法 return oldValue;//返回旧值 } } modCount++;//修改次数 addEntry(hash, key, value, i);//将新加入的键值添加到指定位置i处,i为桶的位置;保存在链头部分 return null; } //用来添加key==null的元素,添加到第0号的Hash桶中 private V putForNullKey(V value) { for (Entry<K,V> e = table[0]; e != null; e = e.next) { if (e.key == null) { V oldValue = e.value;//获取旧值返回 e.value = value;//覆盖旧值 e.recordAccess(this); return oldValue; } } modCount++; addEntry(0, null, value, 0);//执行链表插入 return null; } /** * This method is used instead of put by constructors and * pseudoconstructors (clone, readObject). It does not resize the table, * check for comodification, etc. It calls createEntry rather than * addEntry. */ //添加元素??? private void putForCreate(K key, V value) { int hash = null == key ? 0 : hash(key);//计算key的hash值 int i = indexFor(hash, table.length);//定位Hash桶 //遍历第i号hash桶 //table[i]中保存的是第i号hash桶的头指针,所以要遍历第i号hash桶的头指针,即为e = e.next for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; //先比价哈希值,哈希值相同再调用equals if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { e.value = value; return; } } //创建元素实体,这里即添加到第i号Hash桶中 createEntry(hash, key, value, i); } //将m中元素全加到hashMap中 private void putAllForCreate(Map<? extends K, ? extends V> m) { for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) putForCreate(e.getKey(), e.getValue()); } //当集合到大阈值threshold时,就对集合进行扩容 //在HashMap中当数据量很多时,并且已经达到了负载限度时,会重新做一次哈希,也就是说会再散列。 //调用的方法为resize(),并且java默认传入的参数为2*table.length //resize:再哈希是重新建一个指定容量的数组,然后将每个元素重新计算它要放的位置 void resize(int newCapacity) { Entry[] oldTable = table;//老的表(集合) int oldCapacity = oldTable.length;//获取老的hashmap集合容量 if (oldCapacity == MAXIMUM_CAPACITY) {//若老的hashmap集合容量为最大值,就将阈值设置为最大值并返回 threshold = Integer.MAX_VALUE; return; } Entry[] newTable = new Entry[newCapacity];//建一个新的表结构 //将老的表中数据拷贝的新表中 transfer(newTable, initHashSeedAsNeeded(newCapacity)); table = newTable;//修改表的底层结构 //修改阈值:newCapacity * loadFactor(不能超过最大值) threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1); } //将旧表中的entry结点拷贝到新表中 void transfer(Entry[] newTable, boolean rehash) { int newCapacity = newTable.length;//获取新表容量 for (Entry<K,V> e : table) {//遍历表中每个位置的头指针 while(null != e) { Entry<K,V> next = e.next; if (rehash) {//如果需要重新计算hash值。就重新计算 e.hash = null == e.key ? 0 : hash(e.key); } int i = indexFor(e.hash, newCapacity);//获取桶的位置 // ???元素连接到桶中,相当于单链表的插入 e.next = newTable[i]; newTable[i] = e; e = next; } } } //添加指定集合中的元素 public void putAll(Map<? extends K, ? extends V> m) { int numKeysToBeAdded = m.size(); if (numKeysToBeAdded == 0)//集合为空,直接返回 return; if (table == EMPTY_TABLE) {//底层数组为空,执行初始化???? inflateTable((int) Math.max(numKeysToBeAdded * loadFactor, threshold)); } //若要添加的集合大小超过阈值,就执行扩容 //扩容大小: if (numKeysToBeAdded > threshold) { //选择容量 int targetCapacity = (int)(numKeysToBeAdded / loadFactor + 1); if (targetCapacity > MAXIMUM_CAPACITY) targetCapacity = MAXIMUM_CAPACITY;//超过最大值就设置为最大值 int newCapacity = table.length;//当前容量 while (newCapacity < targetCapacity)//当前容量小于目标容量,就扩容 newCapacity <<= 1;//每次扩容大小 为2的幂次方 if (newCapacity > table.length) resize(newCapacity);//????执行扩容 } //开始添加元素 for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) put(e.getKey(), e.getValue()); } //移除集合中指定键,返回key对应的值 public V remove(Object key) { Entry<K,V> e = removeEntryForKey(key); return (e == null ? null : e.value); } //删除元素,返回键对应的值 final Entry<K,V> removeEntryForKey(Object key) { if (size == 0) { return null;//集合为空,就返回null } //计算Key的hash值 int hash = (key == null) ? 0 : hash(key); int i = indexFor(hash, table.length);//获取桶的位置 Entry<K,V> prev = table[i];//获取头指针,设为prev结点 Entry<K,V> e = prev;//保存头指针 //从头指针开始遍历 while (e != null) { Entry<K,V> next = e.next;//获取下个结点 Object k; //遍历桶中结点 //若桶中有指定结点的键key,就将其删除 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { modCount++; size--; //执行链表的删除 if (prev == e)//是否是第一个元素 table[i] = next;//将下个结点设置为头指针 else prev.next = next;//直接删除当前值,指向下个元素 e.recordRemoval(this); return e; } prev = e;//没有的话就继续遍历桶中结点,指针后移 e = next; } return e; } //删除一个Entry实体,通过o的key查找到元素后,删除(和上面方法类似) final Entry<K,V> removeMapping(Object o) { if (size == 0 || !(o instanceof Map.Entry)) return null; Map.Entry<K,V> entry = (Map.Entry<K,V>) o; Object key = entry.getKey(); int hash = (key == null) ? 0 : hash(key); int i = indexFor(hash, table.length); Entry<K,V> prev = table[i]; Entry<K,V> e = prev; while (e != null) { Entry<K,V> next = e.next; if (e.hash == hash && e.equals(entry)) { modCount++; size--; if (prev == e) table[i] = next; else prev.next = next; e.recordRemoval(this); return e; } prev = e; e = next; } return e; } //清空集合 public void clear() { modCount++; Arrays.fill(table, null);//底层数组设置为null size = 0; } //判断是否包含值为value的元素 public boolean containsValue(Object value) { if (value == null) return containsNullValue(); Entry[] tab = table; //先获取表中每个索引i所在位置,即每个桶 for (int i = 0; i < tab.length ; i++) //再获取第i个桶的头指针:Entry e = tab[i] //再遍历桶中的每个结点。判断结点值是否与指定值相等 for (Entry e = tab[i] ; e != null ; e = e.next) if (value.equals(e.value)) return true; return false; } //判断是否包含null private boolean containsNullValue() { Entry[] tab = table; //遍历方法同上 for (int i = 0; i < tab.length ; i++) for (Entry e = tab[i] ; e != null ; e = e.next) if (e.value == null) return true; return false; } //浅复制HashMap public Object clone() { HashMap<K,V> result = null; try { result = (HashMap<K,V>)super.clone(); } catch (CloneNotSupportedException e) { // assert false; } if (result.table != EMPTY_TABLE) { result.inflateTable(Math.min( (int) Math.min( size * Math.min(1 / loadFactor, 4.0f), // we have limits... HashMap.MAXIMUM_CAPACITY), table.length)); } result.entrySet = null; result.modCount = 0; result.size = 0; result.init(); result.putAllForCreate(this); return result; } //Entry结点,实现Map,Entry接口,是HashMap内部key和value的一个抽象 static class Entry<K,V> implements Map.Entry<K,V> { final K key;//键 V value;//值 Entry<K,V> next;//下个元素指针 int hash;//key的hash值 //创建一个Entry结点 Entry(int h, K k, V v, Entry<K,V> n) { value = v; next = n; key = k; hash = h; } //获取key public final K getKey() { return key; } //获取值 public final V getValue() { return value; } //设置新值,覆盖旧值 public final V setValue(V newValue) { V oldValue = value; value = newValue; return oldValue; } //比较是否相等 public final boolean equals(Object o) { if (!(o instanceof Map.Entry)) return false; Map.Entry e = (Map.Entry)o; Object k1 = getKey();//调用者的key Object k2 = e.getKey();//比较对象的key //比较key if (k1 == k2 || (k1 != null && k1.equals(k2))) { Object v1 = getValue(); Object v2 = e.getValue(); //比较值 if (v1 == v2 || (v1 != null && v1.equals(v2))) return true; } return false; } //返回hashCode值:???怎么返回的? public final int hashCode() { return Objects.hashCode(getKey()) ^ Objects.hashCode(getValue()); } public final String toString() { return getKey() + "=" + getValue(); } //当集合中有键对应的值被覆盖时就执行这个空方法 //???这个方法是干嘛用的 void recordAccess(HashMap<K,V> m) { } //当Entry结点被移除的时候就执行这个方法 void recordRemoval(HashMap<K,V> m) { } } //将指定键值加入到指定桶中,bucketIndex:桶的位置 void addEntry(int hash, K key, V value, int bucketIndex) { if ((size >= threshold) && (null != table[bucketIndex])) {//判断是否要扩容 resize(2 * table.length);//两倍扩容 hash = (null != key) ? hash(key) : 0; bucketIndex = indexFor(hash, table.length);//定位桶的位置 } createEntry(hash, key, value, bucketIndex); } //创建entry:是在链表头加入新加的结点 void createEntry(int hash, K key, V value, int bucketIndex) { Entry<K,V> e = table[bucketIndex];//先获取该桶的头指针:table[bucketIndex] table[bucketIndex] = new Entry<>(hash, key, value, e);//新建结点:hash, key, value, e //头指针指向此结点 size++; } //迭代器 private abstract class HashIterator<E> implements Iterator<E> { Entry<K,V> next; // 下一个返回的实体 int expectedModCount; // 迭代器修改的次数 int index; // Hash桶的索引号 Entry<K,V> current; // 当前实体 HashIterator() { expectedModCount = modCount;//获取修改次数 if (size > 0) { // 集合不为空s Entry[] t = table; //寻找第一个不为空的桶 while (index < t.length && (next = t[index++]) == null); } } //判断是否有下一个元素 public final boolean hasNext() { return next != null; } //返回下一个元素 final Entry<K,V> nextEntry() { //迭代期间,修改次数不同即又被修改,则抛出异常 if (modCount != expectedModCount) throw new ConcurrentModificationException(); Entry<K,V> e = next;//从next开始遍历 if (e == null) throw new NoSuchElementException(); //如果下个结点为空,则找到下个不为空的桶??? if ((next = e.next) == null) { Entry[] t = table; while (index < t.length && (next = t[index++]) == null) ; } current = e; return e; } //删除元素 public void remove() { if (current == null) throw new IllegalStateException(); if (modCount != expectedModCount) throw new ConcurrentModificationException(); Object k = current.key; current = null; HashMap.this.removeEntryForKey(k);//调用父类删除元素 expectedModCount = modCount;//修改并发修改次数 } } //HashMap值集迭代器,返回的是nextEntry迭代器值 private final class ValueIterator extends HashIterator<V> { public V next() { return nextEntry().value; } } //HashMap键集迭代器,返回的是nextEntry迭代器中键 private final class KeyIterator extends HashIterator<K> { public K next() { return nextEntry().getKey(); } } private final class EntryIterator extends HashIterator<Map.Entry<K,V>> { public Map.Entry<K,V> next() { return nextEntry(); } } // Subclass overrides these to alter behavior of views' iterator() method //返回键集迭代器 Iterator<K> newKeyIterator() { return new KeyIterator(); } //返回值集迭代器 Iterator<V> newValueIterator() { return new ValueIterator(); } //返回Entry迭代器 Iterator<Map.Entry<K,V>> newEntryIterator() { return new EntryIterator(); } // Views //视图集合,HashMap内部Entry集合 private transient Set<Map.Entry<K,V>> entrySet = null; //返回键集 public Set<K> keySet() { Set<K> ks = keySet; return (ks != null ? ks : (keySet = new KeySet())); } //键集合的实现,实现了AbstractSet抽象类,调用了父类的方法 private final class KeySet extends AbstractSet<K> { public Iterator<K> iterator() { return newKeyIterator(); } public int size() { return size; } public boolean contains(Object o) { return containsKey(o); } public boolean remove(Object o) { return HashMap.this.removeEntryForKey(o) != null; } public void clear() { HashMap.this.clear(); } } // //返回值集合 public Collection<V> values() { Collection<V> vs = values; return (vs != null ? vs : (values = new Values())); } //值集合的实现,实现了AbstractCollection抽象类,调用了父类的方法来实现 private final class Values extends AbstractCollection<V> { public Iterator<V> iterator() { return newValueIterator(); } public int size() { return size; } public boolean contains(Object o) { return containsValue(o); } public void clear() { HashMap.this.clear(); } } //entry集合 public Set<Map.Entry<K,V>> entrySet() { return entrySet0(); } //返回entry集合 private Set<Map.Entry<K,V>> entrySet0() { Set<Map.Entry<K,V>> es = entrySet; return es != null ? es : (entrySet = new EntrySet()); } private final class EntrySet extends AbstractSet<Map.Entry<K,V>> { public Iterator<Map.Entry<K,V>> iterator() { return newEntryIterator(); } public boolean contains(Object o) { if (!(o instanceof Map.Entry)) return false; Map.Entry<K,V> e = (Map.Entry<K,V>) o; Entry<K,V> candidate = getEntry(e.getKey()); return candidate != null && candidate.equals(e); } public boolean remove(Object o) { return removeMapping(o) != null; } public int size() { return size; } public void clear() { HashMap.this.clear(); } } //序列化 private void writeObject(java.io.ObjectOutputStream s) throws IOException { // Write out the threshold, loadfactor, and any hidden stuff s.defaultWriteObject(); // Write out number of buckets if (table==EMPTY_TABLE) { s.writeInt(roundUpToPowerOf2(threshold)); } else { s.writeInt(table.length); } // Write out size (number of Mappings) s.writeInt(size); // Write out keys and values (alternating) if (size > 0) { for(Map.Entry<K,V> e : entrySet0()) { s.writeObject(e.getKey()); s.writeObject(e.getValue()); } } } private static final long serialVersionUID = 362498820763181265L; //反序列化 private void readObject(java.io.ObjectInputStream s) throws IOException, ClassNotFoundException { // Read in the threshold (ignored), loadfactor, and any hidden stuff s.defaultReadObject(); if (loadFactor <= 0 || Float.isNaN(loadFactor)) { throw new InvalidObjectException("Illegal load factor: " + loadFactor); } // set other fields that need values table = (Entry<K,V>[]) EMPTY_TABLE; // Read in number of buckets s.readInt(); // ignored. // Read number of mappings int mappings = s.readInt(); if (mappings < 0) throw new InvalidObjectException("Illegal mappings count: " + mappings); // capacity chosen by number of mappings and desired load (if >= 0.25) int capacity = (int) Math.min( mappings * Math.min(1 / loadFactor, 4.0f), // we have limits... HashMap.MAXIMUM_CAPACITY); // allocate the bucket array; if (mappings > 0) { inflateTable(capacity); } else { threshold = capacity; } init(); // Give subclass a chance to do its thing. // Read the keys and values, and put the mappings in the HashMap for (int i = 0; i < mappings; i++) { K key = (K) s.readObject(); V value = (V) s.readObject(); putForCreate(key, value); } } // These methods are used when serializing HashSets int capacity() { return table.length; } float loadFactor() { return loadFactor; }}
- 【JDK源码阅读8-util】Map接口----HashMap
- 【JDK源码阅读7-util】Map接口
- 【JDK源码阅读9-util】Map接口之LinkedHashMap
- 【JDK源码阅读12-util】Map接口----TreeMap
- JDK源码阅读之Map接口
- 【JDK源码阅读10-util】Set接口---HashSet
- 【JDK源码阅读11-util】Set接口---LinkedHashSet
- 【JDK源码阅读13-util】Set接口---TreeSet
- 【JDK源码阅读14-util.concurrent.locks】锁-Lock接口
- JDK源码阅读——Map(HashMap\TreeMap\LinkedHashMap)
- JDK源码阅读之Map接口和Set接口
- JDK源码阅读之 HashMap
- Jdk源码阅读之Java.util.concurrent
- 【JDK源码阅读1-util】Collection
- 【JDK源码阅读2-util】Collection-List
- 【JDK源码阅读6-util】Collection-Set
- JDK源码阅读之HashMap的实现
- JDK源码阅读之HashMap类
- Post/重定向/Get模式
- dp uva1626 括号序列
- uva 493
- leetcode 19. Remove Nth Node From End of List 单向链表删除第n个数
- 股票数据API整理
- 【JDK源码阅读8-util】Map接口----HashMap
- springmvc-Model和ModelAndView的区别
- 表单异步提交
- [leetcode]223. Rectangle Area
- 用 SQLite 和 FMDB 替代 Core Data
- BZOJ1305: [CQOI2009]dance跳舞
- [LeetCode] 89. Gray Code
- 二分查找
- java svg 转图片