HashMap结构,原理

来源:互联网 发布:西安航海家软件 编辑:程序博客网 时间:2024/05/21 01:27

一.HashMap容器概念

容器存储结构:Entry[] table

    static class Entry<K,V> implements Map.Entry<K,V> {        final K key;        V value;        Entry<K,V> next;        final int hash;

容器大小:容器默认可以存放16个K-V元素;也可以自己指定容器大小;容器的大小始终为2的n次方,

数组的索引:key的hashcode * table.length

容器扩容阀值:threshold = table.length * 0.75 

容器扩容大小:table.size * 2

二.HashMap.put

分析HashMap.put(K,V)方法:

1.计算Key的hash值

2.根据容器大小和key的hashcode值计算table的索引index(hash & (length-1);)

3.table[index]=value存放

    hash值不相同:保存在table[index]=value位置

    hash值相同:进行equals比较:相同进行替换;不相同,链表方式新增;

4.如果table.size > table.length * 0.75 进行rehash,扩容;

所以:对象重写了equals方法,必须同时重写hashcode,为什么呢?

1.首先必须清楚object中的equals是比较内存地址,如果内存地址相等,则认为是2个相同的对象。

2.如果一个新的对象重写equals,则要求hashcode的计算规则要和equals的判断对象是否相同的逻辑保持一致,比如equals比较对象中的name属性,name相同认为对象相同,则此时hashcode的计算方式也必须用到name属性来计算hash,如果不重写,往hashmap这样的容器中存放会将相同的对象存在在不同的table中,因为不重写带来hashcode值可能不相同

三.HashMap的扩容

请看下面2段代码
//测试类public class HashMapTest {    public static void main(String[] args) {        Map<Value, String> map = new HashMap<Value, String>(2);//初始容量2        Map<Value, String> map = new HashMap<Value, String>(3);//初始容量4        Map<Value, String> map = new HashMap<Value, String>();//初始容量16        map.put(new Value("3"), "3");        System.out.println(map);        map.put(new Value("7"), "7");        System.out.println(map);        map.put(new Value("5"), "5");        System.out.println(map);        map.put(new Value("9"), "9");        System.out.println(map);    }}

//存放于HashMap中的K-Vpublic class Value {    private String value;    public Value(String value) {        this.value = value;    }    public String getValue() {        return value;    }    public void setValue(String value) {        this.value = value;    }    @Override    public int hashCode() {        return 1;//注意这里重写了    }    @Override    public String toString() {        return value;//注册这里重写了    }}

往HashMap中顺序存放3,7,5,9,如果初始容量大小不同,最终的结果是不同的,请看每种容量下的运行结果

1.初始容量为2,最终运行结果
Map<Value, String> map = new HashMap<Value, String>(2);//初始容量2,threshold = 1

这里运行的结果为:7,3,5,9,在put(5,5)后进行了扩容,table长度为4,在put(9,9)又一次扩容,table的长度为8
2.初始容量为3,最终运行结果
Map<Value, String> map = new HashMap<Value, String>(3);//初始容量4,threshold = 3

这里运行的结果为:3,7,5,9,进行了扩容,扩容后table的长度为8
3.初始容量为16,最终运行结果
Map<Value, String> map = new HashMap<Value, String>();//初始容量16,threshold = 12

这里运行的结果为:9,5,7,3,进行进行扩容,table的长度为16

------------------------------------------为什么呢?------------------------------------------
下面看下HashMap中的put方法
    public V put(K key, V value) {        if (key == null)            return putForNullKey(value);        //计算hash值,并通过hash和table.length -1进行索引的计算        int hash = hash(key.hashCode());        int i = indexFor(hash, table.length);        //对key进行hash和equals比较,若存在,进行value替换        for (Entry<K,V> e = table[i]; e != null; e = e.next) {            Object k;            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {                V oldValue = e.value;                e.value = value;                e.recordAccess(this);                return oldValue;            }        }        modCount++;        //该key不存在,新增Entry        addEntry(hash, key, value, i);        return null;    }
新增entry
    void addEntry(int hash, K key, V value, int bucketIndex) {Entry<K,V> e = table[bucketIndex];        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);//把原先的e作为当前e的next值        //查看当前的size是否超过了设定的阈值threshold,如果超过,需要扩容,注意这里进行了size++        if (size++ >= threshold)            resize(2 * table.length);    }

将老的table迁移到新的table上
    void resize(int newCapacity) {        Entry[] oldTable = table;        int oldCapacity = oldTable.length;        if (oldCapacity == MAXIMUM_CAPACITY) {            threshold = Integer.MAX_VALUE;            return;        }        //创建新的Entry[]        Entry[] newTable = new Entry[newCapacity];        //rehash,将oldTable迁移到newTable        transfer(newTable);        table = newTable;        //计算新的扩容阀值        threshold = (int)(newCapacity * loadFactor);    }
//rehash过程,将原先链表尾部的元素移动到newTable链表头部
    void transfer(Entry[] newTable) {        Entry[] src = table;        int newCapacity = newTable.length;        //以new HashMap(2)来说,依次put(3,3),put(7,7)后,oldTable中的结构为7,next指向3        for (int j = 0; j < src.length; j++) {            //e对应的Entry对象key=7,value=7,next=3(Entry的key=3,value=3,next=null)            Entry<K,V> e = src[j];            if (e != null) {                src[j] = null;                do {                    //next=3(Entry的key=3,value=3,next=null)                    Entry<K,V> next = e.next;                    int i = indexFor(e.hash, newCapacity);                    e.next = newTable[i];//第1次遍历(e=7),next执行null,因为newTable[i]=null),第2次遍历(e=3),next指向newTable[i]已经存在的entry,也就是7                    newTable[i] = e;//设置newTable[i] = 7                    e = next;//下次遍历从当前e指向的next=3开始,所以这里可以看出,原先链表尾部的变成了链表头部                } while (e != null);            }        }    }
------------------------------------------------------------------------------
从源代码分析来看:
HashMap map = new HashMap(2),依次put(3,3),put(7,7),put(5,5),put(9,9)
经历第1次扩容后顺序变为3,7
经历第2次扩容后顺序变为7,3,5,9
------------------------------------------------------------------------------
四.HashMap死循环
产生的原因是:d多线程并发put时,形成了环形链表,引起死循环,分析如下
新建Map:HashMap map = new HashMap(8); 此时扩容的阀值threshod=6
线程1执行如下代码
map.put(new Value("1"), "1");map.put(new Value("2"), "2");map.put(new Value("3"), "3");map.put(new Value("4"), "4");map.put(new Value("5"), "5");map.put(new Value("6"), "6");map.put(new Value("7"), "7");

线程2执行如下代码
map.put(new Value("8"), "8");
在看rehash的代码
    void transfer(Entry[] newTable) {        Entry[] src = table;        int newCapacity = newTable.length;        for (int j = 0; j < src.length; j++) {            Entry<K,V> e = src[j];            if (e != null) {                src[j] = null;                do {                    Entry<K,V> next = e.next;//线程1挂起,开始切换线程2执行和扩容                    int i = indexFor(e.hash, newCapacity);                    e.next = newTable[i];                    newTable[i] = e;                } while (e != null);            }        }    }
线程1在put(new Value("7"),"7")时进行扩容(因为size>thresold),扩容过程中在上面代码09行挂起,此时线程1的oldTable和newTable如下

线程2执行put(new Value("8","8")后,完成扩容,table.length=16,thresold=12,newTable如下

线程1唤醒继续扩容,此时线程2的newTable变成了table, 线程1扩容时将线程2的newTable移动倒线程1的newTable中

五.HashMap使用场景

适合于读多写少的场景,比如国家,地区列表的初始值可以放入全局的HashMap中,提高读取的速度

方法内部作临时转换用,比如按key进行分类,方便快速查找

六.思考点

为什么内部要用链表来实现呢?在来看下链表是啥回事




0 0
原创粉丝点击