Java6集合类源码解读-----HashMap的长度

来源:互联网 发布:基于of数据库管理系统 编辑:程序博客网 时间:2024/05/17 09:40

在阅读HashMap源码时,发现一个奇怪的现象:请看代码

HashMap.java

static final int DEFAULT_INITIAL_CAPACITY = 16;

HashMap的默认长度是16

public HashMap(int initialCapacity, float loadFactor) {        if (initialCapacity < 0)            throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);        if (initialCapacity > MAXIMUM_CAPACITY)            initialCapacity = MAXIMUM_CAPACITY;        if (loadFactor <= 0 || Float.isNaN(loadFactor))            throw new IllegalArgumentException("Illegal load factor: " + loadFactor);        int capacity = 1;        while (capacity < initialCapacity)            capacity <<= 1;        this.loadFactor = loadFactor;        threshold = (int) (capacity * loadFactor);        table = new Entry[capacity];        init();    }

上面是HashMap的构造函数,initialCapacity是容量,loadFactor是加载因子。但奇怪的是我们传进去的容量不一定是HashMap的实际容量,为什么?看这几句代码

int capacity = 1;while (capacity < initialCapacity)    capacity <<= 1;

局部变量capacity是HashMap的新的长度,进行位运算,而新的长度capacity大于initialCapacity(我们传进去的容量)的最小的2的幂,为什么HashMap的容量必须为2的幂?

所有的一切和这个函数有关:

static int indexFor(int h, int length) {    return h & (length-1);}

大家知道,HashMap使用数组和链表来实现的,而indexFor这个函数是根据key的一系列计算后的值来寻找数组下标。可能大家起疑惑了,这和HashMap的容量必须为2有什么关系?重点在与h&(length-1); 这个语句。为了追求速度,编写者用高效的位运算代替了效率较低的取余运算。但这个代替是有条件的,即h&(length-1)中的length必须是2的幂次方。下面是一段测试代码:

    public static void main(String[] args) {        Hashtable<Integer, Integer> hashtable = new Hashtable<>();        int value = 113;        for (int i = 0; i < 10000; i++) {            hashtable.put(i & (value - 1), i & (value - 1));        }        for(Iterator<Integer> iterator= hashtable.keySet().iterator();iterator.hasNext();) {            int key = iterator.next();            System.out.println("key = " + key + " value = " + hashtable.get(key));        }    }

以上是我写的一下段代码,测试长度不是2的幂次方(113)的情况下能放几个数,结果很遗憾:

key = 32 value = 32key = 64 value = 64key = 96 value = 96key = 16 value = 16key = 48 value = 48key = 80 value = 80key = 112 value = 112key = 0 value = 0

如果是2的幂次方的情况,假设是16的情况下:

key = 15 value = 15key = 14 value = 14key = 13 value = 13key = 12 value = 12key = 11 value = 11key = 10 value = 10key = 9 value = 9key = 8 value = 8key = 7 value = 7key = 6 value = 6key = 5 value = 5key = 4 value = 4key = 3 value = 3key = 2 value = 2key = 1 value = 1key = 0 value = 0

看到这里可能明白了,如果不是2的幂次方,存储空间变会少,造成大量空间被浪费掉。所以,无论是HashMap的初始化,还是默认值,都是2的幂次方。

原创粉丝点击