一个异常引发的对Hashtable和HashMap的思考

来源：互联网发布：linux如何查看历史命令编辑：程序博客网时间：2024/04/26 07:30

对于Hashtable和HashMap，相信每个学习Java的人都不会陌生，这两个集合在用法上并没有什么不同，但在使用环境上却有很大差别：

（1）区别，这两个类主要有以下几方面的不同：
      Hashtable和HashMap都实现了Map接口，但是Hashtable的实现是基于Dictionary抽象类
      在HashMap中，null可以作为键，这样的键只有一个；可以有一个或多个键所对应的值为null。
      当get()方法返回null值时，即可以表示 HashMap中没有该键，也可以表示该键所对应的值为null。
      因此，在HashMap中不能由get()方法来判断HashMap中是否存在某个键，而应该用containsKey()方法来判断。
     而在Hashtable中，无论是key还是value都不能为null。

这两个类最大的不同在于：
（1）Hashtable是线程安全的，它的方法是同步了的，可以直接用在多线程环境中。
（2）而HashMap则不是线程安全的。在多线程环境中，需要手动实现同步机制。

     上面所提的是面试官非常热衷提问的(当然有水平的公司也会问的更深，比如HashMap的实现机制)，但这并非今天要说的重点。

本人学习Java语言多年，自认对这两个类了如指掌，可是一次变成过程中所遇到的异常，让我发现自己对这两个类的理解还不够深入。

前段时间，本人使用Java语言实现了一个时间调度算法，这个算法是本人一片论文中的，该算法涉及多线程，所以我理所应当的用到了HashTable,但在测试阶段却频繁的跳出一个异常，ConcurrentModificationException，虽然很快得到了很好的解决，但这个异常，使我对HashMap，Hashtable，ConcurrentHashMap有了一个更深层的认识。

首先，很多人都知道，多线程情况下应该使用HashTable，或是使用Collections中的SynchronizedMap对HashMap进行同步。但看似同步的Map却仍然存在潜在的线程安全问题，可以考虑下面一种场景

如下面这段代码：
Java代码

<pre class="java" name="code"><span style="font-size:18px;">// shm是SynchronizedMap的一个实例       if(shm.containsKey('key')){           shm.remove(key);          }  </span>

这段代码用于从map中删除一个元素之前判断是否存在这个元素。这里的containsKey和reomve方法都是同步的，但是整段代码却不是。为什么？假设：线程A执行了containsKey方法返回true，准备执行remove操作；这时另一个线程B开始执行，同样执行了containsKey方法返回true，并接着执行了remove操作；然后线程A接着执行remove操作时发现此时已经没有这个元素了。这时就会抛出上面我所遇到的异常ConcurrentModificationException，要保证这段代码按我们的意愿工作，一个办法就是对这段代码进行同步控制，但是这么做付出的代价太大。

我算法中所遇到的异常产生于迭代过程中，代码如下：

<span style="font-size:18px;"> Iterator keys = map.keySet().iterator();      while(keys.hasNext()){           map.get(keys.next());         }    </span>

碰到这个异常的时候我也百思不解，明明是线程安全的怎么会产生这个异常，原来得到的keySet和迭代器都是Map中元素的一个“视图”，而不是“副本”。问题也就出现在这里，当一个线程正在迭代Map中的元素时，另一个线程可能正在修改其中的元素。此时，在迭代元素时就可能会抛出 ConcurrentModificationException异常。

意识到问题的所在，那解决起来也容易多了，最后我使用了ConcurrentHashMap做了替换。

ConcurrentHashMap提供了和Hashtable以及SynchronizedMap中所不同的锁机制。Hashtable中采用的锁机制是一次锁住整个hash表，从而同一时刻只能由一个线程对其进行操作；而ConcurrentHashMap中则是一次锁住一个桶。

    ConcurrentHashMap默认将hash表分为16个桶，诸如get,put,remove等常用操作只锁当前需要用到的桶。这样，原来只能一个线程进入，现在却能同时有16个写线程执行，并发性能的提升是显而易见的。
    在迭代方面，ConcurrentHashMap使用了一种不同的迭代方式。
    在这种迭代方式中，当iterator被创建后集合再发生改变就不再是抛出ConcurrentModificationException，取而代之的是在改变时new新的数据从而不影响原有的数据。 iterator完成后再将头指针替换为新的数据。这样iterator线程可以使用原来老的数据。而写线程也可以并发的完成改变。

至此，问题解决，同时，对于集合的多线程又有了一个新的了解，所以以后多线程还是用ConcurrentHashMap比较好！！！

0 0