Java集合HashSet-ArrayList-HashMap的线程同步控制方法和区别

来源：互联网发布：测试办公软件使用编辑：程序博客网时间：2024/05/03 08:25

   Collections类中提供了多个synchronizedXxx,该方法返回指定集合对象对应的同步对象,从而可以解决多线程并发访问集合时的线程安全问题.
   正如Java中常用的集合框架推荐使用的三个实现类:HashSet\ArrayList\HashMap都是线程不安全的.如果有多条线程访问它们,而且有超过一条的线程试图修改它们,则可能出现错务.Collections提供了多个静态方法用于创建同步集合
下面程序创建了四个同步的集合对象
import java.util.*;
public class TestSynchronized
{
public static void main(String[] args)
{
//下面程序创建了四个同步的集合对象
Collection c=Collections.synchronizedCollection(new ArrayList());
List list=Collections.synchronizedList(new ArrayList());
Set s=Collections.synchronizedSet(new HashSet());
Map m=Collections.synchronizedMap(new HashMap());
}
}
   在上面的程序中,直接将创建的集合对象传给了Collections的synchronizedXxx方法,这样就直接获取List,Set和Map的线程安全实现版本了
补充一点说明
Vector,HashTable是线程安全的集合类,不过,这两种类是很早的用法,现在一般要尽量少采用
Java提供了数种持有对象的方式，包括语言内置的Array，还有就是 utilities中提供的容器类(container classes)，又称群集类(collection classes)。集合在java中非常重要，在讨论之前，先来看几个面试中的经典问题。
1 Collection 和 Collections的区别。
2 List, Set, Map是否继承自Collection接口。
3 ArrayList和Vector的区别。
4 HashMap和Hashtable的区别。
集合Collection接口
--Collection 是任何对象组，元素各自独立，通常拥有相同的套用规则。Set List由它派生。
基本操作增加元素add(Object obj); addAll(Collection c);
删除元素 remove(Object obj); removeAll(Collection c);
求交集 retainAll(Collection c);
访问/遍历集合元素的好办法是使用Iterator接口(迭代器用于取代Enumeration)
Public interface Iterator{
Public Boolean hasNext();
Public Object next();
Public void remove();
}
集set
--没有重复项目的集合
有三种特定类型的集可用
HashSet-基于散列表的集，加进散列表的元素要实现hashCode()方法
LinkedHashSet-对集迭代时，按增加顺序返回元素
TreeSet-基于（平衡）树的数据结构
清单List
--位置性集合。加进清单的元素可以加在清单中特定位置或加到末尾
有两个特定版本
ArrayList(数组表)-类似于Vector，都用于缩放数组维护集合。区别：
一.同步性:Vector是线程安全的，也就是说是同步的，而ArrayList是线程序不安全的，不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培，而ArrayList却是原来的一半
LinkedList(链表)-是双向链表，每个节点都有两个指针指向上一节点和下一节点。
用在FIFO，用addList()加入元素 removeFirst()删除元素
用在FILO,用addFirst()/removeLast()
ListIterator提供双向遍历next() previous()，可删除、替换、增加元素
映射表Map
--用于关键字/数值对，像个Dictionary
处理Map的三种集合
关键字集KeySet()
数值集value()
项目集enrySet()
四个具体版本
HashMap-散列表的通用映射表
LinkedHashMap-扩展HashMap，对返回集合迭代时，维护插入顺序
WeakHashMap-基于弱引用散列表的映射表，如果不保持映射表外的关键字的引用，则内存回收程序会回收它
TreeMap-基于平衡树的映射表
Collections类，用于同步集合，还能改变集合只读方式的类
e.g.:
Map mp=new HashMap()
mp=Collections.synchronizedMap(mp); //生成线程安全的映射表
mp=Collections.unmodifiableMap(mp); //生成只读映射表
Comparable 自然顺序的排序类 Comparator 面向树的集合排序类
容器分类学(Container taxonomy)
集合接口： Collection List Set;Map Iterator ListIterator。
抽象类： AbstractCollection AbstractList AbstractSet AbstractMap AbstractSequentiaList。
老版本中的集合类型
Vector类
Vector，就是向量。一种异构的混合体，可以动态增加容量。对它的操作简要如下
比如我们有一个Vector: Vector myVec=new Vector(a_Array.length)
取得vector的长度:myVec.size();
赋值：set(int position,Object obj) / setElementAt(Object obj, int position) –不支持动态增长
add(Object obj )/ addElement(Object obj) 在Vector末尾加入对象
e.g.：myVec.add(new a_Array[0]);
取出元素：get(int position) / getElement(int position)
Stack类
是Vector的子类。就是数据结构里讲滥了的堆栈（这个词可简称栈，不要混淆于heap-堆）。后进先出的存取方式。
Stack()构造空栈
Empty()叛空
Search()检查堆栈是否有元素
Peek()取得栈顶元素
Pop()弹栈
Push()入栈
Enumeration接口
Dictionary类
字典。关键字/数值方式存取数据，如果映射没有此关键字，取回null。
Hashtable类
是Dictionary结构的具体实现。
面试题答案
Collection 和 Collections的区别。
Collections是个java.util下的类，它包含有各种有关集合操作的静态方法。
Collection是个java.util下的接口，它是各种集合结构的父接口。
List, Set, Map是否继承自Collection接口? List，Set是 Map不是
ArrayList和Vector的区别。
一.同步性:Vector是线程安全的，也就是说是同步的，而ArrayList是线程序不安全的，不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培，而ArrayList却是原来的一半
HashMap和Hashtable的区别
一.历史原因:Hashtable是基于陈旧的Dictionary类的，HashMap是Java 1.2引进的Map接口的一个实现
二.同步性:Hashtable是线程安全的，也就是说是同步的，而HashMap是线程序不安全的，不是同步的

三.值：只有HashMap可以让你将空值作为一个表的条目的key或value

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

集合类

Set
- HashSet
  - 优点：
    后台实现一个hash table 加速get和contains方法。后台使用数组保存
    缺点：
    默认大小为16，如果超过则需要重新申请内存空间，大小为原来的两倍，并把原来的数据内容复制到
    新的内存空间中。
    线程不安全(需通过Collections.synchronizedList方法设置)
    加入的元素顺序会因其内部的hash排序而改变
    
    注：通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。
- LinkedHashSet
  - 优点：
    后台实现一个hash table 加速get和contains方法。后台使用链表保存
    缺点：
    默认大小为16，如果超过则需要重新申请内存空间，大小为原来的两倍，并把原来的数据内容复制到
    新的内存空间中。
    线程不安全(需通过Collections.synchronizedList方法设置)
    加入的元素顺序会因其内部的hash排序而改变
    
    注：通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。
- TreeSet
  - 优点：
    通过一个HashMap来实现数据的保存，内部实现红黑树数据结构，使所有元素按升序保存。
    提供高效的get和contains方法，保存操作的效率为log(n)
    缺点：
    默认大小为16，如果超过则需要重新申请内存空间，大小为原来的两倍，并把原来的数据内容复制到
    新的内存空间中（来自HashMap)。
    线程不安全(需通过Collections.synchronizedList方法设置)
    加入的元素升级排序而改变
    
    注：treeset对元素有要求，必须实现Comparable接口或是Comparator 接口)
    
    注：通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。
- CopyOnWriteArraySet
  - 优点：
    针对于对Set操作的情况有很多变化时使用，优其是在高并发的情况不想使用同步控制锁时
    缺点：
    消耗比较大的资料，每次作更新操作时，都会重新Copy一块内存后，再做合并操作。
List
- ArrayList
  - 优点：
       使用数组,提供快速的get,add和iterate方法，占用比较小的内存空间
    缺点：
       线程不安全(需通过Collections.synchronizedList方法设置)
       insert和remove操作，非常慢(需要移动数组元素来实现)
       当size超过时，需要新建一个较大的数据(默认大小是10,增量是 (size * 3)/2 + 1,
       且把原来的数据都复制到新的上面)
- LinkedList
  - 优点：
       使用链表结构,提供快速的add, insert, remove方法，占用比较小的内存空间
    缺点：
       线程不安全(需通过Collections.synchronizedList方法设置)
       get操作，非常慢(需要从head一级级遍历查找)
- Vector
  - 优点：
    线程安全。
    缺点：
    相对于ArrayList效率要低。拥有ArrayList的缺点。
- CopyOnWriteArrayList
  - 优点：
    针对于对List操作的情况有很多变化时使用，优其是在高并发的情况不想使用同步控制锁时
    缺点：
    消耗比较大的资料，每次作更新操作时，都会重新Copy一块内存后，再做合并操作。
- TreeList(apache commons-collections)提供
  - 优点：
    基于二叉数提供比较快速的get, add,insert,iterate,remove方法。其中get,add和iterate方法比ArrayList稍慢一点。
    缺点：
    相对于ArrayList和LinkedList占比较多的内存空间
    线程不安全(需通过Collections.synchronizedList方法设置)
Map
- ConcurrentHashMap
  - 优点：
    基于二叉数提供比较快速的get, add,iterate方法。默认大小的16.
    它是线程安全
    缺点：
    如果大小超过设定的大小时，效率会非常低。它会重新申请内存空间（原来空间的两倍)，同时把原来的值复制到新内存空间上。