Java集合HashSet-ArrayList-HashMap的线程同步控制方法和区别

来源:互联网 发布:测试办公软件使用 编辑:程序博客网 时间:2024/05/03 08:25
   Collections类中提供了多个synchronizedXxx,该方法返回指定集合对象对应的同步对象,从而可以解决多线程并发访问集合时的线程安全问题.
   正如Java中常用的集合框架推荐使用的三个实现类:HashSet\ArrayList\HashMap都是线程不安全的.如果有多条线程访问它们,而且有超过一条的线程试图修改它们,则可能出现错务.Collections提供了多个静态方法用于创建同步集合
下面程序创建了四个同步的集合对象
import java.util.*;
public class  TestSynchronized
{
public static void main(String[] args)
{
 //下面程序创建了四个同步的集合对象
 Collection c=Collections.synchronizedCollection(new ArrayList());
 List list=Collections.synchronizedList(new ArrayList());
 Set s=Collections.synchronizedSet(new HashSet());
 Map m=Collections.synchronizedMap(new HashMap());
}
}
   在上面的程序中,直接将创建的集合对象传给了Collections的synchronizedXxx方法,这样就直接获取List,Set和Map的线程安全实现版本了
 补充一点说明
Vector,HashTable是线程安全的集合类,不过,这两种类是很早的用法,现在一般要尽量少采用
Java提供了数种持有对象的方式,包括语言内置的Array,还有就是 utilities中提供的容器类(container classes),又称群集类(collection classes)。集合在java中非常重要,在讨论之前,先来看几个面试中的经典问题。
1 Collection 和 Collections的区别。
2 List, Set, Map是否继承自Collection接口。
3 ArrayList和Vector的区别。
4 HashMap和Hashtable的区别。
集合Collection接口
--Collection 是任何对象组,元素各自独立,通常拥有相同的套用规则。Set List由它派生。
基本操作 增加元素add(Object obj); addAll(Collection c);
删除元素 remove(Object obj); removeAll(Collection c);
求交集 retainAll(Collection c);
访问/遍历集合元素的好办法是使用Iterator接口(迭代器用于取代Enumeration)
Public interface Iterator{
Public Boolean hasNext();
Public Object next();
Public void remove();
}
集set
--没有重复项目的集合
有三种特定类型的集可用
HashSet-基于散列表的集,加进散列表的元素要实现hashCode()方法
LinkedHashSet-对集迭代时,按增加顺序返回元素
TreeSet-基于(平衡)树的数据结构
清单List
--位置性集合。加进清单的元素可以加在清单中特定位置或加到末尾
有两个特定版本
ArrayList(数组表)-类似于Vector,都用于缩放数组维护集合。区别:
一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半
LinkedList(链表)-是双向链表,每个节点都有两个指针指向上一节点和下一节点。
用在FIFO,用addList()加入元素 removeFirst()删除元素
用在FILO,用addFirst()/removeLast()
ListIterator提供双向遍历next() previous(),可删除、替换、增加元素
映射表Map
--用于关键字/数值对,像个Dictionary
处理Map的三种集合
关键字集KeySet()
数值集value()
项目集enrySet()
四个具体版本
HashMap-散列表的通用映射表
LinkedHashMap-扩展HashMap,对返回集合迭代时,维护插入顺序
WeakHashMap-基于弱引用散列表的映射表,如果不保持映射表外的关键字的引用,则内存回收程序会回收它
TreeMap-基于平衡树的映射表
Collections类,用于同步集合,还能改变集合只读方式的类
e.g.:
Map mp=new HashMap()
mp=Collections.synchronizedMap(mp); //生成线程安全的映射表
mp=Collections.unmodifiableMap(mp); //生成只读映射表
Comparable 自然顺序的排序类 Comparator 面向树的集合排序类
容器分类学(Container taxonomy)
集合接口: Collection List Set;Map Iterator ListIterator。
抽象类: AbstractCollection AbstractList AbstractSet AbstractMap AbstractSequentiaList。
老版本中的集合类型
Vector类
Vector,就是向量。一种异构的混合体,可以动态增加容量。对它的操作简要如下
比如我们有一个Vector: Vector myVec=new Vector(a_Array.length)
取得vector的长度:myVec.size();
赋值:set(int position,Object obj) / setElementAt(Object obj, int position) –不支持动态增长
add(Object obj )/ addElement(Object obj) 在Vector末尾加入对象
e.g.:myVec.add(new a_Array[0]);
取出元素:get(int position) / getElement(int position)
Stack类
是Vector的子类。就是数据结构里讲滥了的堆栈(这个词可简称栈,不要混淆于heap-堆)。后进先出的存取方式。
Stack()构造空栈
Empty()叛空
Search()检查堆栈是否有元素
Peek()取得栈顶元素
Pop()弹栈
Push()入栈
Enumeration接口
Dictionary类
字典。关键字/数值方式存取数据,如果映射没有此关键字,取回null。
Hashtable类
是Dictionary结构的具体实现。
面试题答案
Collection 和 Collections的区别。
Collections是个java.util下的类,它包含有各种有关集合操作的静态方法。
Collection是个java.util下的接口,它是各种集合结构的父接口。
List, Set, Map是否继承自Collection接口? List,Set是 Map不是
ArrayList和Vector的区别。
一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半
HashMap和Hashtable的区别
一.历史原因:Hashtable是基于陈旧的Dictionary类的,HashMap是Java 1.2引进的Map接口的一个实现
二.同步性:Hashtable是线程安全的,也就是说是同步的,而HashMap是线程序不安全的,不是同步的

三.值:只有HashMap可以让你将空值作为一个表的条目的key或value




--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



集合类

  • Set
    • HashSet
      • 优点:
          后台实现一个hash table 加速get和contains方法。后台使用数组保存
        缺点:
         默认大小为16, 如果超过则需要重新申请内存空间,大小为原来的两倍,并把原来的数据内容复制到
         新的内存空间中。
         线程不安全(需通过Collections.synchronizedList方法设置)
         加入的元素顺序会因其内部的hash排序而改变

        注:通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。

    • LinkedHashSet
      • 优点:
          后台实现一个hash table 加速get和contains方法。后台使用链表保存
        缺点:
         默认大小为16, 如果超过则需要重新申请内存空间,大小为原来的两倍,并把原来的数据内容复制到
         新的内存空间中。
         线程不安全(需通过Collections.synchronizedList方法设置)
         加入的元素顺序会因其内部的hash排序而改变

        注:通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。

    • TreeSet
      • 优点:
          通过一个HashMap来实现数据的保存,内部实现红黑树数据结构,使所有元素按升序保存。
          提供高效的get和contains方法,保存操作的效率为log(n)
        缺点:
         默认大小为16, 如果超过则需要重新申请内存空间,大小为原来的两倍,并把原来的数据内容复制到
         新的内存空间中(来自HashMap)。
         线程不安全(需通过Collections.synchronizedList方法设置)
         加入的元素升级排序而改变

        注:treeset对元素有要求,必须实现Comparable接口或是Comparator 接口)

        注:通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。

    • CopyOnWriteArraySet
      • 优点:
         针对于对Set操作的情况有很多变化时使用,优其是在高并发的情况不想使用同步控制锁时
        缺点:
         消耗比较大的资料,每次作更新操作时,都会重新Copy一块内存后,再做合并操作。
  • List
    • ArrayList
      • 优点:
           使用数组,提供快速的get,add和iterate方法,占用比较小的内存空间
        缺点:
           线程不安全(需通过Collections.synchronizedList方法设置)
           insert和remove操作,非常慢(需要移动数组元素来实现)
           当size超过时,需要新建一个较大的数据(默认大小是10,增量是 (size * 3)/2 + 1,
           且把原来的数据都复制到新的上面)

    • LinkedList
      • 优点:
           使用链表结构,提供快速的add, insert, remove方法,占用比较小的内存空间
        缺点:
           线程不安全(需通过Collections.synchronizedList方法设置)
           get操作,非常慢(需要从head一级级遍历查找)

    • Vector
      • 优点:
         线程安全。
        缺点:
         相对于ArrayList效率要低。拥有ArrayList的缺点。
    • CopyOnWriteArrayList
      • 优点:
         针对于对List操作的情况有很多变化时使用,优其是在高并发的情况不想使用同步控制锁时
        缺点:
         消耗比较大的资料,每次作更新操作时,都会重新Copy一块内存后,再做合并操作。
    • TreeList(apache commons-collections)提供
      • 优点:
         基于二叉数  提供比较快速的get, add,insert,iterate,remove方法。其中get,add和iterate方法比ArrayList稍慢一点。
        缺点:
         相对于ArrayList和LinkedList占比较多的内存空间
         线程不安全(需通过Collections.synchronizedList方法设置)

  • Map
    • ConcurrentHashMap
      • 优点:
         基于二叉数  提供比较快速的get, add,iterate方法。默认大小的16.
         它是线程安全
        缺点:
         如果大小超过设定的大小时,效率会非常低。它会重新申请内存空间(原来空间的两倍),同时把原来的值复制到新内存空间上。
         



原创粉丝点击