比较分析Vector、ArrayList和hashtable hashmap数据结构

来源:互联网 发布:水果淘宝 编辑:程序博客网 时间:2024/06/05 11:50
 
线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构。这些类均在java.util包中。本文试图通过简单的描述,向读者阐述各个类的作用以及如何正确使用这些类。

Collection
List
│├LinkedList
│├ArrayList
│└Vector
│ └Stack
Set
Map

├Hashtable
├HashMap
└WeakHashMap

Collection接口
  Collection是最基本的集合接口,一个Collection代表一组Object,即Collection的元素(Elements)。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。JavaSDK不提供直接继承自Collection的类,JavaSDK提供的类都是继承自Collection的“子接口”如List和Set。
    如何遍历Collection中的每一个元素?不论Collection的实际类型如何,它都支持一个iterator()的方法,该方法返回一个迭代子,使用该迭代子即可逐一访问Collection中每一个元素。典型的用法如下:
    Iterator it =collection.iterator(); // 获得一个迭代子
    while(it.hasNext()) {
      Object obj = it.next(); // 得到下一个元素
    }

  由Collection接口派生的两个接口是List和Set。

List接口
  List是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在List中的位置,类似于数组下标)来访问List中的元素,这类似于Java的数组。
  实现List接口的常用类有LinkedList,ArrayList,Vector和Stack。

LinkedList类
  LinkedList实现了List接口,允许null元素。此外LinkedList提供额外的get,remove,insert方法在LinkedList的首部或尾部。这些操作使LinkedList可被用作堆栈(stack),队列(queue)或双向队列(deque)。
  注意LinkedList没有同步方法。如果多个线程同时访问一个List,则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List:
    List list =Collections.synchronizedList(new LinkedList(...));

ArrayList类
  ArrayList实现了可变大小的数组。它允许所有元素,包括null。ArrayList没有同步。
size,isEmpty,get,set方法运行时间为常数。但是add方法开销为分摊的常数,添加n个元素需要O(n)的时间。其他的方法运行时间为线性。
  

Vector类
  Vector非常类似ArrayList,但是Vector是同步的。

Stack 类
  Stack继承自Vector,实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。

Set接口
  Set是一种不包含重复的元素的Collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,Set最多有一个null元素。
  

Map接口
  请注意,Map没有继承Collection接口,Map提供key到value的映射。Hashtable类
  Hashtable继承Map接口,实现一个key-value映射的哈希表。任何非空(non-null)的对象都可作为key或者value。
  Hashtable通过initial capacity和loadfactor两个参数调整性能。通常缺省的load factor0.75较好地实现了时间和空间的均衡。增大loadfactor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。
使用Hashtable的简单示例如下,将1,2,3放到Hashtable中,他们的key分别是”one”,”two”,”three”:
    Hashtable numbers= new Hashtable();
    numbers.put(“one”, new Integer(1));
    numbers.put(“two”, new Integer(2));
    numbers.put(“three”, new Integer(3));

  要取出一个数,比如2,用相应的key:
    Integer n =(Integer)numbers.get(“two”);
    System.out.println(“two = ” + n);

  
  如果相同的对象有不同的hashCode,对哈希表的操作会出现意想不到的结果(期待的get方法返回null),要避免这种问题,只需要牢记一条:要同时复写equals方法和hashCode方法,而不要只写其中一个。
  Hashtable是同步的。

HashMap类
  HashMap和Hashtable类似,不同之处在于HashMap是非同步的,并且允许null,即nullvalue和null key.

WeakHashMap类
  WeakHashMap是一种改进的HashMap,它对key实行“弱引用”,如果一个key不再被外部所引用,那么该key可以被GC回收。

总结
  如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
  如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
  要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
  尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。

同步性
Vector是同步的。这个类中的一些方法保证了Vector中的对象是线程安全的。而ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果你不需要线程安全的集合那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销。
数据增长
从内部实现机制来讲ArrayList和Vector都是使用数组(Array)来控制集合中的对象。当你向这两种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度,Vector缺省情况下自动增长原来一倍的数组长度,ArrayList是原来的50%,所以最后你获得的这个集合所占的空间总是比你实际需要的要大。所以如果你要在集合中保存大量的数据那么使用Vector有一些优势,因为你可以通过设置集合的初始化大小来避免不必要的资源开销。
使用模式

 

VectorHashtable都是jdk1.0的就有了的。后来到java2后,java的容器框架改很多,了兼容,就VectorHashtable别实现了新的容器框架的ListMapArrayListHashMap都是java2(也就是jdk1.2)后才有的。
1.安全、效率方面:如果要实现安全,要用VectorHashtable,否则则ArrayListHashMap,因ArrayListHashMap不考安全的问题,所以效率要高些。但Collections可以解决问题
          Collections.synchronizedList
Collections.synchronizedMap
       2.源方面:当两者的容量已满时,它都会自其容量,但Vector是按其容量的一倍增,而ArrayList按其容量的50%增加,所以Vector更能源。
        3.迭代器:VectorHashtable使用Enumeration,ArrayListHashMap使用Iterator
      ARRAY是必在声明的;ARRYLIST也是和Vector,可以自增加
      ListSet的区
       List用来理序列,而Set用来理集
       List中的内容可以重,而Set不行
     VectorArrayListHashtableHashMap的区别:
             1.VectorArrayList是数值联系对象。按照插入的顺序进行排列,可以有重复值。
             2.HashtableHashMap是对象联系对象。按照自己的排列方式进行排序,不可以有重复值。
     HashMap:承了Map接口,实现Keys来存访问Values,Keys和Values都可以空,它与Hashtable的区在于HashtableKeys不能null,
     Vector内部实际是以Array实现的,也通元素的整数索引来访问元素,但它只能存放java.lang.Object象,不能用于存放基本型数据,比如要存放一个整数10,得用newInteger(10)构造出一个Integer包装类对象再放去。 
还有一点:
HASHMAP不是同步的,线程不安全的,HASHTABLE是同步的,线程安全的?  
在Hashtable中,所有涉及到更新其中存放的内容的方法都是同步的 

原创粉丝点击