【颗粒归仓】--java集合

来源:互联网 发布:加百列和路西法知乎 编辑:程序博客网 时间:2024/04/30 06:12
   java集合大致分为Set、List、Queue和Map四种
     Set代表无序、不可重复的集合
     List代表有序、可重复的集合
     Map代表具有映射关系的集合

     Queue代表一种队列集合   (java5新增)


  一、Set:不允许包含相同的元素,不能记住元素的添加顺序
     1、HashSet:按Hash算法来存储集合中的元素,具有很好的存取和查找性能。
       特点:
          不能保证元素的排列顺序
          HashSet不是同步的,如果多个线程同时访问一个HashSet,假设有两个或者两个以上的线程同时修改HashSet集合时,则必须通过代码来保证其同步。
          集合元素值可以是null

       当向HashSet集合中存入元素时,HashSet会调用该对象的hashCode()方法得到该对象的hashCode值,然后根据该hashCode值决定该对象在HashSet中的存储位置。
       HashSet集合判断两元素相等的标准是两个对象通过equals()方法比较相等,并且两个对象的hashCode()方法值也相等。
      子类:
         LinkedHashSet,也是根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,这样使得元素看起来是以插入的书序来保存的。由于需要维护插入顺序,效率相对于HashSet较低。

    2、TreeSet:是SortedSet接口的唯一实现,可以确保元素处于排序状态。但是并不是根据元素的插入顺序进行排序,而是根据元素的实际值来进行排序。
      TreeSet采用红黑树的数据结构对元素进行排序


    3、EnumSet:是一个专门为枚举类设计的集合类,EnumSet中所有值都必须是指定枚举类型的枚举值。它的集合元素也是有序的,以枚举值在Enum类内的定义顺序来决定集合元素的顺序。
  EnumSet在内部以位向量的形式存储,不允许加入null元素。


  Set集合小结:
    HashSet和TreeSet是Set的两个典型实现,HashSet的性能总是比TreeSet好,因为TreeSet需要额外的红黑树算法来维护集合元素的次序。只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都使用HashSet。
    HashSet还有一个子类,LinkedHashSet,对于普通插入、删除操作,LinkedHashSet比HashSet要略慢一些,这是因为需要维护链表所带来的额外开销造成。但是因为有链表的存在,遍历LinkedHashSet会更快。
    EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素。
    Set的三个实现类HashSet、TreeSet、LinkedHashSet都是现场不安全的,如果是多线程环境,需要手动保证Set集合的同步性。


   二、List:作为Collection接口的子接口,可以实现Collection接口中的全部方法。因为List是有序集合,因此list集合里增加了一些根据索引来操作集合元素的方法
   1、ArrayList和Vector
     是两个典型实现,完全支持List接口的全部功能。。
      ArrayList和Vector类都是基于数组实现的List类,所以ArrayList和Vector类封装了一个动态再分配的Object[]数组,可以通过capacity属性来计算数组的长度。
      Vector是一个古老的集合。除此之外,ArrayList是线程不安全的,而Vector是线程安全的。但是,实际上,即使需要保证List集合线程安全,同样不推荐使用vector实现类。可使用Collections工具类,将ArrayList变成线程安全的。
    2、LinkedLList:它是一个基于链表实现的List,对于顺序访问集合中的元素进行了优化;特别是当插入、删除元素时速度非常快,这是因为LinkedList既实现了List接口,也实现了Deque接口


   三、Queue接口:用于模拟了队列这种数据结构,队列通常是“先进先出”的容器。
        LinkedList也实现了Deque接口,Deque接口是Queue接口的子类,代表一个双向队列。包括pop出栈、push(入栈)
        LinkedList与ArrayList、Vector的实现机制完全不同,ArrayList和Vector内部以数组的形式来保存集合中的元素,因此随机访问集合元素上有较好的性能;而LinkedList内部以链表形式来保存集合中元素,因此随机访问能力较差,但在插入、删除元素时性能非常出色。
       PriorityQueue是一个比较标准的队列实现类。PriorityQueue保存队列元素的顺序并不是按加入队列的顺序,而是按照队列元素的大小进行重新排序。
       PriorityQueue不允许插入null元素,它还需要队列元素进行排序。


    四、Map:
      用于保存具有映射关系的数据。Map接口有HashMap、LinkedHashMap、SortedMap、TreeMap、EnumMap等。此处与Set有相似之处。Map又与LIst存在相似之处:元素与元素之间可以重复,每个元素可以根据索引查找。
  
     1、HashMap和Hashtable实现类
         它们都是Map接口的电箱实现类,它们之间的关系完全类似于ArrayList和Vector的关系。
         Hashtable是一个古老的Map实现类
       区别:
          Hashtable是一个线程安全的Map实现,但HashMap是线程不安全的实现,所以HashMap比Hashtable的性能高。
          Hashtable不允许使用null作为key和value,但H安徽省Map可以使用null作为key或value。


       同HashSet集合不能保证元素的顺序一样,Hashtable、HashMap也不能保证其中key-value对的顺序。
 HashMap也有一个子类LinkedHashMap,也是使用双向链表来维护key-value对的次序。LinkedHashMap需要维护元素的插入顺序,因此性能略低于HashMap的性能。


    2、SortedMap和TreeMap
          Map派生出SortedMap子接口,SortedMap也有一个TreeMap实现类。  类似于TreeSet中判断两个元素相等的标准,TreeMap中判断两个key相等的标准也是两个key通过equals比较返回true,而通过compareTo方法返回0,TreeMap即认为这两个key是相等的。
 
    3、WeakHashMap:
       与HashMap的用法基本相似,区别在于,HashMap的key保留对实际对象的强引用,意味着只有该HashMap对象不销毁,该HashMap对象所有key所引用的对象不会被垃圾回收,HashMap也不会自动删除这些key所对应的key-value对象;但WeakHashMap的key只保留对实际对象的弱引用,意味着如果该HashMap对象所有key所引用的对象没有被其他强对象引用变量所引用,则这些key所引用的对象可能被垃圾回收,也可能自动删除这些key所对应的key-value对象。


   Map小结:
      HashMap和Hashtable的效率大致相同,因为它们的实现机制几乎完全一样,但HashMap通常比Hashtable要快一点,因为Hashtable额外实现同步操作。
      TreeMap通常比HashMap、Hashtable要慢,因为TreeMap需要额外的红黑树操作来维护key之间的次序。但是使用TreeMap的好处是,TreeMap中的key-value对总是处于有序状态,无须专门进行排序操作。
      LinkedHashMap比HashMap慢一点,因为它需要维护链表来保持Map中key的顺序。IdentityHashMap性能没有出色之处,跟HashMap基本类似,只是它使用==而不是equals来判断元素相等。EnumMap的性能最好,但它只能使用同一个枚举类的枚举值作为key。

原创粉丝点击