【颗粒归仓】--java集合

来源：互联网发布：加百列和路西法知乎编辑：程序博客网时间：2024/04/30 06:12

java集合大致分为Set、List、Queue和Map四种
Set代表无序、不可重复的集合
List代表有序、可重复的集合
Map代表具有映射关系的集合

Queue代表一种队列集合（java5新增）

一、Set：不允许包含相同的元素，不能记住元素的添加顺序
1、HashSet：按Hash算法来存储集合中的元素，具有很好的存取和查找性能。
特点：
不能保证元素的排列顺序
HashSet不是同步的，如果多个线程同时访问一个HashSet，假设有两个或者两个以上的线程同时修改HashSet集合时，则必须通过代码来保证其同步。
集合元素值可以是null

当向HashSet集合中存入元素时，HashSet会调用该对象的hashCode（）方法得到该对象的hashCode值，然后根据该hashCode值决定该对象在HashSet中的存储位置。
HashSet集合判断两元素相等的标准是两个对象通过equals（）方法比较相等，并且两个对象的hashCode（）方法值也相等。
子类：
LinkedHashSet，也是根据元素hashCode值来决定元素存储位置，但它同时使用链表维护元素的次序，这样使得元素看起来是以插入的书序来保存的。由于需要维护插入顺序，效率相对于HashSet较低。

2、TreeSet：是SortedSet接口的唯一实现，可以确保元素处于排序状态。但是并不是根据元素的插入顺序进行排序，而是根据元素的实际值来进行排序。
TreeSet采用红黑树的数据结构对元素进行排序

3、EnumSet：是一个专门为枚举类设计的集合类，EnumSet中所有值都必须是指定枚举类型的枚举值。它的集合元素也是有序的，以枚举值在Enum类内的定义顺序来决定集合元素的顺序。
EnumSet在内部以位向量的形式存储，不允许加入null元素。

Set集合小结：
HashSet和TreeSet是Set的两个典型实现，HashSet的性能总是比TreeSet好，因为TreeSet需要额外的红黑树算法来维护集合元素的次序。只有当需要一个保持排序的Set时，才应该使用TreeSet，否则都使用HashSet。
HashSet还有一个子类，LinkedHashSet，对于普通插入、删除操作，LinkedHashSet比HashSet要略慢一些，这是因为需要维护链表所带来的额外开销造成。但是因为有链表的存在，遍历LinkedHashSet会更快。
EnumSet是所有Set实现类中性能最好的，但它只能保存同一个枚举类的枚举值作为集合元素。
Set的三个实现类HashSet、TreeSet、LinkedHashSet都是现场不安全的，如果是多线程环境，需要手动保证Set集合的同步性。

二、List：作为Collection接口的子接口，可以实现Collection接口中的全部方法。因为List是有序集合，因此list集合里增加了一些根据索引来操作集合元素的方法
1、ArrayList和Vector
是两个典型实现，完全支持List接口的全部功能。。
ArrayList和Vector类都是基于数组实现的List类，所以ArrayList和Vector类封装了一个动态再分配的Object[]数组，可以通过capacity属性来计算数组的长度。
Vector是一个古老的集合。除此之外，ArrayList是线程不安全的，而Vector是线程安全的。但是，实际上，即使需要保证List集合线程安全，同样不推荐使用vector实现类。可使用Collections工具类，将ArrayList变成线程安全的。
2、LinkedLList：它是一个基于链表实现的List，对于顺序访问集合中的元素进行了优化；特别是当插入、删除元素时速度非常快，这是因为LinkedList既实现了List接口，也实现了Deque接口

三、Queue接口：用于模拟了队列这种数据结构，队列通常是“先进先出”的容器。
LinkedList也实现了Deque接口，Deque接口是Queue接口的子类，代表一个双向队列。包括pop出栈、push（入栈）
LinkedList与ArrayList、Vector的实现机制完全不同，ArrayList和Vector内部以数组的形式来保存集合中的元素，因此随机访问集合元素上有较好的性能；而LinkedList内部以链表形式来保存集合中元素，因此随机访问能力较差，但在插入、删除元素时性能非常出色。
PriorityQueue是一个比较标准的队列实现类。PriorityQueue保存队列元素的顺序并不是按加入队列的顺序，而是按照队列元素的大小进行重新排序。
PriorityQueue不允许插入null元素，它还需要队列元素进行排序。

四、Map：
用于保存具有映射关系的数据。Map接口有HashMap、LinkedHashMap、SortedMap、TreeMap、EnumMap等。此处与Set有相似之处。Map又与LIst存在相似之处：元素与元素之间可以重复，每个元素可以根据索引查找。

1、HashMap和Hashtable实现类
它们都是Map接口的电箱实现类，它们之间的关系完全类似于ArrayList和Vector的关系。
Hashtable是一个古老的Map实现类
区别：
Hashtable是一个线程安全的Map实现，但HashMap是线程不安全的实现，所以HashMap比Hashtable的性能高。
Hashtable不允许使用null作为key和value，但H安徽省Map可以使用null作为key或value。

同HashSet集合不能保证元素的顺序一样，Hashtable、HashMap也不能保证其中key-value对的顺序。
HashMap也有一个子类LinkedHashMap，也是使用双向链表来维护key-value对的次序。LinkedHashMap需要维护元素的插入顺序，因此性能略低于HashMap的性能。

2、SortedMap和TreeMap
Map派生出SortedMap子接口，SortedMap也有一个TreeMap实现类。类似于TreeSet中判断两个元素相等的标准，TreeMap中判断两个key相等的标准也是两个key通过equals比较返回true，而通过compareTo方法返回0，TreeMap即认为这两个key是相等的。

3、WeakHashMap：
与HashMap的用法基本相似，区别在于，HashMap的key保留对实际对象的强引用，意味着只有该HashMap对象不销毁，该HashMap对象所有key所引用的对象不会被垃圾回收，HashMap也不会自动删除这些key所对应的key-value对象；但WeakHashMap的key只保留对实际对象的弱引用，意味着如果该HashMap对象所有key所引用的对象没有被其他强对象引用变量所引用，则这些key所引用的对象可能被垃圾回收，也可能自动删除这些key所对应的key-value对象。

Map小结：
HashMap和Hashtable的效率大致相同，因为它们的实现机制几乎完全一样，但HashMap通常比Hashtable要快一点，因为Hashtable额外实现同步操作。
TreeMap通常比HashMap、Hashtable要慢，因为TreeMap需要额外的红黑树操作来维护key之间的次序。但是使用TreeMap的好处是，TreeMap中的key-value对总是处于有序状态，无须专门进行排序操作。
LinkedHashMap比HashMap慢一点，因为它需要维护链表来保持Map中key的顺序。IdentityHashMap性能没有出色之处，跟HashMap基本类似，只是它使用==而不是equals来判断元素相等。EnumMap的性能最好，但它只能使用同一个枚举类的枚举值作为key。

阅读全文

0 0