Java进击(三)容器类

来源:互联网 发布:阿里云上海代理商 编辑:程序博客网 时间:2024/05/21 03:15


           容器为JavaAPI所提供的一系列类的实例,用于在程序中存放对象。容器可以管理对象的生命周期、对象与对象之间的依赖关系。Java容器类包含List、ArrayList、Vector及map、HashTable、HashMap、Hashset

              容器API的类图结构如下:

                                                  



一、Collection接口


         Collection是最基本的集合接口。所有实现Collection接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的Collection,有一个Collection参数的构造函数用于创建一个新的Collection,这个新的Collection与传入的Collection有相同的元素。后一个构造函数允许用户复制一个Collection。Collection接口派生的两个接口是ListSet


ps:Collection接口中定义的方法 请读者自行查阅


二、List接口


         List是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在List中的位置,类似于数组下标)来访问List中的元素,这类似于Java的数组。 set 不同,列表通常允许重复的元素。更确切地讲,列表通常允许满足 e1.equals(e2) 的元素对 e1  e2,并且如果列表本身允许 null 元素的话,通常它们允许多个 null 元素。

       实现List接口的常用类有LinkedListArrayListVectorStackLinkedList:底层用双向链表实现的List。特点:查询效率低,增删效率高,线程不安全。 ArrayList:底层用数组实现的List。特点:查询效率高,增删效率低,线程不安全。Vector:底层用数组实现的List,特点:线程安全。Stack:Stack继承自Vector,实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。ps:List接口中定义的方法 请读者自行查阅

     使用原则:线程安全用Vector。 线程不安全,查找较多用ArrayList。增加或删除元素较多用LinkedList


三、Set接口


      Set是一种不包含重复的元素的Collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,Set最多有一个null元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。SetCollection有完全一样的接口。Set接口不保证维护元素的次序


      HashSet : 为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。  TreeSet : 保存次序的Set,底层为树结构。使用它可以从Set中提取有序的序列。  LinkedHashSet: 具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。


 


四、Map接口


         请注意,Map没有继承Collection接口,Map提供key到value的映射。一个Map中不能包含相同的key,每个key只能映射一个value。Map接口提供3种集合的视图,Map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。

          Map 接口的实现类有HashMapTreeMap等。HashMap: 线程不安全,效率高允许keyvaluenullHashTable:线程安全,效率低不允许keyvaluenull 

ps:Map类中存储的键-值对通过键来标识,所以键值不能重复。


例子:

import java.util.*; class MapTest{   public static void main(String[] args){     Map m1=new HashMap();   Map m2=new HashMap();   m1.put("one", new Integer(1));   m1.put("two",new Integer(2));   m1.put("three",new Integer(3));      m2.put("A",new Integer(1));   m2.put("B",new Integer(2));      System.out.println(m1.size());//m1长度,结果为3   System.out.println(m1.containsKey("one"));//m1是否包含名为one的,结果为true   System.out.println(m2.containsValue(new Integer(2)));//m2是否包含值为2的,结果为true   if(m1.containsKey("two")){//m1是否包含名为two的        int i =((Integer) m1.get("two")).intValue();System.out.println(i);//取得名为two的值,打印,结果为2   }   Map m3=new HashMap(m1);   m3.putAll(m2);//将m1、m2放入m3中,打印,结果为m1、m2包含的键和值   System.out.println(m3);   }}

结果:

                                                         

五、iterator接口


          所有实现了Collection接口的容器类都有一个iterator方法用以返回一个实现了iterator接口,Iterator对象称作迭代器,用以方便的实现对容器内元素的遍历操作。


      Iterator接口定义了如下方法:  


boolean hasNext();  //判断是否有元素没有被遍历 


Object next();      //返回游标当前位置的元素并将游标移动到下一个位置  


 void remove();      //删除游标左面的元素,在执行完next之后该操作只能执行一次


六、其他(了解)


Comparable接口:


        所有可以“排序”的类都实现了java.lang.Comparable 接口Comparable接口中只有一个方法:


                   public int compareTo(Object obj);     


返回   0   表示 this == obj


返回正数表示 this  >  obj  


                      返回负数表示 this  <  obj  


              实现了Comparable 接口的类通过实现 comparaTo 方法从而确定该类对象的排序方式。


equalshashcode方法 


                 Collection类对象是否相等对象在调用remove、contains 等方法时需要比较,这会涉及到对象类型的 equals 方法和hashCode方法;对于自定义的类型,需要重写equals 和 hashCode 方法以实现自定义的对象相等规则。Java中规定,两个内容相同的对象应该具有相等的 hashcode 。

          什么时候需要我们重写equal,hashcode方法? 目的是什么?

          这样作的目的就是为了你的类就能够很好的与java的集合框架协同工作。如果我们能够确认我们定义的类不会和java集合类产生关系,那么我们完全没有必要在覆写equals()方法的时候覆写hashCode。  

          如下情况,可能需要我们重写equal/hashcode方法: 

           要将我们自定义的对象放入HashSet中处理 要将我们自定义的对象作为HashMap的key处理 放入Collection容器中的自定义对象后,可能会调用remove,contains等方法时。  

         Equal和hashcode的关系和原理: 1. Hashcode并不是内存地址,是内存地址转换而来的。系统通过它也可以确定内存地址。 2. hashcode方法主要用在集合框架中,目的是为了快速比较两个对象是否相等,因为集合框架中的对象很多,每个都使用equals比较效率很差。  

         每个对象都有一个hashcode,规定:  1、内容相同的对象hashcode肯定相等  2、内容不相同的对象hashcode可能相等也可能不相等   

        所以如果两个对象的hashcode不相等则两个对象的内容肯定不相等,这样就不必一个一个去比较属性的值了,从而提高对象比较的速度。

Vector:

          Vector是同步的。这个类中的一些方法保证了Vector中的对象是线程安全的。而ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果你不需要线程安全的集合那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销。

          从内部实现机制来讲ArrayListVector都是使用数组(Array)来控制集合中的对象。当向这两种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度,Vector缺省情况下自动增长原来一倍的数组长度,ArrayList是原来的50%,所以最后获得的这个集合所占的空间总是比实际需要的要大。所以如果要在集合中保存大量的数据那么使用Vector有一些优势,因为可以通过设置集合的初始化大小来避免不必要的资源开销。

          ArrayListVector中,从一个指定的位置(通过索引)查找数据或是在集合的末尾增加、移除一个元素所花费的时间是一样的,如果只是查找特定位置的元素或只在集合的末端增加、移除元素,那么使用VectorArrayList都可以。如果是其他操作,最好选择其他的集合操作类。比如,LinkList集合类在增加或移除集合中任何位置的元素所花费的时间都是一样的,但它在索引一个元素的使用确比较慢.使用ArrayList也很容易,因为可以简单的使用索引来代替创建iterator对象的操作。LinkList也会为每个插入的元素创建对象,所以它也会带来额外的开销。



总结

         如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList


        要特别注意对哈希表的操作,作为key的对象要正确复写equalshashCode方法。


        尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。


         如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。


          最后,建议使用一个简单的数组(Array)来代替VectorArrayList。尤其是对于执行效率要求高的程序更应如此。因为使用数组(Array)避免了同步、额外的方法调用和不必要的重新分配空间的操作。




11 0