黑马程序员——集合框架(Collection)

来源:互联网 发布:linux禁用用户 编辑:程序博客网 时间:2024/05/16 17:43


-------android培训java培训、期待与您交流! ----------


集合框架(Collection



集合特点:

1:对象封装数据,对象多了也需要存储。集合用于存储对象。

2:对象的个数确定可以使用数组,但是不确定怎么办?可以用集合。因为集合是可变长度的。 


集合和数组的区别:

1:数组是固定长度的;集合可变长度的。

2:数组可以存储基本数据类型,也可以存储引用数据类型;集合只能存储引用数据类型。

3:数组存储的元素必须是同一个数据类型;集合存储的对象可以是不同数据类型。  


对于集合容器,有很多种。因为每一个容器的自身特点不同,其实原理在于每个容器的内部数据结构不同。

集合容器在不断向上抽取过程中。出现了集合体系。



图例:

 




al1.retainAll(al2);//取交集,al1中只会保留和al2中相同的元素。


 



集合框架的层次结构:

Collection(顶层接口)
   |--List(接口):元素是有序的,元素可以重复,因为该集合体系有索引
       |---ArrayList:底层的数据结构使用的是数组结构。特点:查询速度很快

       |---LinkedList:底层使用的链表数据结构

       |---Vector:底层是数组数据结构。线程同步,被ArrayList替代了

    |--Set(接口):元素是无序的,元素不可以重复
       |--HashSet():底层数据结构是哈希表;无序的,线程不安全的效率高;

       |--TreeSet():底层数据结构二叉树;排序的;线程不安全的,效率高;

 


1,添加:


   add(object):添加一个元素


   addAll(Collection) :添加一个集合中的所有元素。


2,删除:


   clear():将集合中的元素全删除,清空集合


   remove(obj) :删除集合中指定的对象。注意:删除成功,集合的长度会改变。


   removeAll(collection) :删除部分元素。部分元素和传入Collection一致。


3,判断:


   boolean contains(obj) :集合中是否包含指定元素 。


   boolean containsAll(Collection) :集合中是否包含指定的多个元素。


   boolean isEmpty():集合中是否有元素。


4,获取:


   int size():集合中有几个元素。


5,取交集:


   boolean retainAll(Collection) :对当前集合中保留和指定集合中的相同的元素。如果两个集合元素相同,返回flase;如果retainAll修改了当前集合,返回true


6,获取集合中所有元素:


   Iterator  iterator()迭代器


7,将集合变成数组:

   toArray();




Iterator接口


什么是迭代器呢?

其实就是集合的取出元素的方式。 


迭代器的基本使用:

Iterator it = al1.iterator();//获取迭代器,用于取出集合中的元素。

                    while(it.hasNext())

                    {

                           sop(it.next());

                    }



图例:


 

每一个集合都有自己的数据结构,都有特定的取出自己内部元素的方式。为了便于操作所有的容器,取出元素。将容器内部的取出方式按照一个统一的规则向外提供,这个规则就是Iterator接口


也就说,只要通过该接口就可以取出Collection集合中的元素,至于每一个具体的容器依据自己的数据结构,如何实现的具体取出细节,这个不用关心,这样就降低了取出元素和具体集合的耦合性。


图例:



List接口


List本身是Collection接口的子接口,具备了Collection的所有方法。现在学习List体系特有的共性方法,查阅方法发现List的特有方法都有索引,这是该集合最大的特点。 


List有序(元素存入集合的顺序和取出的顺序一致),元素都有索引。元素可以重复。

  |--ArrayList底层的数据结构是数组,线程不同步,ArrayList替代了Vector,查询元素的速度非常快。

  |--LinkedList底层的数据结构是链表,线程不同步,增删元素的速度非常快。

  |--Vector底层的数据结构就是数组,线程同步的,Vector无论查询和增删都巨慢。


1,添加:

   add(index,element) :在指定的索引位插入元素。

   addAll(index,collection) :在指定的索引位插入一堆元素。

2,删除:

   remove(index) :删除指定索引位的元素。 返回被删的元素。

  3,获取:

   Object get(index) :通过索引获取指定元素。

   int indexOf(obj):获取指定元素第一次出现的索引位,如果该元素不存在返回-1

                      所以,通过-1,可以判断一个元素是否存在。

   int lastIndexOf(Object o) :反向索引指定元素的位置。

   List subList(start,end):获取子列表。

4,修改:

   Object set(index,element) :对指定索引位进行元素的修改。

5,获取所有元素:

   ListIterator listIterator()list集合特有的迭代器。 


List集合支持对元素的增、删、改、查。


List集合因为角标有了自己的获取元素的方式: 遍历。

for(int x=0;x<list.size(); x++){

 sop("get:"+list.get(x));

}

在进行list列表元素迭代的时候,如果想要在迭代过程中,想要对元素进行操作的时候,比如满足条件添加新元素。会发生.ConcurrentModificationException并发修改异常。


导致的原因是:


集合引用和迭代器引用在同时操作元素,通过集合获取到对应的迭代器后,在迭代中,进行集合引用的元素添加,迭代器并不知道,所以会出现异常情况。


如何解决呢?


既然是在迭代中对元素进行操作,找迭代器的方法最为合适.可是Iterator中只有hasNext,next,remove方法.通过查阅的它的子接口,ListIterator,发现该列表迭代器接口具备了对元素的增、删、改、查的动作。 


List集合特有的迭代器。ListIteratorIterator的子接口。

在迭代时,不可以通过集合对象的方法操作集合中的元素。

因为会发生ConcurrentModificationException异常。


所以,在迭代器时,只能用迭代器的放过操作元素,可是Iterator方法是有限的。

只能对元素进行判断,取出,删除的操作。

如果想要其他的操作如添加,修改等,就需要使用其子接口,ListIterator

该接口只能通过List集合的listIterator方法获取。 


图例:


 


可变长度数组的原理:


当元素超出数组长度,会产生一个新数组,将原数组的数据复制到新数组中,再将新的元素添加到新数组中。

ArrayList:是按照原数组的50%延长。构造一个初始容量为 10 的空列表。

Vector:是按照原数组的100%延长。 


注意:对于list集合,底层判断元素是否相同,其实用的是元素自身的equals方法完成的。所以建议元素都要复写equals方法,建立元素对象自己的比较相同的条件依据。

 


LinkedList的特有方法。

  addFirst();

addLast();

jdk1.6以后。

offerFirst();

offerLast();

getFirst():获取链表中的第一个元素。如果链表为空,抛出NoSuchElementException;

getLast();

jdk1.6以后。

peekFirst();获取链表中的第一个元素。如果链表为空,返回null

peekLast();

removeFirst():获取链表中的第一个元素,但是会删除链表中的第一个元素。如果链表为空,抛出NoSuchElementException

removeLast();

jdk1.6以后。

pollFirst();获取链表中的第一个元素,但是会删除链表中的第一个元素。如果链表为空,返回null

pollLast(); 


Set接口


Set接口中的方法和Collection中方法一致的。Set接口取出方式只有一种,迭代器

 |--HashSet底层数据结构是哈希表,线程是不同步的无序,高效;

    HashSet集合保证元素唯一性:通过元素的hashCode方法,和equals方法完成的。

    当元素的hashCode值相同时,才继续判断元素的equals是否为true

    如果为true,那么视为相同元素,不存。如果为false,那么存储。

    如果hashCode值不同,那么不判断equals,从而提高对象比较的速度。

     |--LinkedHashSet有序,hashset的子类。

 |--TreeSetSet集合中的元素的进行指定顺序的排序。不同步TreeSet底层的数据结构就是二叉树。 


哈希表的原理:

1,对对象元素中的关键字(对象中的特有数据),进行哈希算法的运算,并得出一个具体的算法值,这个值 称为哈希值

2,哈希值就是这个元素的位置。

3,如果哈希值出现冲突,再次判断这个关键字对应的对象是否相同。如果对象相同,就不存储,因为元素重复。如果对象不同,就存储,在原来对象的哈希值基础+1顺延。

4,存储哈希值的结构,我们称为哈希表。

5,既然哈希表是根据哈希值存储的,为了提高效率,最好保证对象的关键字是唯一的。

 这样可以尽量少的判断关键字对应的对象是否相同,提高了哈希表的操作效率。 


对于ArrayList集合,判断元素是否存在,或者删元素底层依据都是equals方法。

对于HashSet集合,判断元素是否存在,或者删除元素,底层依据的是hashCode方法和equals方法。 


TreeSet:

 用于对Set集合进行元素的指定顺序排序,排序需要依据元素自身具备的比较性。

 如果元素不具备比较性,在运行时会发生ClassCastException异常。

 所以需要元素实现Comparable接口,强制让元素具备比较性,复写compareTo方法

 依据compareTo方法的返回值,确定元素在TreeSet数据结构中的位置。

 TreeSet方法保证元素唯一性的方式:就是参考比较方法的结果是否为0,如果return0,视为两个对象重复,不存。 


图例:



 注意:在进行比较时,如果判断元素不唯一,比如,同姓名,同年龄,才视为同一个人。

  在判断时,需要分主要条件和次要条件,当主要条件相同时,再判断次要条件,按照次要条件排序。






















0 0
原创粉丝点击