Java 集合

来源:互联网 发布:科学革命的结构 知乎 编辑:程序博客网 时间:2024/06/11 08:59

Java 集合

  • 一方面,面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用Array存储对象方面具有一些弊端,而Java 集合就像一种容器,可以动态地把多个对象的引用放入容器中。
  • Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组。
  • Java 集合可分为Collection和 Map 两种体系
    • Collection接口:
    • Set:元素无序、不可重复的集合—类似高中的“集合”
    • List:元素有序,可重复的集合 —”动态”数组
    • Map接口:具有映射关系“key-value对”的集合—类似于高中的“函数”y = f(x) (x1,y1) (x2,y2)

Collection 接口

这里写图片描述

  • Collection 接口是 List、Set 和 Queue接口的父接口,该接口里定义的方法既可用于操作Set集合,也可用于操作List和 Queue集合。
  • JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List)实现。
  • 在 Java5之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都当成Object类型处理;从Java5增加了泛型以后,Java 集合可以记住容器中对象的数据类型

使用 Iterator接口遍历集合元素

  • Iterator对象称为迭代器(设计模式的一种),主要用于遍历Collection集合中的元素。
  • 所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。
  • Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建Iterator 对象,则必须有一个被迭代的集合。
  • 在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常。

使用 foreach 循环遍历集合元素

for(Person person : persons){  ....}

List 接口

  • Java中数组用来存储数据的局限性
  • List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
  • List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。
  • JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
  • List 集合里添加了一些根据索引来操作集合元素的方法
    1. void add(int index, Object ele)
    2. boolean addAll(int index, Collection eles)
    3. Objectget(intindex)
    4. int indexOf(Objectobj)
    5. int lastIndexOf(Objectobj)
    6. Object remove(int index)
    7. Object set(int index, Object ele)
    8. List subList(int fromIndex,int toIndex)
  • List实现类之一:ArrayList
    1. ArrayList 是 List 接口的典型实现类
    2. 本质上,ArrayList是对象引用的一个变长数组
    3. ArrayList 是线程不安全的,而Vector是线程安全的,即使为保证List集合线程安全,也不推荐使用Vector
    4. Arrays.asList(…) 方法返回的List集合既不是 ArrayList 实例,也不是Vector实例。 Arrays.asList(…) 返回值是一个固定长度的List集合
  • List实现类之二:LinkedList
    1. 对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高
    2. 新增方法:
      • void addFirst(Objectobj)
      • void addLast(Objectobj)
      • Object getFirst()
      • Object getLast()
      • Object removeFirst()
      • Object removeLast()
  • List 实现类之三:Vector
    1. Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。
    2. 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。
    3. 新增方法:
      • void addElement(Objectobj)
      • void insertElementAt(Object obj,intindex)
      • void setElementAt(Object obj,intindex)
      • void removeElement(Object obj)
      • void removeAllElements()
  • ListIterator接口
    1. List 额外提供了一个listIterator() 方法,该方法返回一个ListIterator 对象, ListIterator 接口继承了Iterator 接口,提供了专门操作List的方法:
      • void add()
      • boolean hasPrevious()
      • Objectprevious()
      • BooleanhasNext()
      • Object next()
  • Iterator和ListIterator主要区别
    • ListIterator和Iterator都有hasNext()和next()方法,可以实现顺序向后遍历。但是ListIterator有hasPrevious()和previous()方法,可以实现逆向(顺序向前)遍历。Iterator就不可以
    • ListIterator可以定位当前的索引位置,nextIndex()和previousIndex()可以实现。Iterator 没有此功能。
    • ListIterator有add()方法,可以向List中插入对象,而Iterator不能。
    • 都可实现删除对象,但是ListIterator可以实现对象的修改,set()方法可以实现。Iterator仅能遍历,不能修改。因为ListIterator的这些功能,可以实现对LinkedList等List数据结构的操作。

Set 接口

  • Set接口是Collection的子接口,set接口没有提供额外的方法

  • Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set集合中,则添加操作失败。

  • Set 判断两个对象是否相同不是使用==运算符,而是根据equals方法

  • Set实现类之一:HashSet

    • HashSet 是 Set 接口的典型实现,大多数时候使用Set集合时都使用这个实现类。
    • HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取和查找性能。
    • HashSet 具有以下特点:

    • 不能保证元素的排列顺序

    • HashSet 不是线程安全的
    • 集合元素可以是 null
    • 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的hashCode() 方法来得到该对象的hashCode 值,然后根据hashCode 值决定该对象在HashSet 中的存储位置。
    • HashSet 集合判断两个元素相等的标准:两个对象通过hashCode() 方法比较相等,并且两个对象的equals()方法返回值也相等。
    • hashCode()方法
    • 如果两个元素的 equals()方法返回 true,但它们的hashCode() 返回值不相等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功。
    • 对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。
    • 重写 hashCode() 方法的基本原则
      • 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值
      • 当两个对象的 equals()方法比较返回true时,这两个对象的hashCode() 方法的返回值也应相等
      • 对象中用作 equals()方法比较的Field,都应该用来计算hashCode 值
  • Set实现类之二:LinkedHashSet

    • LinkedHashSet 是 HashSet 的子类
    • LinkedHashSet 根据元素的hashCode 值来决定元素的存储位置,但它同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
    • LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能。
    • LinkedHashSet 不允许集合元素重复。
  • Set实现类之三:TreeSet

    • TreeSet 是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。
    • Comparator comparator()
    • Object first()
    • Object last()
    • Object lower(Object e)
    • Object higher(Object e)
    • SortedSet subSet(fromElement,toElement)
    • SortedSet headSet(toElement)
    • SortedSet tailSet(fromElement)
    • TreeSet 两种排序方法:自然排序和定制排序。默认情况下,TreeSet 采用自然排序。
  • 自然排序

    • 自然排序:TreeSet 会调用集合元素的compareTo(Objectobj) 方法来比较元素之间的大小关系,然后将集合元素按升序排列

    • 如果试图把一个对象添加到 TreeSet时,则该对象的类必须实现Comparable 接口。

    实现 Comparable的类必须实现compareTo(Objectobj) 方法,两个对象即通过compareTo(Objectobj) 方法的返回值来比较大小。

    • Comparable 的典型实现:

      • BigDecimal、BigInteger 以及所有的数值型对应的包装类:按它们对应的数值大小进行比较
      • Character:按字符的unicode值来进行比较
      • Boolean:true 对应的包装类实例大于false对应的包装类实例
      • String:按字符串中字符的unicode 值进行比较
      • Date、Time:后边的时间、日期比前面的时间、日期大
    • 向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添加的所有元素都会调用compareTo()方法进行比较。

    • 因为只有相同类的两个实例才会比较大小,所以向TreeSet 中添加的应该是同一个类的对象

    • 对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过compareTo(Objectobj) 方法比较返回值。

    • 当需要把一个对象放入 TreeSet 中,重写该对象对应的equals()方法时,应保证该方法与compareTo(Objectobj) 方法有一致的结果:如果两个对象通过equals()方法比较返回true,则通过 compareTo(Objectobj) 方法比较应返回0。

  • 定制排序:

    • TreeSet的自然排序是根据集合元素的大小,进行元素升序排列。如果需要定制排序,比如降序排列,可通过Comparator接口的帮助。需要重写compare(To1,T o2)方法。
    • 利用int compare(To1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2。
    • 要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。
    • 此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常。
    • 使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。

Map接口

这里写图片描述

  • Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
  • Map 中的 key 和 value 都可以是任何引用类型的数据
  • Map 中的 key 用Set来存放,不允许重复,即同一个 Map 对象所对应的类,须重写hashCode()和equals()方法。
  • 常用String类作为Map的“键”。
  • key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到唯一的、确定的 value。
  • Map 常用方法
    • 添加、删除操作:
      1. Object put(Object key,Object value)
      2. Object remove(Object key)
      3. void putAll(Mapt)
      4. void clear()
    • 元视图操作的方法:
      1. Set keySet()
      2. Collection values()
      3. Set entrySet()
    • 元素查询的操作:
      1. Object get(Object key)
      2. boolean containsKey(Objectkey)
      3. boolean containsValue(Objectvalue)
      4. intsize()
      5. boolean isEmpty()
      6. boolean equals(Object obj)
  • Map实现类之一:HashMap

    • Map接口的常用实现类:HashMap、TreeMap和Properties。
    • HashMap是 Map 接口使用频率最高的实现类。
    • 允许使用null键和null值,与HashSet一样,不保证映射的顺序。
    • HashMap 判断两个 key 相等的标准是:两个 key 通过 equals()方法返回 true,hashCode 值也相等。
    • HashMap 判断两个 value相等的标准是:两个 value通过 equals()方法返回 true。
  • Map实现类之二:LinkedHashMap

    • LinkedHashMap 是 HashMap 的子类
    • 与LinkedHashSet类似,LinkedHashMap 可以维护 Map 的迭代顺序:迭代顺序与Key-Value对的插入顺序一致
  • Map实现类之三:TreeMap
    1. TreeMap存储 Key-Value对时,需要根据 key-value对进行排序。TreeMap 可以保证所有的Key-Value对处于有序状态。
    2. TreeMap 的 Key 的排序:
      • 自然排序:TreeMap 的所有的 Key 必须实现 Comparable接口,而且所有的Key应该是同一个类的对象,否则将会抛出ClasssCastException
      • 定制排序:创建 TreeMap 时,传入一个Comparator对象,该对象负责对TreeMap 中的所有 key 进行排序。此时不需要Map的 Key 实现 Comparable接口
      • TreeMap判断两个key相等的标准:两个key通过compareTo()方法或者compare()方法返回0。
      • 若使用自定义类作为TreeMap的key,所属类需要重写equals()和hashCode()方法,且equals()方法返回true时,compareTo()方法应返回0。
  • Map实现类之四:Hashtable
    • Hashtable是个古老的 Map 实现类,线程安全。
    • 与HashMap不同,Hashtable 不允许使用null作为 key 和 value
    • 与HashMap一样,Hashtable 也不能保证其中Key-Value对的顺序
    • Hashtable判断两个key相等、两个value相等的标准,与hashMap一致。
  • Map实现类之五:Properties
    • Properties 类是 Hashtable 的子类,该对象用于处理属性文件
    • 由于属性文件里的 key、value都是字符串类型,所以Properties 里的key 和value 都是字符串类型
    • 存取数据时,建议使用setProperty(Stringkey,Stringvalue)方法和getProperty(Stringkey)方法

操作集合的工具类:Collections

  • Collections 是一个操作Set、List 和 Map 等集合的工具类
  • Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
  • 排序操作:(均为static方法)
    • reverse(List):反转 List 中元素的顺序
    • shuffle(List):对 List集合元素进行随机排序
    • sort(List):根据元素的自然顺序对指定List集合元素按升序排序
    • sort(List,Comparator):根据指定的Comparator产生的顺序对List集合元素进行排序
    • swap(List,int,int):将指定 list 集合中的 i 处元素和 j 处元素进行交换
  • 查找、替换
    • Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
    • Object max(Collection,Comparator):根据 Comparator指定的顺序,返回给定集合中的最大元素
    • Object min(Collection)
    • Object min(Collection,Comparator)
    • intfrequency(Collection,Object):返回指定集合中指定元素的出现次数
    • void copy(List dest,Listsrc):将src中的内容复制到dest中
    • boolean replaceAll(Listlist,ObjectoldVal,ObjectnewVal):使用新值替换List对象的所有旧值
  • 同步控制
    • Collections 类中提供了多个synchronizedXxx() 方法,该方法可使将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题