前言

在我们日常的开发中,集合占据着举足轻重的地位。在不同的情况下,我们会去选择性能更佳(或更安全的)集合类作为一个容器去存储数据。在接下来的几节中,我会带着大家对于集合的知识进行一次系统的深入梳理,相信梳理过后,面试或日常开发再遇到有关集合的问题对我们来说都不会是问题了。

总览图

首先我们先以一个耳熟能详的集合鸟瞰图开始说起。
Java基础系列(三十八):集合总览 - 图1
(PS:截图自《编程思想》)

通过这个图,我们可以获得哪些有用的信息呢?

这个图由Map指向CollectionProduces并不是说MapCollection的一个子类(子接口),这里的意思是指MapKeySet获取到的一个视图是Collection的子接口(视图是什么,我们后面会讲到)。
我们可以看到集合有两个基本接口:MapCollection。但是我个人认为Map并不能说是一个集合,称之为映射或许更为合适,因为它的KeySet视图是一个Set类型的键集,所以我们姑且把它也当做集合。
Collection继承了Iterator接口,而Iterator的作用是给我们提供一个只能向后遍历集合元素的迭代器,也就是说所有实现Collection的类都可以使用Iterator遍历器去遍历。
每种接口都有一个Abstr act开头的抽象子类,这个子类中包括了一些默认的实现,我们在自定义类的时候都需要去继承这个抽象类,然后根据我们不同的需求,对于其中的方法进行重写。
从容器角度上来说,只有四种容器:MapQueueSetList

简单介绍:

下面我们对基本的分类进行一个简单的介绍和了解,后续我们会从数据结构和用法等方面去详细学习。

ArrayList: 一种可以动态增长和缩减的的索引序列
LinkedList:一种可以在任何位置进行高效地插入和删除操作的有序序列
ArrayDeque:一种用循环数组实现的双端队列
HashSet:一种没有重复元素的无序集合
TreeSet:一种有序集
EnumSet:一种包含枚举类型值的集
LinkedHashSet:一种可以记住元素插入次序的集
PriorityQueue:一种允许高效删除最小元素的集合
HashMap:一种存储键/值关联的数据结构
TreeMap:一种键值有序排列的映射表
EnumMap:一种键值属于枚举类型的映射表
LinkedHashMap:一种可以记住键/值项添加次序的映射表
WeakHashMap:一种其值无用武之地后可以被垃圾回收期回收的映射表
IdentityHashMap:一种用==而不是用equals比较键值的映射表
Vector:目前使用较少,因为设计理念的陈旧和性能的问题被ArrayList所取代
Hashtable:线程非同步可以使用HashMap来替代,同步的话可以使用ConcurrentHashMap来替代

Iterator

我们接下来聊一下迭代器,从鸟瞰图中我们可以看到,所有实现Collection的子类都继承了Iterable接口。这个接口提供了一个iterator()方法可以构造一个Iterator接口对象。然后我们可以使用这个迭代器对象依次访问集合中的元素
迭代器一般使用方法是这样的:

  1. Collection<String> c = ...;
  2. Iterator<String> iter = c.iterator();
  3. while (iter.hasNext()) {
  4. String s = iter.next();
  5. System.out.println(s);
  6. }

或者是这样的:

//适用于JDK1.8以后的版本
iter.forEachRemaining(element -> System.out.println(element));

我们接下来看一下Iterator的源码(Base jdk1.8):

package java.util;

import java.util.function.Consumer;

public interface Iterator<E> {

    boolean hasNext();

    E next();

    default void remove() {
        throw new UnsupportedOperationException("remove");
    }

    default void forEachRemaining(Consumer<? super E> action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

迭代器的next()工作原理是这样的:

Java基础系列(三十八):集合总览 - 图2可以看出,迭代器是位于两个集合元素之间的位置,当我们调用next()方法的时候迭代器指针就会越过一个元素,并且返回刚刚越过的元素,所以,当我们迭代器的指针在最后一个元素的时候,就会抛出会抛出一个NoSuchElementException的异常。所以,在调用next()之前需要调用hasNext()去判断这个集合的迭代器是否走到了最后一个元素。

通过调用next()方法可以逐个的去访问集合中的每个元素,而访问元素的顺序跟该容器的数据结构有关,比如ArrayList就是按照索引值开始,每次迭代都会使索引值加1,而对于HashSet这种数据结构是散列表的集合,就会按照某种随机的次序出现。

Iterator的接口中还有一个remove()方法,这个方法实际上删除的是上次调用next()方法返回的元素,下面我来展示一下remove()方法的使用方法

Collection<String> c = ...;
Iterator<String> iter = c.iterator();
iter.next();
iter.remove();

这样就可以删除该集合中的第一个元素,但是需要注意一点,如果我们需要删除两个元素,必须这样做:

iter.remove();
iter.next();
iter.remove();

而不能这么做:

iter.remove();
iter.remove();

因为next()方法和remove()方法之间是有依赖性的,如果调用remove之前没有调用next就会抛出一个IllegalStateException的异常。

PS: 我们日常中用的很多的foreach循环,其实就是一种语法糖,编译器会把foreach编译为带有迭代器的循环。

下节预告

接下来,我会陆续带领大家去从源码,数据结构等方面去深入了解每一个类,下一节我们要学习Collection的相关知识,敬请期待~

公众号

Java基础系列(三十八):集合总览 - 图3