前言
在我们日常的开发中,集合占据着举足轻重的地位。在不同的情况下,我们会去选择性能更佳(或更安全的)集合类作为一个容器去存储数据。在接下来的几节中,我会带着大家对于集合的知识进行一次系统的深入梳理,相信梳理过后,面试或日常开发再遇到有关集合的问题对我们来说都不会是问题了。
总览图
首先我们先以一个耳熟能详的集合鸟瞰图开始说起。
(PS:截图自《编程思想》)
通过这个图,我们可以获得哪些有用的信息呢?
这个图由Map
指向Collection
的Produces
并不是说Map
是Collection
的一个子类(子接口),这里的意思是指Map
的KeySet
获取到的一个视图是Collection
的子接口(视图是什么,我们后面会讲到)。
我们可以看到集合有两个基本接口:Map
和Collection
。但是我个人认为Map
并不能说是一个集合,称之为映射或许更为合适,因为它的KeySet
视图是一个Set
类型的键集,所以我们姑且把它也当做集合。
Collection
继承了Iterator
接口,而Iterator
的作用是给我们提供一个只能向后遍历集合元素的迭代器,也就是说所有实现Collection
的类都可以使用Iterator
遍历器去遍历。
每种接口都有一个Abstr act
开头的抽象子类,这个子类中包括了一些默认的实现,我们在自定义类的时候都需要去继承这个抽象类,然后根据我们不同的需求,对于其中的方法进行重写。
从容器角度上来说,只有四种容器:Map
,Queue
,Set
,List
。
简单介绍:
下面我们对基本的分类进行一个简单的介绍和了解,后续我们会从数据结构和用法等方面去详细学习。
ArrayList: 一种可以动态增长和缩减的的索引序列
LinkedList:一种可以在任何位置进行高效地插入和删除操作的有序序列
ArrayDeque:一种用循环数组实现的双端队列
HashSet:一种没有重复元素的无序集合
TreeSet:一种有序集
EnumSet:一种包含枚举类型值的集
LinkedHashSet:一种可以记住元素插入次序的集
PriorityQueue:一种允许高效删除最小元素的集合
HashMap:一种存储键/值关联的数据结构
TreeMap:一种键值有序排列的映射表
EnumMap:一种键值属于枚举类型的映射表
LinkedHashMap:一种可以记住键/值项添加次序的映射表
WeakHashMap:一种其值无用武之地后可以被垃圾回收期回收的映射表
IdentityHashMap:一种用==而不是用equals比较键值的映射表
Vector:目前使用较少,因为设计理念的陈旧和性能的问题被ArrayList所取代
Hashtable:线程非同步可以使用HashMap来替代,同步的话可以使用ConcurrentHashMap来替代
Iterator
我们接下来聊一下迭代器,从鸟瞰图中我们可以看到,所有实现Collection
的子类都继承了Iterable
接口。这个接口提供了一个iterator()
方法可以构造一个Iterator
接口对象。然后我们可以使用这个迭代器对象依次访问集合中的元素
迭代器一般使用方法是这样的:
Collection<String> c = ...;
Iterator<String> iter = c.iterator();
while (iter.hasNext()) {
String s = iter.next();
System.out.println(s);
}
或者是这样的:
//适用于JDK1.8以后的版本
iter.forEachRemaining(element -> System.out.println(element));
我们接下来看一下Iterator
的源码(Base jdk1.8
):
package java.util;
import java.util.function.Consumer;
public interface Iterator<E> {
boolean hasNext();
E next();
default void remove() {
throw new UnsupportedOperationException("remove");
}
default void forEachRemaining(Consumer<? super E> action) {
Objects.requireNonNull(action);
while (hasNext())
action.accept(next());
}
}
迭代器的next()
工作原理是这样的:
可以看出,迭代器是位于两个集合元素之间的位置,当我们调用next()
方法的时候迭代器指针就会越过一个元素,并且返回刚刚越过的元素,所以,当我们迭代器的指针在最后一个元素的时候,就会抛出会抛出一个NoSuchElementException
的异常。所以,在调用next()
之前需要调用hasNext()
去判断这个集合的迭代器是否走到了最后一个元素。
通过调用next()
方法可以逐个的去访问集合中的每个元素,而访问元素的顺序跟该容器的数据结构有关,比如ArrayList
就是按照索引值开始,每次迭代都会使索引值加1,而对于HashSet这种数据结构是散列表的集合,就会按照某种随机的次序出现。
Iterator
的接口中还有一个remove()
方法,这个方法实际上删除的是上次调用next()方法返回的元素,下面我来展示一下remove()
方法的使用方法
Collection<String> c = ...;
Iterator<String> iter = c.iterator();
iter.next();
iter.remove();
这样就可以删除该集合中的第一个元素,但是需要注意一点,如果我们需要删除两个元素,必须这样做:
iter.remove();
iter.next();
iter.remove();
而不能这么做:
iter.remove();
iter.remove();
因为next()
方法和remove()
方法之间是有依赖性的,如果调用remove
之前没有调用next
就会抛出一个IllegalStateException
的异常。
PS: 我们日常中用的很多的foreach
循环,其实就是一种语法糖,编译器会把foreach
编译为带有迭代器的循环。
下节预告
接下来,我会陆续带领大家去从源码,数据结构等方面去深入了解每一个类,下一节我们要学习Collection
的相关知识,敬请期待~