第11章 集合

主要内容

  • List集合
  • Set集合
  • Map集合

学习目标

  • 能够熟练使用Collection集合的API
  • 能够使用Iterator迭代器遍历Collection系列的集合
  • 能够使用foreach遍历Collection系列的集合
  • 能够说出List集合和Set集合的区别
  • 能够说出List集合各种实现类的区别
  • 能够说出Set集合各种实现类的区别
  • 能够说出Collection集合与Map集合的区别
  • 掌握Map集合的常用API
  • 能够遍历Map集合
  • 能够说出Map集合各种实现类的区别

第十一章 集合

集合是java中提供的一种容器,可以用来存储多个数据。

集合和数组既然都是容器,它们有啥区别呢?

  • 数组的长度是固定的。集合的长度是可变的。
  • 数组中可以存储基本数据类型值,也可以存储对象,而集合中只能存储对象

集合主要分为两大系列:Collection和Map,Collection 表示一组对象,Map表示一组映射关系或键值对。

11.1 Collection

Collection 层次结构中的根接口。Collection 表示一组对象,这些对象也称为 collection 的元素。一些 collection 允许有重复的元素,而另一些则不允许。一些 collection 是有序的,而另一些则是无序的。JDK 不提供此接口的任何直接实现:它提供更具体的子接口(如 Set 和 List、Queue)实现。此接口通常用来传递 collection,并在需要最大普遍性的地方操作这些 collection。

Collection是所有单列集合的父接口,因此在Collection中定义了单列集合(List和Set)通用的一些方法,这些方法可用于操作所有的单列集合。方法如下:

1、添加元素

(1)add(E obj):添加元素对象到当前集合中

(2)addAll(Collection<? extends E> other):添加other集合中的所有元素对象到当前集合中,即this = this ∪ other

2、删除元素

(1) boolean remove(Object obj) :从当前集合中删除第一个找到的与obj对象equals返回true的元素。

(2)boolean removeAll(Collection<?> coll):从当前集合中删除所有与coll集合中相同的元素。即this = this - this ∩ coll

3、判断

(1)boolean isEmpty():判断当前集合是否为空集合。

(2)boolean contains(Object obj):判断当前集合中是否存在一个与obj对象equals返回true的元素。

(3)boolean containsAll(Collection<?> c):判断c集合中的元素是否在当前集合中都存在。即c集合是否是当前集合的“子集”。

4、获取元素个数

(1)int size():获取当前集合中实际存储的元素个数

5、交集

(1)boolean retainAll(Collection<?> coll):当前集合仅保留与c集合中的元素相同的元素,即当前集合中仅保留两个集合的交集,即this = this ∩ coll;

6、转为数组

(1)Object[] toArray():返回包含当前集合中所有元素的数组

方法演示:

  1. import java.util.ArrayList;
  2. import java.util.Collection;
  3. public class Demo1Collection {
  4. public static void main(String[] args) {
  5. // 创建集合对象
  6. // 使用多态形式
  7. Collection<String> coll = new ArrayList<String>();
  8. // 使用方法
  9. // 添加功能 boolean add(String s)
  10. coll.add("小李广");
  11. coll.add("扫地僧");
  12. coll.add("石破天");
  13. System.out.println(coll);
  14. // boolean contains(E e) 判断o是否在集合中存在
  15. System.out.println("判断 扫地僧 是否在集合中"+coll.contains("扫地僧"));
  16. //boolean remove(E e) 删除在集合中的o元素
  17. System.out.println("删除石破天:"+coll.remove("石破天"));
  18. System.out.println("操作之后集合中元素:"+coll);
  19. // size() 集合中有几个元素
  20. System.out.println("集合中有"+coll.size()+"个元素");
  21. // Object[] toArray()转换成一个Object数组
  22. Object[] objects = coll.toArray();
  23. // 遍历数组
  24. for (int i = 0; i < objects.length; i++) {
  25. System.out.println(objects[i]);
  26. }
  27. // void clear() 清空集合
  28. coll.clear();
  29. System.out.println("集合中内容为:"+coll);
  30. // boolean isEmpty() 判断是否为空
  31. System.out.println(coll.isEmpty());
  32. }
  33. }
  1. @Test
  2. public void test2(){
  3. Collection coll = new ArrayList();
  4. coll.add(1);
  5. coll.add(2);
  6. System.out.println("coll集合元素的个数:" + coll.size());
  7. Collection other = new ArrayList();
  8. other.add(1);
  9. other.add(2);
  10. other.add(3);
  11. coll.addAll(other);
  12. // coll.add(other);
  13. System.out.println("coll集合元素的个数:" + coll.size());
  14. }

注意:coll.addAll(other);与coll.add(other);

尚硅谷_高佳志_JavaSE_第11章 集合 - 图1

  1. @Test
  2. public void test5(){
  3. Collection coll = new ArrayList();
  4. coll.add(1);
  5. coll.add(2);
  6. coll.add(3);
  7. coll.add(4);
  8. coll.add(5);
  9. System.out.println("coll集合元素的个数:" + coll.size());//5
  10. Collection other = new ArrayList();
  11. other.add(1);
  12. other.add(2);
  13. other.add(8);
  14. coll.retainAll(other);//保留交集
  15. System.out.println("coll集合元素的个数:" + coll.size());//2
  16. }

11.2 Iterator迭代器

11.2.1 Iterator接口

在程序开发中,经常需要遍历集合中的所有元素。针对这种需求,JDK专门提供了一个接口java.util.IteratorIterator接口也是Java集合中的一员,但它与CollectionMap接口有所不同,Collection接口与Map接口主要用于存储元素,而Iterator主要用于迭代访问(即遍历)Collection中的元素,因此Iterator对象也被称为迭代器。

想要遍历Collection集合,那么就要获取该集合迭代器完成迭代操作,下面介绍一下获取迭代器的方法:

  • public Iterator iterator(): 获取集合对应的迭代器,用来遍历集合中的元素的。

下面介绍一下迭代的概念:

  • 迭代:即Collection集合元素的通用获取方式。在取元素之前先要判断集合中有没有元素,如果有,就把这个元素取出来,继续在判断,如果还有就再取出出来。一直把集合中的所有元素全部取出。这种取出方式专业术语称为迭代。

Iterator接口的常用方法如下:

  • public E next():返回迭代的下一个元素。
  • public boolean hasNext():如果仍有元素可以迭代,则返回 true。

接下来我们通过案例学习如何使用Iterator迭代集合中元素:

  1. public class IteratorDemo {
  2. public static void main(String[] args) {
  3. // 使用多态方式 创建对象
  4. Collection<String> coll = new ArrayList<String>();
  5. // 添加元素到集合
  6. coll.add("串串星人");
  7. coll.add("吐槽星人");
  8. coll.add("汪星人");
  9. //遍历
  10. //使用迭代器 遍历 每个集合对象都有自己的迭代器
  11. Iterator<String> it = coll.iterator();
  12. // 泛型指的是 迭代出 元素的数据类型
  13. while(it.hasNext()){ //判断是否有迭代元素
  14. String s = it.next();//获取迭代出的元素
  15. System.out.println(s);
  16. }
  17. }
  18. }

tips::在进行集合元素取出时,如果集合中已经没有元素了,还继续使用迭代器的next方法,将会发生java.util.NoSuchElementException没有集合元素的错误。

11.2.2 迭代器的实现原理

我们在之前案例已经完成了Iterator遍历集合的整个过程。当遍历集合时,首先通过调用集合的iterator()方法获得迭代器对象,然后使用hashNext()方法判断集合中是否存在下一个元素,如果存在,则调用next()方法将元素取出,否则说明已到达了集合末尾,停止遍历元素。

Iterator迭代器对象在遍历集合时,内部采用指针的方式来跟踪集合中的元素,为了让初学者能更好地理解迭代器的工作原理,接下来通过一个图例来演示Iterator对象迭代元素的过程:

尚硅谷_高佳志_JavaSE_第11章 集合 - 图2

在调用Iterator的next方法之前,迭代器的索引位于第一个元素之前,指向第一个元素,当第一次调用迭代器的next方法时,返回第一个元素,然后迭代器的索引会向后移动一位,指向第二个元素,当再次调用next方法时,返回第二个元素,然后迭代器的索引会再向后移动一位,指向第三个元素,依此类推,直到hasNext方法返回false,表示到达了集合的末尾,终止对元素的遍历。

11.2.3 使用Iterator迭代器删除元素

java.util.Iterator迭代器中有一个方法:

  1. void remove() ;

那么,既然Collection已经有remove(xx)方法了,为什么Iterator迭代器还要提供删除方法呢?

因为Collection的remove方法,无法根据条件删除。

例如:要删除以下集合元素中的偶数

  1. @Test
  2. public void test02(){
  3. Collection<Integer> coll = new ArrayList<>();
  4. coll.add(1);
  5. coll.add(2);
  6. coll.add(3);
  7. coll.add(4);
  8. // coll.remove(?)//无法编写
  9. Iterator<Integer> iterator = coll.iterator();
  10. while(iterator.hasNext()){
  11. Integer element = iterator.next();
  12. if(element%2 == 0){
  13. // coll.remove(element);//错误的
  14. iterator.remove();
  15. }
  16. }
  17. System.out.println(coll);
  18. }

注意:不要在使用Iterator迭代器进行迭代时,调用Collection的remove(xx)方法,否则会报异常java.util.ConcurrentModificationException,或出现不确定行为。

11.2.4 增强for

增强for循环(也称for each循环)是JDK1.5以后出来的一个高级for循环,专门用来遍历数组和集合的。

格式:

  1. for(元素的数据类型 变量 : Collection集合or数组){
  2. //写操作代码
  3. }

练习1:遍历数组

通常只进行遍历元素,不要在遍历的过程中对数组元素进行修改

  1. public class NBForDemo1 {
  2. public static void main(String[] args) {
  3. int[] arr = {3,5,6,87};
  4. //使用增强for遍历数组
  5. for(int a : arr){//a代表数组中的每个元素
  6. System.out.println(a);
  7. }
  8. }
  9. }

练习2:遍历集合

通常只进行遍历元素,不要在遍历的过程中对集合元素进行增加、删除、替换操作

  1. public class NBFor {
  2. public static void main(String[] args) {
  3. Collection<String> coll = new ArrayList<String>();
  4. coll.add("小河神");
  5. coll.add("老河神");
  6. coll.add("神婆");
  7. //使用增强for遍历
  8. for(String s :coll){//接收变量s代表 代表被遍历到的集合元素
  9. System.out.println(s);
  10. }
  11. }
  12. }

11.2.5 java.lang.Iterable接口

java.lang.Iterable接口,实现这个接口允许对象成为 “foreach” 语句的目标。

Java 5时Collection接口继承了java.lang.Iterable接口,因此Collection系列的集合就可以直接使用foreach循环遍历。

java.lang.Iterable接口的抽象方法:

  • public Iterator iterator(): 获取对应的迭代器,用来遍历数组或集合中的元素的。

自定义某容器类型,实现java.lang.Iterable接口,发现就可以使用foreach进行迭代。

  1. import java.util.Iterator;
  2. public class TestMyArrayList {
  3. public static void main(String[] args) {
  4. MyArrayList<String> my = new MyArrayList<>();
  5. for(String obj : my) {
  6. System.out.println(obj);
  7. }
  8. }
  9. }
  10. class MyArrayList<T> implements Iterable<T>{
  11. @Override
  12. public Iterator<T> iterator() {
  13. return null;
  14. }
  15. }

foreach本质上就是使用Iterator迭代器进行遍历的。

我们在如下代码的for(Student student : coll)这行打断点,然后使用单步调试进入源码,发现foreach本质上是调用集合的iterator()方法,返回一个迭代器进行迭代的

  1. import java.util.ArrayList;
  2. import java.util.Collection;
  3. public class TestForeach {
  4. public static void main(String[] args) {
  5. Collection<String> coll = new ArrayList<>();
  6. coll.add("陈琦");
  7. coll.add("李晨");
  8. coll.add("邓超");
  9. coll.add("黄晓明");
  10. //调用ArrayList里面的Iterator iterator()
  11. for (String str : coll) {
  12. System.out.println(str);
  13. }
  14. }
  15. }

尚硅谷_高佳志_JavaSE_第11章 集合 - 图3

尚硅谷_高佳志_JavaSE_第11章 集合 - 图4

尚硅谷_高佳志_JavaSE_第11章 集合 - 图5

所以也不要在foreach遍历的过程使用Collection的remove()方法。否则,要么报异常java.util.ConcurrentModificationException,要么行为不确定。

11.2.6 Java中modCount的用法,快速失败(fail-fast)机制

当使用foreach或Iterator迭代器遍历集合时,同时调用迭代器自身以外的方法修改了集合的结构,例如调用集合的add和remove方法时,就会报ConcurrentModificationException。

  1. import java.util.ArrayList;
  2. import java.util.Collection;
  3. import java.util.Iterator;
  4. public class TestForeach {
  5. public static void main(String[] args) {
  6. Collection<String> list = new ArrayList<>();
  7. list.add("hello");
  8. list.add("java");
  9. list.add("atguigu");
  10. list.add("world");
  11. Iterator<String> iterator = list.iterator();
  12. while(iterator.hasNext()){
  13. list.remove(iterator.next());
  14. }
  15. }
  16. }

如果在Iterator、ListIterator迭代器创建后的任意时间从结构上修改了集合(通过迭代器自身的 remove 或 add 方法之外的任何其他方式),则迭代器将抛出 ConcurrentModificationException。因此,面对并发的修改,迭代器很快就完全失败,而不是冒着在将来不确定的时间任意发生不确定行为的风险。

这样设计是因为,迭代器代表集合中某个元素的位置,内部会存储某些能够代表该位置的信息。当集合发生改变时,该信息的含义可能会发生变化,这时操作迭代器就可能会造成不可预料的事情。因此,果断抛异常阻止,是最好的方法。这就是Iterator迭代器的快速失败(fail-fast)机制。

注意,迭代器的快速失败行为不能得到保证,一般来说,存在不同步的并发修改时,不可能作出任何坚决的保证。快速失败迭代器尽最大努力抛出 ConcurrentModificationException。因此,编写依赖于此异常的程序的方式是错误的,正确做法是:迭代器的快速失败行为应该仅用于检测 bug。例如:

  1. @Test
  2. public void test02() {
  3. ArrayList<String> list = new ArrayList<>();
  4. list.add("hello");
  5. list.add("java");
  6. list.add("atguigu");
  7. list.add("world");
  8. //以下代码没有发生ConcurrentModificationException异常
  9. Iterator<String> iterator = list.iterator();
  10. while(iterator.hasNext()){
  11. String str = iterator.next();
  12. if("atguigu".equals(str)){
  13. list.remove(str);
  14. }
  15. }
  16. }

那么如何实现快速失败(fail-fast)机制的呢?

  • 在ArrayList等集合类中都有一个modCount变量。它用来记录集合的结构被修改的次数。
  • 当我们给集合添加和删除操作时,会导致modCount++。
  • 然后当我们用Iterator迭代器遍历集合时,创建集合迭代器的对象时,用一个变量记录当前集合的modCount。例如:int expectedModCount = modCount;,并且在迭代器每次next()迭代元素时,都要检查 expectedModCount != modCount,如果不相等了,那么说明你调用了Iterator迭代器以外的Collection的add,remove等方法,修改了集合的结构,使得modCount++,值变了,就会抛出ConcurrentModificationException。

下面以AbstractList和ArrayList.Itr迭代器为例进行源码分析:

AbstractList类中声明了modCount变量:

  1. /**
  2. * The number of times this list has been <i>structurally modified</i>.
  3. * Structural modifications are those that change the size of the
  4. * list, or otherwise perturb it in such a fashion that iterations in
  5. * progress may yield incorrect results.
  6. *
  7. * <p>This field is used by the iterator and list iterator implementation
  8. * returned by the {@code iterator} and {@code listIterator} methods.
  9. * If the value of this field changes unexpectedly, the iterator (or list
  10. * iterator) will throw a {@code ConcurrentModificationException} in
  11. * response to the {@code next}, {@code remove}, {@code previous},
  12. * {@code set} or {@code add} operations. This provides
  13. * <i>fail-fast</i> behavior, rather than non-deterministic behavior in
  14. * the face of concurrent modification during iteration.
  15. *
  16. * <p><b>Use of this field by subclasses is optional.</b> If a subclass
  17. * wishes to provide fail-fast iterators (and list iterators), then it
  18. * merely has to increment this field in its {@code add(int, E)} and
  19. * {@code remove(int)} methods (and any other methods that it overrides
  20. * that result in structural modifications to the list). A single call to
  21. * {@code add(int, E)} or {@code remove(int)} must add no more than
  22. * one to this field, or the iterators (and list iterators) will throw
  23. * bogus {@code ConcurrentModificationExceptions}. If an implementation
  24. * does not wish to provide fail-fast iterators, this field may be
  25. * ignored.
  26. */
  27. protected transient int modCount = 0;

modCount是这个list被结构性修改的次数。结构性修改是指:改变list的size大小,或者,以其他方式改变他导致正在进行迭代时出现错误的结果。

这个字段用于迭代器和列表迭代器的实现类中,由迭代器和列表迭代器方法返回。如果这个值被意外改变,这个迭代器将会抛出 ConcurrentModificationException的异常来响应:next,remove,previous,set,add 这些操作。在迭代过程中,他提供了fail-fast行为而不是不确定行为来处理并发修改。

子类使用这个字段是可选的,如果子类希望提供fail-fast迭代器,它仅仅需要在add(int, E),remove(int)方法(或者它重写的其他任何会结构性修改这个列表的方法)中添加这个字段。调用一次add(int,E)或者remove(int)方法时必须且仅仅给这个字段加1,否则迭代器会抛出伪装的ConcurrentModificationExceptions错误。如果一个实现类不希望提供fail-fast迭代器,则可以忽略这个字段。

Arraylist的Itr迭代器:

  1. private class Itr implements Iterator<E> {
  2. int cursor;
  3. int lastRet = -1;
  4. int expectedModCount = modCount;//在创建迭代器时,expectedModCount初始化为当前集合的modCount的值
  5. public boolean hasNext() {
  6. return cursor != size;
  7. }
  8. @SuppressWarnings("unchecked")
  9. public E next() {
  10. checkForComodification();//校验expectedModCount与modCount是否相等
  11. int i = cursor;
  12. if (i >= size)
  13. throw new NoSuchElementException();
  14. Object[] elementData = ArrayList.this.elementData;
  15. if (i >= elementData.length)
  16. throw new ConcurrentModificationException();
  17. cursor = i + 1;
  18. return (E) elementData[lastRet = i];
  19. }
  20. final void checkForComodification() {
  21. if (modCount != expectedModCount)//校验expectedModCount与modCount是否相等
  22. throw new ConcurrentModificationException();//不相等,抛异常
  23. }
  24. }

11.2.7 练习

1、练习1

  • 添加100以内的质数到Collection的某个集合中
  • 使用foreach遍历
  • 使用Iterator遍历,并删除个位数是3个质数
  • 删除11
  • 查看最后剩下几个元素
  • 添加10个100以内的随机整数到另一个Collection的集合中
  • 求它们的交集

2、练习2

声明学员类型Student,包含属性:姓名,成绩

添加本组学员Student对象到Collection的某个集合中

  • 使用foreach遍历
  • 使用Iterator遍历,并删除成绩低于60分的

11.3 List集合

我们掌握了Collection接口的使用后,再来看看Collection接口中的子接口,他们都具备那些特性呢?

11.3.1 List接口介绍

java.util.List接口继承自Collection接口,是单列集合的一个重要分支,习惯性地会将实现了List接口的对象称为List集合。

List接口特点:

  1. List集合所有的元素是以一种线性方式进行存储的,例如,存元素的顺序是11、22、33。那么集合中,元素的存储就是按照11、22、33的顺序完成的)
  2. 它是一个元素存取有序的集合。即元素的存入顺序和取出顺序有保证。
  3. 它是一个带有索引的集合,通过索引就可以精确的操作集合中的元素(与数组的索引是一个道理)。
  4. 集合中可以有重复的元素,通过元素的equals方法,来比较是否为重复的元素。

List集合类中元素有序、且可重复。这就像银行门口客服,给每一个来办理业务的客户分配序号:第一个来的是“张三”,客服给他分配的是0;第二个来的是“李四”,客服给他分配的1;以此类推,最后一个序号应该是“总人数-1”。

尚硅谷_高佳志_JavaSE_第11章 集合 - 图6

注意:

List集合关心元素是否有序,而不关心是否重复,请大家记住这个原则。例如“张三”可以领取两个号。

11.3.2 List接口中常用方法

List作为Collection集合的子接口,不但继承了Collection接口中的全部方法,而且还增加了一些根据元素索引来操作集合的特有方法,如下:

List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来操作集合元素的方法。

1、添加元素

  • void add(int index, E ele)
  • boolean addAll(int index, Collection<? extends E> eles)

2、获取元素

  • E get(int index)
  • List subList(int fromIndex, int toIndex)

3、获取元素索引

  • int indexOf(Object obj)
  • int lastIndexOf(Object obj)

4、删除和替换元素

  • E remove(int index)
  • E set(int index, E ele)

List集合特有的方法都是跟索引相关:

  1. public class ListDemo {
  2. public static void main(String[] args) {
  3. // 创建List集合对象
  4. List<String> list = new ArrayList<String>();
  5. // 往 尾部添加 指定元素
  6. list.add("图图");
  7. list.add("小美");
  8. list.add("不高兴");
  9. System.out.println(list);
  10. // add(int index,String s) 往指定位置添加
  11. list.add(1,"没头脑");
  12. System.out.println(list);
  13. // String remove(int index) 删除指定位置元素 返回被删除元素
  14. // 删除索引位置为2的元素
  15. System.out.println("删除索引位置为2的元素");
  16. System.out.println(list.remove(2));
  17. System.out.println(list);
  18. // String set(int index,String s)
  19. // 在指定位置 进行 元素替代(改)
  20. // 修改指定位置元素
  21. list.set(0, "三毛");
  22. System.out.println(list);
  23. // String get(int index) 获取指定位置元素
  24. // 跟size() 方法一起用 来 遍历的
  25. for(int i = 0;i<list.size();i++){
  26. System.out.println(list.get(i));
  27. }
  28. //还可以使用增强for
  29. for (String string : list) {
  30. System.out.println(string);
  31. }
  32. }
  33. }

在JavaSE中List名称的类型有两个,一个是java.util.List集合接口,一个是java.awt.List图形界面的组件,别导错包了。

11.3.3 List接口的实现类们

List接口的实现类有很多,常见的有:

ArrayList:动态数组

Vector:动态数组

LinkedList:双向链表

Stack:栈

它们的区别我们在数据结构部分再详细讲解

11.3.4 ListIterator

List 集合额外提供了一个 listIterator() 方法,该方法返回一个 ListIterator 对象, ListIterator 接口继承了 Iterator 接口,提供了专门操作 List 的方法:

  • void add():通过迭代器添加元素到对应集合
  • void set(Object obj):通过迭代器替换正迭代的元素
  • void remove():通过迭代器删除刚迭代的元素
  • boolean hasPrevious():如果以逆向遍历列表,往前是否还有元素。
  • Object previous():返回列表中的前一个元素。
  • int previousIndex():返回列表中的前一个元素的索引
  • boolean hasNext()
  • Object next()
  • int nextIndex()
  1. public static void main(String[] args) {
  2. List<Student> c = new ArrayList<>();
  3. c.add(new Student(1,"张三"));
  4. c.add(new Student(2,"李四"));
  5. c.add(new Student(3,"王五"));
  6. c.add(new Student(4,"赵六"));
  7. c.add(new Student(5,"钱七"));
  8. //从指定位置往前遍历
  9. ListIterator<Student> listIterator = c.listIterator(c.size());
  10. while(listIterator.hasPrevious()){
  11. Student previous = listIterator.previous();
  12. System.out.println(previous);
  13. }
  14. }

11.4 Set集合

Set接口是Collection的子接口,set接口没有提供额外的方法。但是比Collection接口更加严格了。

Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败。

Set集合支持的遍历方式和Collection集合一样:foreach和Iterator。

Set的常用实现类有:HashSet、TreeSet、LinkedHashSet。

11.6.1 HashSet

HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。

java.util.HashSet底层的实现其实是一个java.util.HashMap支持,然后HashMap的底层物理实现是一个Hash表。(什么是哈希表,下一节在HashMap小节在细讲,这里先不展开)

HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取和查找性能。HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。因此,存储到HashSet的元素要重写hashCode和equals方法。

示例代码:定义一个Employee类,该类包含属性:name, birthday,其中 birthday 为 MyDate类的对象;MyDate为自定义类型,包含年、月、日属性。要求 name和birthday一样的视为同一个员工。

  1. public class Employee {
  2. private String name;
  3. private MyDate birthday;
  4. public Employee(String name, MyDate birthday) {
  5. super();
  6. this.name = name;
  7. this.birthday = birthday;
  8. }
  9. public Employee() {
  10. super();
  11. }
  12. public String getName() {
  13. return name;
  14. }
  15. public void setName(String name) {
  16. this.name = name;
  17. }
  18. public MyDate getBirthday() {
  19. return birthday;
  20. }
  21. public void setBirthday(MyDate birthday) {
  22. this.birthday = birthday;
  23. }
  24. @Override
  25. public int hashCode() {
  26. final int prime = 31;
  27. int result = 1;
  28. result = prime * result + ((birthday == null) ? 0 : birthday.hashCode());
  29. result = prime * result + ((name == null) ? 0 : name.hashCode());
  30. return result;
  31. }
  32. @Override
  33. public boolean equals(Object obj) {
  34. if (this == obj)
  35. return true;
  36. if (obj == null)
  37. return false;
  38. if (getClass() != obj.getClass())
  39. return false;
  40. Employee other = (Employee) obj;
  41. if (birthday == null) {
  42. if (other.birthday != null)
  43. return false;
  44. } else if (!birthday.equals(other.birthday))
  45. return false;
  46. if (name == null) {
  47. if (other.name != null)
  48. return false;
  49. } else if (!name.equals(other.name))
  50. return false;
  51. return true;
  52. }
  53. @Override
  54. public String toString() {
  55. return "姓名:" + name + ", 生日:" + birthday;
  56. }
  57. }
  1. public class MyDate {
  2. private int year;
  3. private int month;
  4. private int day;
  5. public MyDate(int year, int month, int day) {
  6. super();
  7. this.year = year;
  8. this.month = month;
  9. this.day = day;
  10. }
  11. public MyDate() {
  12. super();
  13. }
  14. public int getYear() {
  15. return year;
  16. }
  17. public void setYear(int year) {
  18. this.year = year;
  19. }
  20. public int getMonth() {
  21. return month;
  22. }
  23. public void setMonth(int month) {
  24. this.month = month;
  25. }
  26. public int getDay() {
  27. return day;
  28. }
  29. public void setDay(int day) {
  30. this.day = day;
  31. }
  32. @Override
  33. public int hashCode() {
  34. final int prime = 31;
  35. int result = 1;
  36. result = prime * result + day;
  37. result = prime * result + month;
  38. result = prime * result + year;
  39. return result;
  40. }
  41. @Override
  42. public boolean equals(Object obj) {
  43. if (this == obj)
  44. return true;
  45. if (obj == null)
  46. return false;
  47. if (getClass() != obj.getClass())
  48. return false;
  49. MyDate other = (MyDate) obj;
  50. if (day != other.day)
  51. return false;
  52. if (month != other.month)
  53. return false;
  54. if (year != other.year)
  55. return false;
  56. return true;
  57. }
  58. @Override
  59. public String toString() {
  60. return year + "-" + month + "-" + day;
  61. }
  62. }
  1. import java.util.HashSet;
  2. public class TestHashSet {
  3. @SuppressWarnings("all")
  4. public static void main(String[] args) {
  5. HashSet<Employee> set = new HashSet<>();
  6. set.add(new Employee("张三", new MyDate(1990,1,1)));
  7. //重复元素无法添加,因为MyDate和Employee重写了hashCode和equals方法
  8. set.add(new Employee("张三", new MyDate(1990,1,1)));
  9. set.add(new Employee("李四", new MyDate(1992,2,2)));
  10. for (Employee object : set) {
  11. System.out.println(object);
  12. }
  13. }
  14. }

11.6.2 LinkedHashSet

LinkedHashSet是HashSet的子类,它在HashSet的基础上,在结点中增加两个属性before和after维护了结点的前后添加顺序。java.util.LinkedHashSet,它是链表和哈希表组合的一个数据存储结构。LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。

  1. LinkedHashSet<String> set = new LinkedHashSet<>();
  2. set.add("张三");
  3. set.add("李四");
  4. set.add("王五");
  5. set.add("张三");
  6. System.out.println("元素个数:" + set.size());
  7. for (String name : set) {
  8. System.out.println(name);
  9. }
  1. 运行结果:
  2. 元素个数:3
  3. 张三
  4. 李四
  5. 王五

11.6.2 TreeSet

底层结构:里面维护了一个TreeMap,都是基于红黑树实现的!

特点:
1、不允许重复
2、实现排序
自然排序或定制排序

如何实现去重的?

  1. 如果使用的是自然排序,则通过调用实现的compareTo方法
  2. 如果使用的是定制排序,则通过调用比较器的compare方法

如何排序?

  1. 方式一:自然排序
  2. 让待添加的元素类型实现Comparable接口,并重写compareTo方法
  3. 方式二:定制排序
  4. 创建Set对象时,指定Comparator比较器接口,并实现compare方法

自然顺序

如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable 接口。实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小。对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过 compareTo(Object obj) 方法比较返回值为0。

代码示例一:按照字符串Unicode编码值排序

  1. @Test
  2. public void test1(){
  3. TreeSet<String> set = new TreeSet<>();
  4. set.add("zhangsan"); //String它实现了java.lang.Comparable接口
  5. set.add("lisi");
  6. set.add("wangwu");
  7. set.add("zhangsan");
  8. System.out.println("元素个数:" + set.size());
  9. for (String str : set) {
  10. System.out.println(str);
  11. }
  12. }

定制排序

如果放到TreeSet中的元素的自然排序(Comparable)规则不符合当前排序需求时,或者元素的类型没有实现Comparable接口。那么在创建TreeSet时,可以单独指定一个Comparator的对象。使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。

代码示例:学生类型未实现Comparable接口,单独指定Comparator比较器,按照学生的学号排序

  1. public class Student{
  2. private int id;
  3. private String name;
  4. public Student(int id, String name) {
  5. super();
  6. this.id = id;
  7. this.name = name;
  8. }
  9. public int getId() {
  10. return id;
  11. }
  12. public void setId(int id) {
  13. this.id = id;
  14. }
  15. //......这里省略了name属性的get/set
  16. @Override
  17. public String toString() {
  18. return "Student [id=" + id + ", name=" + name + "]";
  19. }
  20. }
  1. @Test
  2. public void test3(){
  3. TreeSet<Student> set = new TreeSet(new Comparator<Student>(){
  4. @Override
  5. public int compare(Student o1, Student o2) {
  6. return o1.getId() - o2.getId();
  7. }
  8. });
  9. set.add(new Student(3,"张三"));
  10. set.add(new Student(1,"李四"));
  11. set.add(new Student(2,"王五"));
  12. set.add(new Student(3,"张三风"));
  13. System.out.println("元素个数:" + set.size());
  14. for (Student stu : set) {
  15. System.out.println(stu);
  16. }
  17. }

11.5 Collection系列的集合框架图

尚硅谷_高佳志_JavaSE_第11章 集合 - 图7

11.6 Map

11.6.1 概述

现实生活中,我们常会看到这样的一种集合:IP地址与主机名,身份证号与个人,系统用户名与系统用户对象等,这种一一对应的关系,就叫做映射。Java提供了专门的集合类用来存放这种对象关系的对象,即java.util.Map<K,V>接口。

我们通过查看Map接口描述,发现Map<K,V>接口下的集合与Collection<E>接口下的集合,它们存储数据的形式不同。

  • Collection中的集合,元素是孤立存在的(理解为单身),向集合中存储元素采用一个个元素的方式存储。
  • Map中的集合,元素是成对存在的(理解为夫妻)。每个元素由键与值两部分组成,通过键可以找对所对应的值。
  • Collection中的集合称为单列集合,Map中的集合称为双列集合。
  • 需要注意的是,Map中的集合不能包含重复的键,值可以重复;每个键只能对应一个值(这个值可以是单个值,也可以是个数组或集合值)。

尚硅谷_高佳志_JavaSE_第11章 集合 - 图8

11.6.2 Map常用方法

1、添加操作

  • V put(K key,V value)
  • void putAll(Map<? extends K,? extends V> m)

2、删除

  • void clear()
  • V remove(Object key)

3、元素查询的操作

  • V get(Object key)
  • boolean containsKey(Object key)
  • boolean containsValue(Object value)
  • boolean isEmpty()

4、元视图操作的方法:

  • Set keySet()
  • Collection values()
  • Set> entrySet()

5、其他方法

  • int size()
  1. public class MapDemo {
  2. public static void main(String[] args) {
  3. //创建 map对象
  4. HashMap<String, String> map = new HashMap<String, String>();
  5. //添加元素到集合
  6. map.put("黄晓明", "杨颖");
  7. map.put("文章", "马伊琍");
  8. map.put("邓超", "孙俪");
  9. System.out.println(map);
  10. //String remove(String key)
  11. System.out.println(map.remove("邓超"));
  12. System.out.println(map);
  13. // 想要查看 黄晓明的媳妇 是谁
  14. System.out.println(map.get("黄晓明"));
  15. System.out.println(map.get("邓超"));
  16. }
  17. }

tips:

使用put方法时,若指定的键(key)在集合中没有,则没有这个键对应的值,返回null,并把指定的键值添加到集合中;

若指定的键(key)在集合中存在,则返回值为集合中键对应的值(该值为替换前的值),并把指定键所对应的值,替换成指定的新值。

11.6.3 Map集合的遍历

Collection集合的遍历:(1)foreach(2)通过Iterator对象遍历

Map的遍历,不能支持foreach,因为Map接口没有继承java.lang.Iterable接口,也没有实现Iterator iterator()方法。只能用如下方式遍历:

(1)分开遍历:

  • 单独遍历所有key
  • 单独遍历所有value

(2)成对遍历:

  • 遍历的是映射关系Map.Entry类型的对象,Map.Entry是Map接口的内部接口。每一种Map内部有自己的Map.Entry的实现类。在Map中存储数据,实际上是将Key——>value的数据存储在Map.Entry接口的实例中,再在Map集合中插入Map.Entry的实例化对象,如图示:

尚硅谷_高佳志_JavaSE_第11章 集合 - 图9

  1. public class TestMap {
  2. public static void main(String[] args) {
  3. HashMap<String,String> map = new HashMap<>();
  4. map.put("许仙", "白娘子");
  5. map.put("董永", "七仙女");
  6. map.put("牛郎", "织女");
  7. map.put("许仙", "小青");
  8. System.out.println("所有的key:");
  9. Set<String> keySet = map.keySet();
  10. for (String key : keySet) {
  11. System.out.println(key);
  12. }
  13. System.out.println("所有的value:");
  14. Collection<String> values = map.values();
  15. for (String value : values) {
  16. System.out.println(value);
  17. }
  18. System.out.println("所有的映射关系");
  19. Set<Map.Entry<String,String>> entrySet = map.entrySet();
  20. for (Map.Entry<String,String> entry : entrySet) {
  21. // System.out.println(entry);
  22. System.out.println(entry.getKey()+"->"+entry.getValue());
  23. }
  24. }
  25. }

11.6.4 Map的实现类们

Map接口的常用实现类:HashMap、TreeMap、LinkedHashMap和Properties。其中HashMap是 Map 接口使用频率最高的实现类。

1、HashMap和Hashtable的区别与联系

  • HashMap和Hashtable都是哈希表。

  • HashMap和Hashtable判断两个 key 相等的标准是:两个 key 的hashCode 值相等,并且 equals() 方法也返回 true。因此,为了成功地在哈希表中存储和获取对象,用作键的对象必须实现 hashCode 方法和 equals 方法。

  • Hashtable是线程安全的,任何非 null 对象都可以用作键或值。

  • HashMap是线程不安全的,并允许使用 null 值和 null 键。

示例代码:添加员工姓名为key,薪资为value

  1. public static void main(String[] args) {
  2. HashMap<String,Double> map = new HashMap<>();
  3. map.put("张三", 10000.0);
  4. //key相同,新的value会覆盖原来的value
  5. //因为String重写了hashCode和equals方法
  6. map.put("张三", 12000.0);
  7. map.put("李四", 14000.0);
  8. //HashMap支持key和value为null值
  9. String name = null;
  10. Double salary = null;
  11. map.put(name, salary);
  12. Set<Entry<String, Double>> entrySet = map.entrySet();
  13. for (Entry<String, Double> entry : entrySet) {
  14. System.out.println(entry);
  15. }
  16. }

2、LinkedHashMap

LinkedHashMap 是 HashMap 的子类。此实现与 HashMap 的不同之处在于,后者维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序,该迭代顺序通常就是将键插入到映射中的顺序(插入顺序)。

示例代码:添加员工姓名为key,薪资为value

  1. public static void main(String[] args) {
  2. LinkedHashMap<String,Double> map = new LinkedHashMap<>();
  3. map.put("张三", 10000.0);
  4. //key相同,新的value会覆盖原来的value
  5. //因为String重写了hashCode和equals方法
  6. map.put("张三", 12000.0);
  7. map.put("李四", 14000.0);
  8. //HashMap支持key和value为null值
  9. String name = null;
  10. Double salary = null;
  11. map.put(name, salary);
  12. Set<Entry<String, Double>> entrySet = map.entrySet();
  13. for (Entry<String, Double> entry : entrySet) {
  14. System.out.println(entry);
  15. }
  16. }

3、TreeMap

基于红黑树(Red-Black tree)的 NavigableMap 实现。该映射根据其键的自然顺序进行排序,或者根据创建映射时提供的 Comparator 进行排序,具体取决于使用的构造方法。

代码示例:添加员工姓名为key,薪资为value

  1. package com.atguigu.map;
  2. import java.util.Comparator;
  3. import java.util.Map.Entry;
  4. import java.util.Set;
  5. import java.util.TreeMap;
  6. import org.junit.Test;
  7. public class TestTreeMap {
  8. @Test
  9. public void test1() {
  10. TreeMap<String,Integer> map = new TreeMap<>();
  11. map.put("Jack", 11000);
  12. map.put("Alice", 12000);
  13. map.put("zhangsan", 13000);
  14. map.put("baitao", 14000);
  15. map.put("Lucy", 15000);
  16. //String实现了Comparable接口,默认按照Unicode编码值排序
  17. Set<Entry<String, Integer>> entrySet = map.entrySet();
  18. for (Entry<String, Integer> entry : entrySet) {
  19. System.out.println(entry);
  20. }
  21. }
  22. @Test
  23. public void test2() {
  24. //指定定制比较器Comparator,按照Unicode编码值排序,但是忽略大小写
  25. TreeMap<String,Integer> map = new TreeMap<>(new Comparator<String>() {
  26. @Override
  27. public int compare(String o1, String o2) {
  28. return o1.compareToIgnoreCase(o2);
  29. }
  30. });
  31. map.put("Jack", 11000);
  32. map.put("Alice", 12000);
  33. map.put("zhangsan", 13000);
  34. map.put("baitao", 14000);
  35. map.put("Lucy", 15000);
  36. Set<Entry<String, Integer>> entrySet = map.entrySet();
  37. for (Entry<String, Integer> entry : entrySet) {
  38. System.out.println(entry);
  39. }
  40. }
  41. }

4、Properties

Properties 类是 Hashtable 的子类,Properties 可保存在流中或从流中加载。属性列表中每个键及其对应值都是一个字符串。

存取数据时,建议使用setProperty(String key,String value)方法和getProperty(String key)方法。

代码示例:

  1. public static void main(String[] args) {
  2. Properties properties = System.getProperties();
  3. String p2 = properties.getProperty("file.encoding");//当前源文件字符编码
  4. System.out.println(p2);
  5. }

11.6.5 Set集合与Map集合的关系

Set的内部实现其实是一个Map。即HashSet的内部实现是一个HashMap,TreeSet的内部实现是一个TreeMap,LinkedHashSet的内部实现是一个LinkedHashMap。

部分源代码摘要:

HashSet源码:

  1. public HashSet() {
  2. map = new HashMap<>();
  3. }
  4. public HashSet(Collection<? extends E> c) {
  5. map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
  6. addAll(c);
  7. }
  8. public HashSet(int initialCapacity, float loadFactor) {
  9. map = new HashMap<>(initialCapacity, loadFactor);
  10. }
  11. public HashSet(int initialCapacity) {
  12. map = new HashMap<>(initialCapacity);
  13. }
  14. //这个构造器是给子类LinkedHashSet调用的
  15. HashSet(int initialCapacity, float loadFactor, boolean dummy) {
  16. map = new LinkedHashMap<>(initialCapacity, loadFactor);
  17. }

LinkedHashSet源码:

  1. public LinkedHashSet(int initialCapacity, float loadFactor) {
  2. super(initialCapacity, loadFactor, true);//调用HashSet的某个构造器
  3. }
  4. public LinkedHashSet(int initialCapacity) {
  5. super(initialCapacity, .75f, true);//调用HashSet的某个构造器
  6. }
  7. public LinkedHashSet() {
  8. super(16, .75f, true);
  9. }
  10. public LinkedHashSet(Collection<? extends E> c) {
  11. super(Math.max(2*c.size(), 11), .75f, true);//调用HashSet的某个构造器
  12. addAll(c);
  13. }

TreeSet源码:

  1. public TreeSet() {
  2. this(new TreeMap<E,Object>());
  3. }
  4. public TreeSet(Comparator<? super E> comparator) {
  5. this(new TreeMap<>(comparator));
  6. }
  7. public TreeSet(Collection<? extends E> c) {
  8. this();
  9. addAll(c);
  10. }
  11. public TreeSet(SortedSet<E> s) {
  12. this(s.comparator());
  13. addAll(s);
  14. }

但是,咱们存到Set中只有一个元素,又是怎么变成(key,value)的呢?

以HashSet中的源码为例:

  1. private static final Object PRESENT = new Object();
  2. public boolean add(E e) {
  3. return map.put(e, PRESENT)==null;
  4. }
  5. public Iterator<E> iterator() {
  6. return map.keySet().iterator();
  7. }

原来是,把添加到Set中的元素作为内部实现map的key,然后用一个常量对象PRESENT对象,作为value。

这是因为Set的元素不可重复和Map的key不可重复有相同特点。Map有一个方法keySet()可以返回所有key。

11.7 集合框架

尚硅谷_高佳志_JavaSE_第11章 集合 - 图10

11.8 Collections工具类

参考操作数组的工具类:Arrays。

Collections 是一个操作 Set、List 和 Map 等集合的工具类。Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法:

  • public static boolean addAll(Collection<? super T> c,T… elements)将所有指定元素添加到指定 collection 中。
  • public static int binarySearch(List<? extends Comparable<? super T>> list,T key)在List集合中查找某个元素的下标,但是List的元素必须是T或T的子类对象,而且必须是可比较大小的,即支持自然排序的。而且集合也事先必须是有序的,否则结果不确定。
  • public static int binarySearch(List<? extends T> list,T key,Comparator<? super T> c)在List集合中查找某个元素的下标,但是List的元素必须是T或T的子类对象,而且集合也事先必须是按照c比较器规则进行排序过的,否则结果不确定。
  • public static > T max(Collection<? extends T> coll)在coll集合中找出最大的元素,集合中的对象必须是T或T的子类对象,而且支持自然排序
  • public static T max(Collection<? extends T> coll,Comparator<? super T> comp)在coll集合中找出最大的元素,集合中的对象必须是T或T的子类对象,按照比较器comp找出最大者
  • public static void reverse(List<?> list)反转指定列表List中元素的顺序。
  • public static void shuffle(List<?> list) List 集合元素进行随机排序,类似洗牌
  • public static > void sort(List list)根据元素的自然顺序对指定 List 集合元素按升序排序
  • public static void sort(List list,Comparator<? super T> c)根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
  • public static void swap(List<?> list,int i,int j)将指定 list 集合中的 i 处元素和 j 处元素进行交换
  • public static int frequency(Collection<?> c,Object o)返回指定集合中指定元素的出现次数
  • public static void copy(List<? super T> dest,List<? extends T> src)将src中的内容复制到dest中
  • public static boolean replaceAll(List list,T oldVal,T newVal):使用新值替换 List 对象的所有旧值
  • Collections 类中提供了多个 synchronizedXxx() 方法,该方法可使将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题
  • Collections类中提供了多个unmodifiableXxx()方法,该方法返回指定 Xxx的不可修改的视图。

11.9 集合练习

1、练习1

随机产生10个100以内的偶数,存放到一个List中,并且遍历显示它们

2、练习2

随机产生10个100以内的偶数,存放到一个Set中,并且遍历显示它们

3、练习3

随机产生几个100以内的偶数,存放到一个Set中,并且遍历显示它们,保证最后Set中有10个元素

4、练习4

(1)声明一个圆类型,包含半径,实现Comparable接口,按照半径大小排序

(2)存储几个圆对象到TreeSet中,并且遍历显示

5、练习5

(1)从键盘输入本组学员的姓名和他的手机号码,存放到map中,姓名为key,手机号码为value,并且遍历显示

(2)再从键盘输入姓名,查询他的手机号码

6、练习6

(1)存储咱们班每组学员信息,组长姓名为key,组员包括组长自己为value

(2)遍历显示

(3)从键盘输入一个学员姓名,查找这个学员是否咱们班