作者:像一只狗
链接:https://juejin.cn/post/6844903592487288839
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Set 集合概述

image.png
由于本篇文章主要叙述 Set 容器以及和 Map 容器之间关系,我们只需要关注上述集合图谱中 Set 部分。可以看出 Set 主要的实现类有 HashSet 和 TreeSet 以及没有画出的 LinkedHashSet。其中 HashSet 的实现依赖于 HashMap, TreeSet 的实现依赖于 TreeMap,LinkedHashSet 的实现依赖于 LinkedHashMap。

从各个实现类的声明也可以看出其继承关系

  1. public class HashSet<E>
  2. extends AbstractSet<E>
  3. implements Set<E>, Cloneable, java.io.Serializable
  4. public class LinkedHashSet<E>
  5. extends HashSet<E>
  6. implements Set<E>, Cloneable, java.io.Serializable
  7. public class TreeSet<E> extends AbstractSet<E>
  8. implements NavigableSet<E>, Cloneable, java.io.Serializable

在看 Set 的源码之前,我们先概括的说下 Set 集合的特点

  1. HashSet 底层是数组 + 单链表 + 红黑树的数据结构
  2. LinkedHashSet 底层是 数组 + 单链表 + 红黑树 + 双向链表的数据结构
  3. Set 不允许存储重复元素,允许存储 null
  4. HashSet 存储元素是无序且不等于访问顺序
  5. LinkedHashSet 存储元素是无序的,但是由于双向链表的存在,迭代时获取元素的顺序等于元素的添加顺序,注意这里不是访问顺序

HashSet 的源码分析

HashSet 源码只有短短的 300 行,上文也阐述了实现依赖于 HashMap,这一点充分体现在其构造方法和成员变量上。我们来看下 HashSet 的构造方法和成员变量:

  1. // HashSet 真实的存储元素结构
  2. private transient HashMap<E,Object> map;
  3. // 作为各个存储在 HashMap 元素的键值对中的 Value
  4. private static final Object PRESENT = new Object();
  5. //空参数构造方法 调用 HashMap 的空构造参数
  6. //初始化了 HashMap 中的加载因子 loadFactor = 0.75f
  7. public HashSet() {
  8. map = new HashMap<>();
  9. }
  10. //指定期望容量的构造方法
  11. public HashSet(int initialCapacity) {
  12. map = new HashMap<>(initialCapacity);
  13. }
  14. //指定期望容量和加载因子
  15. public HashSet(int initialCapacity, float loadFactor) {
  16. map = new HashMap<>(initialCapacity, loadFactor);
  17. }
  18. //使用指定的集合填充Set
  19. public HashSet(Collection<? extends E> c) {
  20. //调用 new HashMap<>(initialCapacity) 其中初始期望容量为 16 和 c 容量 / 默认 load factor 后 + 1的较大值
  21. map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
  22. addAll(c);
  23. }
  24. // 该方法为 default 访问权限,不允许使用者直接调用,目的是为了初始化 LinkedHashSet 时使用
  25. HashSet(int initialCapacity, float loadFactor, boolean dummy) {
  26. map = new LinkedHashMap<>(initialCapacity, loadFactor);
  27. }


通过 HashSet 的构造参数我们可以看出每个构造方法,都调用了对应的 HashMap 的构造方法用来初始化成员变量 map ,因此我们可以知道,HashSet 的初始容量也为 1<<4 即16,加载因子默认也是 0.75f。
add方法

  1. /**
  2. * Adds the specified element to this set if it is not already present.
  3. * More formally, adds the specified element <tt>e</tt> to this set if
  4. * this set contains no element <tt>e2</tt> such that
  5. * <tt>(e==null&nbsp;?&nbsp;e2==null&nbsp;:&nbsp;e.equals(e2))</tt>.
  6. * If this set already contains the element, the call leaves the set
  7. * unchanged and returns <tt>false</tt>.
  8. *
  9. * @param e element to be added to this set
  10. * @return <tt>true</tt> if this set did not already contain the specified
  11. * element
  12. */
  13. public boolean add(E e) {
  14. return map.put(e, PRESENT)==null;
  15. }

除了 add 方法外 HashSet 实现了 Set 接口中的其他方法这些方法有:

        return map.size();
}

public boolean isEmpty() {
   return map.isEmpty();
}

public boolean contains(Object o) {
   return map.containsKey(o);
}

//调用 remove(Object key)  方法去移除对应的键值对
public boolean remove(Object o) {
   return map.remove(o)==PRESENT;
}

public void clear() {
   map.clear();
}

// 返回一个 map.keySet 的 HashIterator 来作为 Set 的迭代器
public Iterator<E> iterator() {
   return map.keySet().iterator();
}

迭代器

//HashMap 中的迭代器

final class KeyIterator extends HashIterator
   implements Iterator<K> {
   public final K next() { return nextNode().key; }
}

final class ValueIterator extends HashIterator
   implements Iterator<V> {
   public final V next() { return nextNode().value; }
}

final class EntryIterator extends HashIterator
   implements Iterator<Map.Entry<K,V>> {
   public final Map.Entry<K,V> next() { return nextNode(); }
}