HashSet的整体架构

从 HashSet 的类注释可以得到如下信息:

  • HashSet 底层实现基于 HashMap
  • add、remove、contanins、size 等方法的耗时性能,是不会随着数据量的增加而增加的

    这个主要跟 HashMap 底层的数组数据结构有关,不管数据量多大,不考虑 hash 冲突的情 况下,时间复杂度都是 O (1)

  • HashSet 线程不安全,如果需要安全请自行加锁,或者使用 Collections.synchronizedSet

  • 迭代过程中,如果数据结构被改变,会快速失败,会抛出 ConcurrentModificationException 异常

    1. public class HashSet<E> extends AbstractSet<E>
    2. implements Set<E>, Cloneable, java.io.Serializable {
    3. static final long serialVersionUID = -5024744406713321676L;
    4. // 组合 HashMap,把它当作 HashSet 的一个属性
    5. private transient HashMap<E,Object> map;
    6. // 虚拟值,以关联一个对象在 map 的 value 值
    7. // 简而言之,该值是 HashMap 中的 value
    8. private static final Object PRESENT = new Object();
    9. // 构造一个新的空 HashSet
    10. // 底层 HashMap 实例具有默认的初始容量(16)和负载因子(0.75)
    11. public HashSet() {
    12. map = new HashMap<>();
    13. }
    14. // 构造包含指定集合中的元素的新 HashSet
    15. // HashMap 实例是使用默认的负载因子(0.75)和足够包含指定集合中的元素的初始容量创建的
    16. public HashSet(Collection<? extends E> c) {
    17. // + 1 设计的非常巧妙,减少了一次 put 最后一个元素后的扩容操作
    18. map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    19. addAll(c);
    20. }
    21. // 构造一个新的空 HashSet
    22. // 底层的 HashMap 实例使用指定的初始容量和指定的负载因子
    23. public HashSet(int initialCapacity, float loadFactor) {
    24. map = new HashMap<>(initialCapacity, loadFactor);
    25. }
    26. // 构造一个新的空 HashSet
    27. // 底层的 HashMap 实例使用指定的初始容量和默认的负载因子(0.75)
    28. public HashSet(int initialCapacity) {
    29. map = new HashMap<>(initialCapacity);
    30. }
    31. // 构造一个新的空 LinkedHashSet
    32. // 这个私有构造器只被 LinkedHashSet 使用
    33. // 底层的 LinkedHashMap 实例具有指定的初始容量和指定的负载因子
    34. // dummy:忽略(将此构造器与其他 int、float 构造器区分开)
    35. HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    36. map = new LinkedHashMap<>(initialCapacity, loadFactor);
    37. }
    38. }

HashSet的

HashSet的

HashSet的

HashSet的

HashSet的