HashSet的整体架构
从 HashSet 的类注释可以得到如下信息:
- HashSet 底层实现基于 HashMap
add、remove、contanins、size 等方法的耗时性能,是不会随着数据量的增加而增加的
这个主要跟 HashMap 底层的数组数据结构有关,不管数据量多大,不考虑 hash 冲突的情 况下,时间复杂度都是 O (1)
HashSet 线程不安全,如果需要安全请自行加锁,或者使用 Collections.synchronizedSet
迭代过程中,如果数据结构被改变,会快速失败,会抛出 ConcurrentModificationException 异常
public class HashSet<E> extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable {
static final long serialVersionUID = -5024744406713321676L;
// 组合 HashMap,把它当作 HashSet 的一个属性
private transient HashMap<E,Object> map;
// 虚拟值,以关联一个对象在 map 的 value 值
// 简而言之,该值是 HashMap 中的 value
private static final Object PRESENT = new Object();
// 构造一个新的空 HashSet
// 底层 HashMap 实例具有默认的初始容量(16)和负载因子(0.75)
public HashSet() {
map = new HashMap<>();
}
// 构造包含指定集合中的元素的新 HashSet
// HashMap 实例是使用默认的负载因子(0.75)和足够包含指定集合中的元素的初始容量创建的
public HashSet(Collection<? extends E> c) {
// + 1 设计的非常巧妙,减少了一次 put 最后一个元素后的扩容操作
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
// 构造一个新的空 HashSet
// 底层的 HashMap 实例使用指定的初始容量和指定的负载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
// 构造一个新的空 HashSet
// 底层的 HashMap 实例使用指定的初始容量和默认的负载因子(0.75)
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
// 构造一个新的空 LinkedHashSet
// 这个私有构造器只被 LinkedHashSet 使用
// 底层的 LinkedHashMap 实例具有指定的初始容量和指定的负载因子
// dummy:忽略(将此构造器与其他 int、float 构造器区分开)
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
}