HashMap的整体架构

HashMap 底层的数据结构主要是:数组 + 链表 + 红黑树。
当链表的长度 >= 8 时,链表会转化成红黑树,当红黑树的大小 <= 6 时,红黑树会转化成链表,整体的数据结构如下:
图片.png
图中左边竖着的是 HashMap 的数组结构,数组的元素可能是单个 Node,也可能是个链表,也可能是个红黑树。


从 HashMap 的类注释可以得到如下信息:

  • 允许 null 值
  • 不同于 HashTable,HashMap 是线程不安全的,我们可以在外部加锁,或者通过
    Collections.synchronizedMap() 来实现线程安全,它的实现是在每个方法上加上 synchronized 锁
  • load factor(负载因子)默认值是 0.75

    0.75 是均衡了时间和空间损耗算出来的值,较高的值会减少空间开销(扩容减少,数组长度增长速度变慢),但增加了查找成本(hash 冲突增加,链表长度变长),不扩容的条件:需要的数组大小 < 数组容量 * load factor

  • 如果有很多数据需要储存到 HashMap 中,建议 HashMap 的容量一开始就设置成足够的大小,这样可以防止在新增过程中不断的扩容,影响性能

  • 在迭代过程中,如果 HashMap 的结构被修改,会快速失败 (fast-fail)

HashMap的部分底层源码

  1. public class HashMap<K,V> extends AbstractMap<K,V>
  2. implements Map<K,V>, Cloneable, Serializable {
  3. private static final long serialVersionUID = 362498820763181265L;
  4. // 默认初始容量,必须是 2 的幂
  5. static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
  6. // 最大容量,如果任意一个带参数的构造函数隐式指定了更高的值,则使用该值
  7. // 必须是 2 的幂
  8. static final int MAXIMUM_CAPACITY = 1 << 30;
  9. // 在构造函数中没有指定负载因子时使用的默认值
  10. static final float DEFAULT_LOAD_FACTOR = 0.75f;
  11. // 对于一个桶,使用树而不是链表的节点数阈值
  12. // 当向具有至少这么多节点的桶中添加元素时,链表将被转换为树
  13. // 该值必须大于 2,并且应该至少为 8,以符合在移除树时关于收缩时转换回普通链表的假设
  14. // 简而言之,桶上的链表长度 >= 8 时,链表转化成红黑树(这只是条件之一)
  15. static final int TREEIFY_THRESHOLD = 8;
  16. // 在调整大小操作期间取消树化(拆分)结构的节点数阈值
  17. // 该值应该小于 TREEIFY_THRESHOLD,并且在去除时检测收缩最多6个网格
  18. // 简而言之,桶上的红黑树大小 <= 6 时,红黑树转化成链表
  19. static final int UNTREEIFY_THRESHOLD = 6;
  20. // 桶可以被树型化的最小数组容量。 (另外,如果一个桶中有太多节点,则会调整数组的大小)
  21. // 该值应该至少 4 * TREEIFY_THRESHOLD,以避免调整大小和树化阈值之间的冲突
  22. // 简而言之,当数组容量 >= 64 时,链表才会转化成红黑树(这只是条件之一)
  23. static final int MIN_TREEIFY_CAPACITY = 64;
  24. // 链表的节点
  25. static class Node<K,V> implements Map.Entry<K,V> {
  26. final int hash;
  27. final K key;
  28. V value;
  29. Node<K,V> next;
  30. Node(int hash, K key, V value, Node<K,V> next) {
  31. this.hash = hash;
  32. this.key = key;
  33. this.value = value;
  34. this.next = next;
  35. }
  36. public final K getKey() { return key; }
  37. public final V getValue() { return value; }
  38. public final String toString() { return key + "=" + value; }
  39. public final int hashCode() {
  40. return Objects.hashCode(key) ^ Objects.hashCode(value);
  41. }
  42. public final V setValue(V newValue) {
  43. V oldValue = value;
  44. value = newValue;
  45. return oldValue;
  46. }
  47. public final boolean equals(Object o) {
  48. if (o == this)
  49. return true;
  50. if (o instanceof Map.Entry) {
  51. Map.Entry<?,?> e = (Map.Entry<?,?>)o;
  52. if (Objects.equals(key, e.getKey()) &&
  53. Objects.equals(value, e.getValue()))
  54. return true;
  55. }
  56. return false;
  57. }
  58. }
  59. /* ---------------- Fields -------------- */
  60. // 存放数据的数组
  61. // 数组在第一次使用时初始化,并根据需要调整大小
  62. // 在分配时,长度总是2的幂,我们也在某些操作中允许长度为零,以允许当前不需要的自举机制
  63. transient Node<K,V>[] table;
  64. // 保存缓存了的 entrySet
  65. // 注意 AbstractMap 字段用于 keySet() 和 values()
  66. transient Set<Map.Entry<K,V>> entrySet;
  67. // 此 HashMap 中包含的键值映射的数量
  68. // 可能不准(因为当你拿到这个值的时候,可能又发生了变化)
  69. transient int size;
  70. // 结构修改是指:改变 HashMap 中映射的数量或以其他方式修改其内部结构(例如,rehash)
  71. // 该字段用于使 HashMap 的集合视图上的迭代器快速失败 (见ConcurrentModificationException)
  72. transient int modCount;
  73. // 下一个要调整大小的大小值(容量 * 负载因子)
  74. // javadoc的描述在序列化时是 true
  75. // 如果表数组还没有被分配,这个字段保存初始数组容量,或者零表示 DEFAULT_INITIAL_CAPACITY
  76. // 扩容的门槛,有两种情况
  77. // 如果初始化时,给定数组大小的话,通过 tableSizeFor 方法计算,数组大小永远接近于 2 的幂
  78. // 如果是通过 resize 方法进行扩容,大小 = 数组容量 * 0.75
  79. // 简而言之,当 HashMap 中键值对的数量(size) > threshold时,执行 resize() 扩容
  80. int threshold;
  81. // HashMap 的负载因子
  82. final float loadFactor;
  83. /* ---------------- Public operations -------------- */
  84. // 构造一个具有指定初始容量和负载因子的空 HashMap
  85. public HashMap(int initialCapacity, float loadFactor) {
  86. if (initialCapacity < 0)
  87. throw new IllegalArgumentException("Illegal initial capacity: " +
  88. initialCapacity);
  89. if (initialCapacity > MAXIMUM_CAPACITY)
  90. initialCapacity = MAXIMUM_CAPACITY;
  91. if (loadFactor <= 0 || Float.isNaN(loadFactor))
  92. throw new IllegalArgumentException("Illegal load factor: " +
  93. loadFactor);
  94. this.loadFactor = loadFactor;
  95. this.threshold = tableSizeFor(initialCapacity);
  96. }
  97. // 构造一个具有指定初始容量和负载因子为默认值(0.75)的空 HashMap
  98. public HashMap(int initialCapacity) {
  99. this(initialCapacity, DEFAULT_LOAD_FACTOR);
  100. }
  101. // 构造一个初始容量为默认值(16),负载因子为默认值(0.75)的空 HashMap
  102. public HashMap() {
  103. // all other fields defaulted
  104. // 所有其他字段均为默认值
  105. this.loadFactor = DEFAULT_LOAD_FACTOR;
  106. }
  107. // 构造一个负载因子为默认值(0.75),足够的初始容量保存指定 Map 的 HashMap
  108. public HashMap(Map<? extends K, ? extends V> m) {
  109. this.loadFactor = DEFAULT_LOAD_FACTOR;
  110. putMapEntries(m, false);
  111. }
  112. }

HashMap的新增

新增 key,value 大概的步骤示意图如下:
图片.png
put() 的底层源码实现如下:

  1. // 将指定值与此映射中的指定键关联
  2. // 如果之前的映射包含键的映射,那么旧的值将被替换
  3. public V put(K key, V value) {
  4. return putVal(hash(key), key, value, false, true);
  5. }
  6. // onlyIfAbsent:如果为true,则 key 存在时不更改原有值
  7. // 如果 HashMap 中已经存在 key 的映射,但不想覆盖 value,可以选择 putIfAbsent()
  8. // putIfAbsent() 调用 putVal() 时 onlyIfAbsent 为 true
  9. // evict:如果为 false 则表示 HashMap 处于创建模式
  10. // 返回旧值,如果没有则返回 null
  11. final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
  12. // tab 的引用指向 table 数组(HashMap 中存放数据的数组)
  13. Node<K,V>[] tab;
  14. // p 为 i 下标位置的 Node 值
  15. Node<K,V> p;
  16. // n 表示数组的长度,i 为数组索引下标
  17. int n, i;
  18. // 如果数组为空,使用 resize() 初始化
  19. if ((tab = table) == null || (n = tab.length) == 0)
  20. n = (tab = resize()).length;
  21. // 如果当前索引位置是空的(桶中无节点),直接生成新的节点在当前索引位置上
  22. if ((p = tab[i = (n - 1) & hash]) == null)
  23. // newNode() {return new Node<>(hash, key, value, next);}
  24. tab[i] = newNode(hash, key, value, null);
  25. // 如果桶中有节点,解决 hash 冲突
  26. else {
  27. // e 为当前节点的临时变量
  28. // 如果 HashMap 中原本存在此 key 的映射,最终 e 为此 Node,否则为 null
  29. Node<K,V> e; K k;
  30. // 如果 key 的 hash 和值都和 p 的相等,即 HashMap 中原本存在此 key 的映射
  31. // 直接把当前下标位置的 Node 值赋值给临时变量
  32. if (p.hash == hash &&
  33. ((k = p.key) == key || (key != null && key.equals(k))))
  34. e = p;
  35. // 如果桶中结构为红黑树,则使用红黑树方式新增
  36. else if (p instanceof TreeNode)
  37. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
  38. // 如果桶中结构为普通链表,则把新节点放到链表的尾端
  39. else {
  40. for (int binCount = 0; ; ++binCount) {
  41. // p.next == null 表明 p 是链表的尾节点
  42. if ((e = p.next) == null) {
  43. // newNode() {return new Node<>(hash, key, value, next);}
  44. p.next = newNode(hash, key, value, null);
  45. // 当链表的长度 >= 8 时,链表转红黑树
  46. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  47. treeifyBin(tab, hash);
  48. break;
  49. }
  50. // 链表遍历过程中,发现 HashMap 中原本存在此 key 的映射
  51. if (e.hash == hash &&
  52. ((k = e.key) == key || (key != null && key.equals(k))))
  53. break;
  54. // 更改循环的当前元素,使 p 在遍历过程中,一直往后移动
  55. p = e;
  56. }
  57. }
  58. // 如果 e != null 说明 HashMap 中原本存在此 key 的映射
  59. if (e != null) { // existing mapping for key
  60. V oldValue = e.value;
  61. // 当 onlyIfAbsent 为 false 时,才会覆盖值
  62. if (!onlyIfAbsent || oldValue == null)
  63. e.value = value;
  64. // 回调函数,允许 LinkedHashMap 后置操作
  65. // HashMap 中,此方法为抽象方法;
  66. // LinkedHashMap 中,如果 accessOrder == true ,此方法将当前节点移动到链表尾部
  67. afterNodeAccess(e);
  68. // 返回老值
  69. return oldValue;
  70. }
  71. }
  72. ++modCount;
  73. // 如果 HashMap 的实际大小 > 扩容的门槛,开始扩容
  74. if (++size > threshold)
  75. resize();
  76. // 回调函数,允许 LinkedHashMap 后置操作
  77. // HashMap 中,此方法为抽象方法;
  78. // LinkedHashMap 中,如果 accessOrder == true ,此方法可能会删除头节点(满足一定条件)
  79. afterNodeInsertion(evict);
  80. return null;
  81. }
  82. // 初始化或双倍扩容
  83. // 如果数组为空,则按照字段 threshold 中持有的初始容量目标分配
  84. // 否则,因为我们使用的是 2 的幂展开,所以每个桶中的元素必须保持在相同的索引,或者在新表中以2的偏移量幂移动。
  85. // 该方法最终将成员属性 table,threshold 更新,并返回更新后的 table
  86. final Node<K,V>[] resize() {
  87. // oldTab 负责持有旧数组对象 table
  88. Node<K,V>[] oldTab = table;
  89. // oldCap 负责持有旧数组的大小(容量)
  90. int oldCap = (oldTab == null) ? 0 : oldTab.length;
  91. // oldThr 负责持有旧的扩容阈值 threshold
  92. int oldThr = threshold;
  93. // newCap 负责保存新数组的容量
  94. // newThr 负责保存新数组的扩容阈值
  95. int newCap, newThr = 0;
  96. if (oldCap > 0) {
  97. // 老数组大小 >= 最大容量(1 << 30),则不扩容,并设置下一个要调整大小的大小值
  98. if (oldCap >= MAXIMUM_CAPACITY) {
  99. threshold = Integer.MAX_VALUE;
  100. return oldTab;
  101. }
  102. else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
  103. oldCap >= DEFAULT_INITIAL_CAPACITY)
  104. newThr = oldThr << 1; // double threshold
  105. }
  106. // 将容量大小扩为 threshold 的值,具体的扩容逻辑在下面代码
  107. // 有参构造时,oldCap == 0,不执行上面 if 逻辑,且 threshold > 0,
  108. // 所有只有有参构造初始化扩容时执行此 else if 逻辑
  109. else if (oldThr > 0) // initial capacity was placed in threshold
  110. newCap = oldThr;
  111. // 无参构造只设置了 loadFactor 为默认值(0.75),threshold 取 int 的默认值 0
  112. // 无参构造时,oldCap = 0,所以:无参构造初始化扩容时执行此 else 逻辑代码
  113. else {
  114. // zero initial threshold signifies using defaults
  115. // 零初始阈值表示使用默认值
  116. newCap = DEFAULT_INITIAL_CAPACITY;
  117. newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
  118. }
  119. if (newThr == 0) {
  120. float ft = (float)newCap * loadFactor;
  121. newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
  122. (int)ft : Integer.MAX_VALUE);
  123. }
  124. threshold = newThr;
  125. @SuppressWarnings({"rawtypes","unchecked"})
  126. Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
  127. table = newTab;
  128. if (oldTab != null) {
  129. for (int j = 0; j < oldCap; ++j) {
  130. Node<K,V> e;
  131. if ((e = oldTab[j]) != null) {
  132. // 将数组对象置空,让 GC 进行垃圾回收
  133. oldTab[j] = null;
  134. // 桶中只有一个值,直接计算索引位置赋值
  135. if (e.next == null)
  136. newTab[e.hash & (newCap - 1)] = e;
  137. // 桶中结构为红黑树
  138. else if (e instanceof TreeNode)
  139. ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
  140. // 桶中结构为普通链表
  141. else { // preserve order
  142. // 维持秩序
  143. // loHead 表示老值,老值的意思是:扩容后该链表中计算出索引位置不变的元素
  144. // hiHead 表示新值,新值的意思是:扩容后计算出索引位置发生变化的元素
  145. Node<K,V> loHead = null, loTail = null;
  146. Node<K,V> hiHead = null, hiTail = null;
  147. Node<K,V> next;
  148. // 规避了 Java8 版本以下的成环问题
  149. // java7 是在 while 循环里面,单个计算好数组索引位置后,单个的插入数组中,在多线程情况下,会有成环问题
  150. // java8 是等链表整个 while 循环结束后,才给数组赋值,所以多线程情况下,也不会成环
  151. do {
  152. next = e.next;
  153. if ((e.hash & oldCap) == 0) {
  154. if (loTail == null)
  155. loHead = e;
  156. else
  157. loTail.next = e;
  158. loTail = e;
  159. }
  160. else {
  161. if (hiTail == null)
  162. hiHead = e;
  163. else
  164. hiTail.next = e;
  165. hiTail = e;
  166. }
  167. } while ((e = next) != null);
  168. if (loTail != null) {
  169. loTail.next = null;
  170. newTab[j] = loHead;
  171. }
  172. if (hiTail != null) {
  173. hiTail.next = null;
  174. newTab[j + oldCap] = hiHead;
  175. }
  176. }
  177. }
  178. }
  179. }
  180. return newTab;
  181. }

红黑树新增节点过程

  1. 首先判断新增的节点在红黑树上是不是已经存在,判断手段有如下两种
    如果节点没有实现 Comparable 接口,使用 equals 进行判断
    如果节点自己实现了 Comparable 接口,使用 compareTo 进行判断
  2. 新增的节点如果已经在红黑树上,直接返回;不在的话,判断新增节点是在当前节点的左边
    还是右边,左边值小,右边值大
  3. 自旋递归 1 和 2 步,直到当前节点的左边或者右边的节点为空时,停止自旋,当前节点即为
    我们新增节点的父节点
  4. 把新增节点放到当前节点的左边或右边为空的地方,并于当前节点建立父子节点关系
  5. 进行着色和旋转,结束

putTreeVal() 的底层源码实现如下:

  1. // 红黑树新增节点
  2. // tab:HashMap 中存放数据的数组
  3. // h:key 的 hash 值
  4. final TreeNode<K,V> putTreeVal(HashMap<K,V> map, Node<K,V>[] tab,
  5. int h, K k, V v) {
  6. Class<?> kc = null;
  7. boolean searched = false;
  8. // 找到根节点
  9. TreeNode<K,V> root = (parent != null) ? root() : this;
  10. // 自旋
  11. for (TreeNode<K,V> p = root;;) {
  12. int dir, ph; K pk;
  13. if ((ph = p.hash) > h)
  14. dir = -1;
  15. else if (ph < h)
  16. dir = 1;
  17. else if ((pk = p.key) == k || (k != null && k.equals(pk)))
  18. return p;
  19. else if ((kc == null &&
  20. (kc = comparableClassFor(k)) == null) ||
  21. (dir = compareComparables(kc, k, pk)) == 0) {
  22. if (!searched) {
  23. TreeNode<K,V> q, ch;
  24. searched = true;
  25. if (((ch = p.left) != null &&
  26. (q = ch.find(h, k, kc)) != null) ||
  27. ((ch = p.right) != null &&
  28. (q = ch.find(h, k, kc)) != null))
  29. return q;
  30. }
  31. dir = tieBreakOrder(k, pk);
  32. }
  33. TreeNode<K,V> xp = p;
  34. if ((p = (dir <= 0) ? p.left : p.right) == null) {
  35. Node<K,V> xpn = xp.next;
  36. TreeNode<K,V> x = map.newTreeNode(h, k, v, xpn);
  37. if (dir <= 0)
  38. xp.left = x;
  39. else
  40. xp.right = x;
  41. xp.next = x;
  42. x.parent = x.prev = xp;
  43. if (xpn != null)
  44. ((TreeNode<K,V>)xpn).prev = x;
  45. moveRootToFront(tab, balanceInsertion(root, x));
  46. return null;
  47. }
  48. }
  49. }

HashMap的查找

HashMap 的查找主要分为以下三步:

  • 根据 hash 算法定位数组的索引位置,equals 判断当前节点是否是要查找的 key,是的话直接返回,否则进行第二步
  • 判断当前节点有无 next 节点,有的话判断是链表类型,还是红黑树类型
  • 分别走链表和红黑树不同类型的查找方法 ```java // 返回指定键映射到的值,如果该映射不包含此键的映射,则返回 null // 返回 null 并不一定表示不包含此键的映射,也有可能此键映射到 null // 可用 containsKey() 操作区分以上两种情况 public V get(Object key) { Node e; return (e = getNode(hash(key), key)) == null ? null : e.value; }

@Override // 如果 key 对应的值不存在,返回期望的默认值 defaultValue public V getOrDefault(Object key, V defaultValue) { Node e; return (e = getNode(hash(key), key)) == null ? defaultValue : e.value; }

final Node getNode(int hash, Object key) { Node[] tab; Node first, e; int n; K k; // 如果数组不为空 && hash 算出来的索引下标有值 if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { // 如果 hash 值和 key 都相等,则直接返回 if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k)))) return first; // 如果 hash 值不等,看当前节点的 next 是否有值 if ((e = first.next) != null) { // 使用红黑树的查找 if (first instanceof TreeNode) return ((TreeNode)first).getTreeNode(hash, key); do { // 如果 hash 值和 key 都相等,则直接返回当前节点 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; // 否则,把当前节点的下一个节点拿出来继续查找 } while ((e = e.next) != null); } } return null; }

  1. ---
  2. 红黑树查找的思路:
  3. 1. 从根节点递归查找
  4. 1. 根据 hashcode,比较查找节点,左边节点,右边节点之间的大小,根本红黑树左小右大的特性进行判断
  5. 1. 判断查找节点在第 2 步有无定位节点位置,有的话返回,没有的话重复 23 两步
  6. 1. 一直自旋到定位到节点位置为止
  7. 如果红黑树比较平衡的话,每次查找的次数就是树的深度
  8. <a name="J08qi"></a>
  9. # HashMap的删除
  10. ```java
  11. public V remove(Object key) {
  12. Node<K,V> e;
  13. return (e = removeNode(hash(key), key, null, false, true)) == null ?
  14. null : e.value;
  15. }
  16. final Node<K,V> removeNode(int hash, Object key, Object value,
  17. boolean matchValue, boolean movable) {
  18. Node<K,V>[] tab; Node<K,V> p; int n, index;
  19. if ((tab = table) != null && (n = tab.length) > 0 &&
  20. (p = tab[index = (n - 1) & hash]) != null) {
  21. Node<K,V> node = null, e; K k; V v;
  22. if (p.hash == hash &&
  23. ((k = p.key) == key || (key != null && key.equals(k))))
  24. node = p;
  25. else if ((e = p.next) != null) {
  26. if (p instanceof TreeNode)
  27. node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
  28. else {
  29. do {
  30. if (e.hash == hash &&
  31. ((k = e.key) == key ||
  32. (key != null && key.equals(k)))) {
  33. node = e;
  34. break;
  35. }
  36. p = e;
  37. } while ((e = e.next) != null);
  38. }
  39. }
  40. if (node != null && (!matchValue || (v = node.value) == value ||
  41. (value != null && value.equals(v)))) {
  42. if (node instanceof TreeNode)
  43. ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
  44. else if (node == p)
  45. tab[index] = node.next;
  46. else
  47. p.next = node.next;
  48. ++modCount;
  49. --size;
  50. afterNodeRemoval(node);
  51. return node;
  52. }
  53. }
  54. return null;
  55. }

HashMap的迭代器

Map 对 key、value 和 entity(节点) 都提供了迭代的方法,假设我们需要迭代 entity,就可使用 HashMap.entrySet().iterator(); 直接返回 HashIterator。
HashMap 的迭代器源码实现如下:

  1. abstract class HashIterator {
  2. // 下一个要返回的节点
  3. Node<K,V> next; // next entry to return
  4. // 当前节点,用于 remove()
  5. Node<K,V> current; // current entry
  6. // 期待的版本号
  7. int expectedModCount; // for fast-fail
  8. // 当前槽
  9. int index; // current slot
  10. HashIterator() {
  11. expectedModCount = modCount;
  12. Node<K,V>[] t = table;
  13. current = next = null;
  14. index = 0;
  15. // 将成员属性 next 指向第一个节点
  16. if (t != null && size > 0) { // advance to first entry
  17. do {} while (index < t.length && (next = t[index++]) == null);
  18. }
  19. }
  20. public final boolean hasNext() {
  21. return next != null;
  22. }
  23. final Node<K,V> nextNode() {
  24. Node<K,V>[] t;
  25. Node<K,V> e = next;
  26. // 如果存在并发修改,则抛出 ConcurrentModificationException
  27. if (modCount != expectedModCount)
  28. throw new ConcurrentModificationException();
  29. if (e == null)
  30. throw new NoSuchElementException();
  31. // 将成员属性 next 指向下一个节点
  32. // 如果 e.next 为 null,代表槽中只有一个节点 || 节点 e 为槽中最后一个节点
  33. if ((next = (current = e).next) == null && (t = table) != null) {
  34. // 成员属性 next 指向下一个槽中的第一个节点
  35. do {} while (index < t.length && (next = t[index++]) == null);
  36. }
  37. return e;
  38. }
  39. // 移除当前节点
  40. public final void remove() {
  41. Node<K,V> p = current;
  42. if (p == null)
  43. throw new IllegalStateException();
  44. // 如果存在并发修改,则抛出 ConcurrentModificationException
  45. if (modCount != expectedModCount)
  46. throw new ConcurrentModificationException();
  47. // 将当前节点置为 null
  48. current = null;
  49. K key = p.key;
  50. removeNode(hash(key), key, null, false, false);
  51. expectedModCount = modCount;
  52. }
  53. }
  54. final class KeyIterator extends HashIterator
  55. implements Iterator<K> {
  56. public final K next() { return nextNode().key; }
  57. }
  58. final class ValueIterator extends HashIterator
  59. implements Iterator<V> {
  60. public final V next() { return nextNode().value; }
  61. }
  62. final class EntryIterator extends HashIterator
  63. implements Iterator<Map.Entry<K,V>> {
  64. public final Map.Entry<K,V> next() { return nextNode(); }
  65. }


HashMap的常见问题

说一下你对 HashMap 的了解

底层数据结构
HashMap 在 Java7 及之前版本底层数据结构是:数组 + 链表。
HashMap 在 Java8 及之后版本底层数据结构是:数组 + 链表 + 红黑树。


构造器相关
HashMap 的构造器的代码逻辑就是:给成员属性 loadFactor、threshold 赋值。
HashMap 和 ArrayList 类似,都是在第一次 add 时,才会执行初始化扩容操作。


hash算法、hash冲突解决、扩容、链表转化为红黑树

说一下HashMap底层数据结构

:HashMap 底层是数组 + 链表 + 红黑树的数据结构,数组的主要作用是方便快速查找,时间复杂度是 O(1),数组默认大小是 16,数组的下标索引是通过 key 的 hashcode 计算出来的,数组元素叫做 Node,当多个 key 的 hashcode 一致,但 key 值不同时,单个 Node 就会转化成链表,链表的查询复杂度是 O(n),当链表的长度 >= 8 并且数组的大小 > 64 时,链表就会转化成红黑树,红黑树的查询复杂度是 O(log(n)),简单来说,最坏的查询次数相当于红黑树的最大深度。

说一下HashMap的初始容量问题

不论传入的是否是 2 的幂次方,最终都会转化为 2 的幂次方。

说一下HashMap的hash算法

Map的综合知识

说一下HashMap中hash冲突时怎么办

:hash 冲突指的是 key 值的 hashcode 计算相同,但 key 值不同的情况。
如果桶中元素原本只有一个或已经是链表了,新增元素直接追加到链表尾部;
如果桶中元素是链表,并且链表个数 >= 8 时,此时有两种情况:

  • 如果数组大小 < 64,数组再次扩容,链表不转化成红黑树
  • 如果数组大小 >= 64 时,链表就会转化成红黑树

    这里不仅判断链表个数 >= 8,还判断了数组大小,数组容量 < 64 没有立即转化的原因,猜测主要是因为: 红黑树占用的空间比链表大很多,转化也比较耗时,所以数组容量小的情况下冲突严重,先尝试扩容,看能否通过扩容来解决冲突严重的问题

说一下HashMap是如何扩容的

答:扩容的时机
put 时,发现数组为空,进行初始化扩容

  • 若在构造器中指定了初始容量, threshold = 指定初始容量; 则扩容为指定容量,且新threshold = 负载因子 * 指定初始容量 (初始化时,会通过一个函数保证 throeshold一定为 2 次幂)
  • 若在构造器中未指定初始容量,则 threshold = 0;(基本数据类型的默认值) 默认扩容大小为 16,且 新threshold = 0.75 * 16

put 成功后,发现现有数组大小 (size) > 扩容的门槛时 (threshold),进行扩容,扩容为旧数组大小的 2 倍,且 新threshold = 旧threshold << 1
新数组初始化之后,需要将老数组的值拷贝到新数组上,链表和红黑树都有自己拷贝的方法。

链表个数 >= 8 时,链表要转化成红黑树的原因

这个问题的答案在源码注释中有说明

TREEIFY_THRESHOLD == 8 ,而不是更大或者更小的原因
在链表数据不多的时候,使用链表进行遍历也比较快,只有当链表数据比较多的时候,才会转化成红黑树,但红黑树需要占用的空间是链表的 2 倍,考虑到转化时间和空间损耗,所以我们需要定义出一个较大的转化的边界值。
在考虑设计 8 这个值时,我们参考了泊松分布概率函数,由泊松分布中得出结论,链表各个长度的命中概率为:

1: 0.30326533 2: 0.07581633 3: 0.01263606
4: 0.00157952 5: 0.00015795 6: 0.00001316
7: 0.00000094 8: 0.00000006

意思是,当链表的长度是 8 的时候,出现的概率是 0.00000006,不到千万分之一,大概为 HashMap - 图3
如果 TREEIFY_THRESHOLD 设置更大的话,满足链表转化成红黑树的概率更低,几乎不存在转化情况,那么设置 链表转化红黑树的逻辑代码就没有意义了。


链表转化成红黑树的原因
当链表个数太多,遍历可能比较耗时,转化成红黑树,可以使遍历的时间复杂度降低。
链表查询的时间复杂度是 O (n),红黑树的查询复杂度是 O (log (n))。
但转化成红黑树,有空间和转化耗时的成本,我们通过泊松分布公式计算,正常情况下链表个数出现 8 的概率不到千万分之一,所以说正常情况下,链表的长度几乎不可能达到 8 ,而一旦到达 8 时,很有可能是 hash 算法出了问题,为了在这种情况下,让 HashMap 仍然有较高的查询性能,所以让链表转化成红黑树。


延伸问题:红黑树什么时候转变成链表
:当节点的个数 <= 6 时,红黑树会自动转化成链表,主要还是考虑红黑树的空间成本问题,当节点个数 <= 6 时,遍历链表也很快,所以红黑树会重新变成链表。

HashMap的死循环问题

在 JDK7 上 HashMap 数据迁移时,会导致结点翻转,多线程操作时,可能会引发死循环 在 JDK8 上修改了数据迁移的算法,保证数据的顺便,不会出现死循环问题

Java7 及之前版本的 HashMap 采用的是头插法,即解决 hash 冲突时,将新节点作为头节点。
Java8 及之后版本的 HashMap 采用的是尾插法,即解决 hash 冲突时,将新节点作为尾结点。
Java7 及之前版本的 HashMap 被多个线程同时操作可能存在死循环的问题


Java7 的 put() 源码实现如下:

  1. public V put(K key, V value) {
  2. if (key == null)
  3. return putForNullKey(value);
  4. // 算 Hash 值
  5. int hash = hash(key);
  6. // 确定数组索引位置
  7. int i = indexFor(hash, table.length);
  8. // 如果该 HashMap 中存在该 key 的映射,则替换旧的 value
  9. for (Entry<K,V> e = table[i]; e != null; e = e.next) {
  10. Object k;
  11. if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
  12. V oldValue = e.value;
  13. e.value = value;
  14. e.recordAccess(this);
  15. return oldValue;
  16. }
  17. }
  18. modCount++;
  19. // 如果该 HashMap中不存在该 key 的映射,则新增一个节点
  20. addEntry(hash, key, value, i);
  21. return null;
  22. }
  23. // 将具有指定键、值和哈希码的新项添加到指定的存储桶中
  24. // 如果合适的话,该方法负责调整表的大小
  25. // 子类重写该方法以更改put方法的行为
  26. void addEntry(int hash, K key, V value, int bucketIndex) {
  27. if ((size >= threshold) && (null != table[bucketIndex])) {
  28. resize(2 * table.length);
  29. hash = (null != key) ? hash(key) : 0;
  30. bucketIndex = indexFor(hash, table.length);
  31. }
  32. createEntry(hash, key, value, bucketIndex);
  33. }
  34. // 将该 HashMap 重新散列到具有更大容量的新数组中
  35. // 当 HashMap 中的键数达到其阈值时,将自动调用此方法
  36. // 如果当前容量为 MAXIMUM_CAPACITY,则不调整 HashMap 的大小,而是将阈值设置为 Integer.MAX_VALUE
  37. void resize(int newCapacity) {
  38. Entry[] oldTable = table;
  39. int oldCapacity = oldTable.length;
  40. if (oldCapacity == MAXIMUM_CAPACITY) {
  41. threshold = Integer.MAX_VALUE;
  42. return;
  43. }
  44. Entry[] newTable = new Entry[newCapacity];
  45. boolean oldAltHashing = useAltHashing;
  46. useAltHashing |= sun.misc.VM.isBooted() &&
  47. (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
  48. boolean rehash = oldAltHashing ^ useAltHashing;
  49. transfer(newTable, rehash);
  50. table = newTable;
  51. threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  52. }
  53. // 将所有 Entry 从当前表转移到 newTable
  54. void transfer(Entry[] newTable, boolean rehash) {
  55. int newCapacity = newTable.length;
  56. for (Entry<K,V> e : table) {
  57. while(null != e) {
  58. Entry<K,V> next = e.next;
  59. if (rehash) {
  60. e.hash = null == e.key ? 0 : hash(e.key);
  61. }
  62. // 死循环问题就出现在下面这四行代码上
  63. int i = indexFor(e.hash, newCapacity);
  64. e.next = newTable[i];
  65. newTable[i] = e;
  66. e = next;
  67. }
  68. }
  69. }

发生死循环情况(只要转移后 e2 和 next2 又进到了同一个桶里,就):
当两个线程 t1、t2 同时进行 put() 操作,有可能出现两个线程都进行 resize() 扩容操作,当两个线程同时走到了 transfer() 后。


假设:线程 t2 执行到 transfer() 循环中的 Entry<K,V> next = e.next; 然后被调度挂起,接着线程 t1 完成 transfer() 转移操作。
此时 t2 被挂起后 table 情形如左下图所示,t1 完成 transfer() 转移操作后情形如右下图所示(只要转移后 e2 和 next2 又进到了同一个桶里,就一定会发生死循环):
图片.png 图片.png


t2 被调度回来继续执行 e.next = newTable[i]; 后,此时线程 t1、t2 情形如左下图所示,执行 e = next;后,情形如右下图所示:
图片.png 图片.png


进行第二轮循环后,情形如下图所示:
图片.png


当第三轮循环执行到 e.next = newTable[i];,情形如下图所示(链表已经形成环状):
图片.png