资料来源:https://www.bilibili.com/video/BV1A741127DP?p=2

1、HashMap存取值的原理

1.1 存值分析

  • jdk1.7存值分析 ```java public V put(K key, V value) { //HashMap允许存储null键,存储在数组的0索引位置 if (key == null)

    1. return putForNullKey(value);

    //内部通过一个扰乱算法获得一个hash值,用于计算数组索引 int hash = hash(key); //计算数组索引 int i = indexFor(hash, table.length); //判断是否是重复键 for (Entry e = table[i]; e != null; e = e.next) {

    1. Object k;
    2. if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
    3. V oldValue = e.value;
    4. e.value = value;
    5. e.recordAccess(this);
    6. return oldValue;
    7. }

    }

    modCount++; //添加元素 addEntry(hash, key, value, i); return null; }

void addEntry(int hash, K key, V value, int bucketIndex) { //元素个数大于阈值,同时当前索引位有值,就会执行扩容操作 if ((size >= threshold) && (null != table[bucketIndex])) { //2倍扩容 resize(2 * table.length); hash = (null != key) ? hash(key) : 0; //重新计算索引位置 bucketIndex = indexFor(hash, table.length); } //基于键值创建Entry节点,并以头插法存入对应位置 createEntry(hash, key, value, bucketIndex); }

  1. - jdk1.8存值分析
  2. ```java
  3. public V put(K key, V value) {
  4. //hash(key)计算hash值,用于计算索引
  5. return putVal(hash(key), key, value, false, true);
  6. }
  7. final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
  8. boolean evict) {
  9. Node<K,V>[] tab; Node<K,V> p; int n, i;
  10. //完成初始化容器
  11. if ((tab = table) == null || (n = tab.length) == 0)
  12. n = (tab = resize()).length;
  13. //得到的索引位没有元素,直接存入
  14. if ((p = tab[i = (n - 1) & hash]) == null)
  15. tab[i] = newNode(hash, key, value, null);
  16. else {
  17. //索引位有元素
  18. Node<K,V> e; K k;
  19. //重复键
  20. if (p.hash == hash &&
  21. ((k = p.key) == key || (key != null && key.equals(k))))
  22. e = p;
  23. //红黑树节点
  24. else if (p instanceof TreeNode)
  25. //入树
  26. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
  27. else {
  28. //遍历链表依次比较键
  29. for (int binCount = 0; ; ++binCount) {
  30. //没有重复键
  31. if ((e = p.next) == null) {
  32. //尾插法,添加元素,形成单向链表
  33. p.next = newNode(hash, key, value, null);
  34. //树化
  35. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  36. treeifyBin(tab, hash);
  37. break;
  38. }
  39. //有重复键
  40. if (e.hash == hash &&
  41. ((k = e.key) == key || (key != null && key.equals(k))))
  42. break;
  43. p = e;
  44. }
  45. }
  46. if (e != null) { // existing mapping for key
  47. V oldValue = e.value;
  48. //键重复,更新值
  49. if (!onlyIfAbsent || oldValue == null)
  50. e.value = value;
  51. afterNodeAccess(e);
  52. return oldValue;
  53. }
  54. }
  55. ++modCount;
  56. //容量超过阈值,扩容
  57. if (++size > threshold)
  58. resize();
  59. afterNodeInsertion(evict);
  60. return null;
  61. }

1.2 取值分析

  • jdk1.7取值 ```java public V get(Object key) { //取空键对应的值 if (key == null)

    1. return getForNullKey();

    //取非空键对应的值 Entry entry = getEntry(key);

    return null == entry ? null : entry.getValue(); }

final Entry getEntry(Object key) { int hash = (key == null) ? 0 : hash(key); //遍历链表获取值 for (Entry e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } return null; }

  1. - jdk1.8取值分析
  2. ```java
  3. public V get(Object key) {
  4. Node<K,V> e;
  5. return (e = getNode(hash(key), key)) == null ? null : e.value;
  6. }
  7. final Node<K,V> getNode(int hash, Object key) {
  8. Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
  9. if ((tab = table) != null && (n = tab.length) > 0 &&
  10. (first = tab[(n - 1) & hash]) != null) {
  11. //检查头部元素是否是要找的元素
  12. if (first.hash == hash && // always check first node
  13. ((k = first.key) == key || (key != null && key.equals(k))))
  14. return first;
  15. if ((e = first.next) != null) {
  16. //红黑树查找
  17. if (first instanceof TreeNode)
  18. return ((TreeNode<K,V>)first).getTreeNode(hash, key);
  19. do {
  20. //链表查找
  21. if (e.hash == hash &&
  22. ((k = e.key) == key || (key != null && key.equals(k))))
  23. return e;
  24. } while ((e = e.next) != null);
  25. }
  26. }
  27. return null;
  28. }

2、HashMap如何防止碰撞

image.png
image.png
image.png
解决hash碰撞的方式有很多,比如开放地址法,重哈希,链地址法,公共溢出区等等。
HashMap中防止碰撞的方式主要有两个:哈希值扰动 + 链地址法(当扰动后,还是hash碰撞,使用链表/红黑树存储元素)

  • jdk1.7扰动 ```java final int hash(Object k) { int h = 0; h ^= k.hashCode(); // 充分利用高低位 h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); }

01100011 00001110 11000110 00011001 00000000 01101010 11001100 00011001

  1. - jdk1.8扰动
  2. ```java
  3. static final int hash(Object key) {
  4. int h;
  5. // 充分利用高低位
  6. return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
  7. }

3、HashMap容量取值问题

  • jdk1.7默认容量

    1. public HashMap() {
    2. //默认容量16
    3. this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    4. }
  • jdk1.7自定义容量

    1. public HashMap(int initialCapacity) {
    2. this(initialCapacity, DEFAULT_LOAD_FACTOR);
    3. }
    1. public HashMap(int initialCapacity, float loadFactor) {
    2. if (initialCapacity < 0)
    3. throw new IllegalArgumentException("Illegal initial capacity: " +
    4. initialCapacity);
    5. //超过最大容纳量,取最大容量
    6. if (initialCapacity > MAXIMUM_CAPACITY)
    7. initialCapacity = MAXIMUM_CAPACITY;
    8. //负载因子容错处理
    9. if (loadFactor <= 0 || Float.isNaN(loadFactor))
    10. throw new IllegalArgumentException("Illegal load factor: " +
    11. loadFactor);
    12. //通过1左移运算,找到一个大于/等于自定义容量的最小2的幂次方数
    13. int capacity = 1;
    14. while (capacity < initialCapacity)
    15. capacity <<= 1;
    16. this.loadFactor = loadFactor;
    17. threshold = (int)Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    18. //基于容量,创建数组
    19. table = new Entry[capacity];
    20. useAltHashing = sun.misc.VM.isBooted() &&
    21. (capacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
    22. init();
    23. }

    ```java int capacity = 1; while (capacity < initialCapacity) capacity <<= 1;

例: 假设自定义容量取值为10

  1. 1<10
  2. 1进行左移运算
  3. 0000 0000 0000 0000 0000 0000 0000 0001 -- 新容量等于1
  4. <<
  5. 0000 0000 0000 0000 0000 0000 0000 0010 -- 新容量等于2
  6. 2<10
  7. 2进行左移运算
  8. 0000 0000 0000 0000 0000 0000 0000 0010
  9. <<
  10. 0000 0000 0000 0000 0000 0000 0000 0100 -- 新容量等于4
  11. 4<10
  12. 4进行左移运算
  13. 0000 0000 0000 0000 0000 0000 0000 0100
  14. <<
  15. 0000 0000 0000 0000 0000 0000 0000 1000 -- 新容量等于8
  16. 8<10
  17. 8进行左移运算
  18. 0000 0000 0000 0000 0000 0000 0000 1000
  19. <<
  20. 0000 0000 0000 0000 0000 0000 0001 0000 -- 新容量等于16
  1. **为什么容量必须是2的幂次方数呢?**<br />**① 以上那些2的幂次方数有一个特点,高位为1,后续全部为0,这样的数减一,就会变成刚才为1的位置为0,后续所有值都为1,这样减一之后的数,和任何数进行与运算,得到的结果,永远是0-2的幂次方减一,正好符合数组角标的范围。**<br />**② 同时减一后,一定是一个奇数,末位一定是1,那么和其他数进行与运算后,得到的结果可能是奇数,也可能是偶数,那么可以充分利用数组的容量。**<br />**③ 2的幂次方数减一后,低位都是1,这样数组的索引位都有可能存入元素,如果低位不都是1,就会导致有些数组的索引位永远空缺,不利于数组的充分利用**<br />**④ 便于扩容时,重新定位元素的索引位,我们知道扩容的原则是原来数组的2倍,那么扩容后,数组容量还是一个2的幂次方数,原数组中的元素在新数组中,要么在原始索引位,要么在原始索引位+扩容值的位置,避免了重新hash的效率问题**
  2. - jdk1.8容量赋值
  3. 注意,jdk1.8的容量计算动作,在resize()扩容方法中完成。
  4. ```java
  5. final Node<K,V>[] resize() {
  6. Node<K,V>[] oldTab = table;
  7. int oldCap = (oldTab == null) ? 0 : oldTab.length;
  8. int oldThr = threshold;
  9. int newCap, newThr = 0;
  10. if (oldCap > 0) {
  11. if (oldCap >= MAXIMUM_CAPACITY) {
  12. threshold = Integer.MAX_VALUE;
  13. return oldTab;
  14. }
  15. else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
  16. oldCap >= DEFAULT_INITIAL_CAPACITY)
  17. newThr = oldThr << 1; // double threshold
  18. }
  19. else if (oldThr > 0) // initial capacity was placed in threshold
  20. newCap = oldThr;
  21. else { // zero initial threshold signifies using defaults
  22. newCap = DEFAULT_INITIAL_CAPACITY;
  23. newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
  24. }
  25. if (newThr == 0) {
  26. float ft = (float)newCap * loadFactor;
  27. newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
  28. (int)ft : Integer.MAX_VALUE);
  29. }
  30. threshold = newThr;
  31. @SuppressWarnings({"rawtypes","unchecked"})
  32. Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
  33. table = newTab;
  • jdk1.8中容量计算: ```java static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1; }

int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

假设初始容量设置为10:

n = 10-1
0000 0000 0000 0000 0000 0000 0000 1001 //9 n右移1位 0000 0000 0000 0000 0000 0000 0000 0100 //4

| 0000 0000 0000 0000 0000 0000 0000 1001 //9

  1. 0000 0000 0000 0000 0000 0000 0000 1101 //13

n右移2位 0000 0000 0000 0000 0000 0000 0000 0011

| 0000 0000 0000 0000 0000 0000 0000 1101

  1. 0000 0000 0000 0000 0000 0000 0000 1111 //15

n右移4位 0000 0000 0000 0000 0000 0000 0000 0000

| 0000 0000 0000 0000 0000 0000 0000 1111

  1. 0000 0000 0000 0000 0000 0000 0000 1111 //15
  1. 通过一系列右移+或运算后,能够将初始值减一得到的值,后面的所有0变成1,最终返回的是得到的值+1的结果作为容量,正好就是大于等于给定容量的2的幂次方数
  2. <a name="HHq4H"></a>
  3. ## 4、HashMap数据结构(1.7和1.8对比)
  4. - jdk1.7数据结构:数组+单向链表
  5. ```java
  6. void createEntry(int hash, K key, V value, int bucketIndex) {
  7. //取出索引位置的元素
  8. Entry<K,V> e = table[bucketIndex];
  9. //将新的元素放置到索引位,同时将原来的作为新元素的下一个保存,形成单向链表
  10. //头插法
  11. table[bucketIndex] = new Entry<>(hash, key, value, e);
  12. size++;
  13. }
  • jdk1.8数据结构:数组+单向链表+红黑树+双向链表

数组和单向链表的结构,在这里就不再赘述了,前面存取元素的过程中已经分析
这里我们来看下红黑树和双向链表结构

  1. //当添加元素后,单向链表长度达到8个会执行该方法
  2. final void treeifyBin(Node<K,V>[] tab, int hash) {
  3. int n, index; Node<K,V> e;
  4. //如果此时数组长度小于64,会通过扩容数组的方式,来避免单向链表过长
  5. if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
  6. resize();
  7. //通过转成红黑树,来避免单向链表过长
  8. else if ((e = tab[index = (n - 1) & hash]) != null) {
  9. TreeNode<K,V> hd = null, tl = null;
  10. do {
  11. //把所有Node节点,转成TreeNode节点,并形成双向链表
  12. TreeNode<K,V> p = replacementTreeNode(e, null);
  13. if (tl == null)
  14. hd = p;
  15. else {
  16. p.prev = tl;
  17. tl.next = p;
  18. }
  19. tl = p;
  20. } while ((e = e.next) != null);
  21. if ((tab[index] = hd) != null)
  22. //将双向链表中的元素形成红黑树结构
  23. hd.treeify(tab);
  24. }
  25. }
  26. //当添加元素时,对应的索引位置为TreeNode节点,会执行该方法
  27. final TreeNode<K,V> putTreeVal(HashMap<K,V> map, Node<K,V>[] tab,
  28. int h, K k, V v) {
  29. Class<?> kc = null;
  30. boolean searched = false;
  31. TreeNode<K,V> root = (parent != null) ? root() : this;
  32. for (TreeNode<K,V> p = root;;) {
  33. int dir, ph; K pk;
  34. if ((ph = p.hash) > h)
  35. dir = -1;
  36. else if (ph < h)
  37. dir = 1;
  38. else if ((pk = p.key) == k || (k != null && k.equals(pk)))
  39. return p;
  40. else if ((kc == null &&
  41. (kc = comparableClassFor(k)) == null) ||
  42. (dir = compareComparables(kc, k, pk)) == 0) {
  43. if (!searched) {
  44. TreeNode<K,V> q, ch;
  45. searched = true;
  46. if (((ch = p.left) != null &&
  47. (q = ch.find(h, k, kc)) != null) ||
  48. ((ch = p.right) != null &&
  49. (q = ch.find(h, k, kc)) != null))
  50. return q;
  51. }
  52. dir = tieBreakOrder(k, pk);
  53. }
  54. //以上逻辑,就是在遍历红黑树,决定新元素放置的位置
  55. TreeNode<K,V> xp = p;
  56. if ((p = (dir <= 0) ? p.left : p.right) == null) {
  57. Node<K,V> xpn = xp.next;
  58. TreeNode<K,V> x = map.newTreeNode(h, k, v, xpn);
  59. //找到新元素放置的位置,并将其添加进红黑树结构
  60. if (dir <= 0)
  61. xp.left = x;
  62. else
  63. xp.right = x;
  64. //同时维护双向链表结构
  65. xp.next = x;
  66. x.parent = x.prev = xp;
  67. if (xpn != null)
  68. ((TreeNode<K,V>)xpn).prev = x;
  69. //通过变色+旋转达到红黑树的自平衡
  70. moveRootToFront(tab, balanceInsertion(root, x));
  71. return null;
  72. }
  73. }
  74. }

你可能会有疑问,为什么在维护红黑树的同时,需要再维护一种双向链表的结构呢?其实主要是为了扩容方便的

5、HashMap扩容时机及扩容机制

  • jdk1.7扩容:先扩容,在添加值 ```java void addEntry(int hash, K key, V value, int bucketIndex) { //当元素个数达到了扩容阈值,同时元素该放置的位置有元素时,会执行扩容 if ((size >= threshold) && (null != table[bucketIndex])) {
    1. //扩容为原来的两倍
    2. resize(2 * table.length);
    3. hash = (null != key) ? hash(key) : 0;
    4. bucketIndex = indexFor(hash, table.length);
    } //扩容之后,在将新元素添加进集合 createEntry(hash, key, value, bucketIndex); }

void resize(int newCapacity) { Entry[] oldTable = table; int oldCapacity = oldTable.length; //达到最大容量,不扩容 if (oldCapacity == MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return; } //根据新容量创建数组 Entry[] newTable = new Entry[newCapacity]; boolean oldAltHashing = useAltHashing; useAltHashing |= sun.misc.VM.isBooted() && (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD); //计算是否需要重新计算hash boolean rehash = oldAltHashing ^ useAltHashing; //将旧数组中的元素迁移到新的数组中 transfer(newTable, rehash); //保存新数组 table = newTable; threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1); }

void transfer(Entry[] newTable, boolean rehash) { int newCapacity = newTable.length; for (Entry e : table) { while(null != e) { //记录遍历到的元素的下一个元素 Entry next = e.next; if (rehash) { e.hash = null == e.key ? 0 : hash(e.key); } //计算新数组的角标位置 int i = indexFor(e.hash, newCapacity); //把当前元素的下一个改为新数组对应位置的元素—头插法 e.next = newTable[i]; //将当前元素放置在数组对应索引位置 newTable[i] = e; //再次迁移下一个元素 e = next; } } }

  1. ![image.png](https://cdn.nlark.com/yuque/0/2022/png/22523384/1641390530576-2fb905e9-6992-4542-9de9-4a7b250acc8b.png#clientId=u7486c3af-17d8-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=490&id=uc305b012&margin=%5Bobject%20Object%5D&name=image.png&originHeight=490&originWidth=339&originalType=binary&ratio=1&rotation=0&showTitle=false&size=12476&status=done&style=none&taskId=udd865e3d-064e-49c7-9b26-6f984e93dd9&title=&width=339)
  2. - jdk1.8扩容:**先添加值,再扩容**
  3. ```java
  4. //元素个数,达到扩容阈值,就扩容
  5. //这个方法前半部分初始化数组的逻辑之前已经分析过了
  6. final Node<K,V>[] resize() {
  7. Node<K,V>[] oldTab = table;
  8. int oldCap = (oldTab == null) ? 0 : oldTab.length;
  9. int oldThr = threshold;
  10. int newCap, newThr = 0;
  11. if (oldCap > 0) {
  12. //数组容量达到最大值,不扩容
  13. if (oldCap >= MAXIMUM_CAPACITY) {
  14. threshold = Integer.MAX_VALUE;
  15. return oldTab;
  16. }
  17. //新的数组容量为原来的2倍
  18. else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
  19. oldCap >= DEFAULT_INITIAL_CAPACITY)
  20. newThr = oldThr << 1; // double threshold
  21. }
  22. else if (oldThr > 0) // initial capacity was placed in threshold
  23. newCap = oldThr;
  24. else { // zero initial threshold signifies using defaults
  25. newCap = DEFAULT_INITIAL_CAPACITY;
  26. newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
  27. }
  28. if (newThr == 0) {
  29. float ft = (float)newCap * loadFactor;
  30. newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
  31. (int)ft : Integer.MAX_VALUE);
  32. }
  33. threshold = newThr;
  34. @SuppressWarnings({"rawtypes","unchecked"})
  35. Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
  36. table = newTab;
  37. if (oldTab != null) {
  38. for (int j = 0; j < oldCap; ++j) {
  39. Node<K,V> e;
  40. if ((e = oldTab[j]) != null) {
  41. oldTab[j] = null;
  42. //数组角标位置只有一个元素,直接将数据迁移到新数组
  43. if (e.next == null)
  44. newTab[e.hash & (newCap - 1)] = e;
  45. //数组角标位置为TreeNode,迁移红黑树数据
  46. else if (e instanceof TreeNode)
  47. ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
  48. else { // preserve order
  49. //迁移单向链表数据
  50. Node<K,V> loHead = null, loTail = null;
  51. Node<K,V> hiHead = null, hiTail = null;
  52. Node<K,V> next;
  53. //先遍历整个单向链表,元素放置的位置,要么是原来的位置,要么是原来位置+扩容容量的位置
  54. do {
  55. next = e.next;
  56. //放置在原来角标位置的元素
  57. if ((e.hash & oldCap) == 0) {
  58. if (loTail == null)
  59. loHead = e;
  60. else
  61. //尾插法
  62. loTail.next = e;
  63. loTail = e;
  64. }
  65. //放置在原来角标+扩容容量 位置的元素
  66. else {
  67. if (hiTail == null)
  68. hiHead = e;
  69. else
  70. //尾插法
  71. hiTail.next = e;
  72. hiTail = e;
  73. }
  74. } while ((e = next) != null);
  75. //将放置在原角标位的元素存入数组
  76. if (loTail != null) {
  77. loTail.next = null;
  78. newTab[j] = loHead;
  79. }
  80. //将放置在新角标位的元素存入数组
  81. if (hiTail != null) {
  82. hiTail.next = null;
  83. newTab[j + oldCap] = hiHead;
  84. }
  85. }
  86. }
  87. }
  88. }
  89. return newTab;
  90. }

红黑树数据的迁移

  1. final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
  2. TreeNode<K,V> b = this;
  3. // Relink into lo and hi lists, preserving order
  4. TreeNode<K,V> loHead = null, loTail = null;
  5. TreeNode<K,V> hiHead = null, hiTail = null;
  6. int lc = 0, hc = 0;
  7. //通过遍历双向链表,实现数据迁移
  8. for (TreeNode<K,V> e = b, next; e != null; e = next) {
  9. next = (TreeNode<K,V>)e.next;
  10. e.next = null;
  11. //原角标位置
  12. if ((e.hash & bit) == 0) {
  13. //记录前一个
  14. if ((e.prev = loTail) == null)
  15. loHead = e;
  16. else
  17. //记录下一个 -- 尾插法
  18. loTail.next = e;
  19. loTail = e;
  20. //该标记累计,用于判断是否需要转会单向链表
  21. ++lc;
  22. }
  23. //原角标+扩容容量 位置
  24. else {
  25. //记录前一个
  26. if ((e.prev = hiTail) == null)
  27. hiHead = e;
  28. else
  29. //记录下一个 -- 尾插法
  30. hiTail.next = e;
  31. hiTail = e;
  32. //该标记累计,用于判断是否需要转会单向链表
  33. ++hc;
  34. }
  35. }
  36. if (loHead != null) {
  37. //元素个数小于等于6,转成单向链表
  38. if (lc <= UNTREEIFY_THRESHOLD)
  39. tab[index] = loHead.untreeify(map);
  40. else {
  41. //存入新的数组
  42. tab[index] = loHead;
  43. if (hiHead != null) // (else is already treeified)
  44. //树化
  45. loHead.treeify(tab);
  46. }
  47. }
  48. if (hiHead != null) {
  49. //元素个数小于等于6,转成单向链表
  50. if (hc <= UNTREEIFY_THRESHOLD)
  51. tab[index + bit] = hiHead.untreeify(map);
  52. else {
  53. //存入新的数组
  54. tab[index + bit] = hiHead;
  55. if (loHead != null)
  56. //树化
  57. hiHead.treeify(tab);
  58. }
  59. }
  60. }
  61. //将红黑树转成单向链表
  62. final Node<K,V> untreeify(HashMap<K,V> map) {
  63. Node<K,V> hd = null, tl = null;
  64. for (Node<K,V> q = this; q != null; q = q.next) {
  65. Node<K,V> p = map.replacementNode(q, null);
  66. if (tl == null)
  67. hd = p;
  68. else
  69. //尾插法,形成单向链表
  70. tl.next = p;
  71. tl = p;
  72. }
  73. return hd;
  74. }

image.png

6、多线程下HashMap扩容的问题(1.7和1.8对比)

  • jdk1.7,多线程扩容情况下,会导致循环引用

image.png

  • jdk1.8,多线程环境下,会导致数据丢失问题 ```java // 添加元素时,会有数据覆盖丢失数据 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

    1. boolean evict) {

    Node[] tab; Node p; int n, i; if ((tab = table) == null || (n = tab.length) == 0)

    1. n = (tab = resize()).length;

    //此处,如果多个线程向同一个位置存入元素,会有值覆盖的问题,导致数丢失 if ((p = tab[i = (n - 1) & hash]) == null)

    1. tab[i] = newNode(hash, key, value, null);

    //下面代码省略

// 扩容时,迁移数据的情况下,会有数据覆盖丢失的问题 // 多线程环境下,给同一个数组的相同位置赋值,会有数据覆盖的风险 if (loTail != null) { loTail.next = null; newTab[j] = loHead; //将原始索引位的数据迁移到新数组 } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; //将新索引位的数据迁移到新数组 }

  1. 当然,jdk1.8中的HashMap本身是线程不安全的,在多线程环境下,应该还会有更多其他问题,有待大家一起去探究。
  2. ```java
  3. **位 与:都为1,才为1
  4. 10&5
  5. 00000000000000000000000000001010
  6. & 00000000000000000000000000000101
  7. ---------------------------------------------
  8. 00000000000000000000000000000000
  9. 位 或:只要有个一个为1,就为1
  10. 10|5
  11. 00000000000000000000000000001010
  12. | 00000000000000000000000000000101
  13. ---------------------------------------------
  14. 00000000000000000000000000001111 === 15
  15. 位 异或:两个数不一样,才为1
  16. 10^5
  17. 00000000000000000000000000001010
  18. ^ 00000000000000000000000000000101
  19. --------------------------------------------
  20. 00000000000000000000000000001111 === 15

——————————————————
哈希值
通过一定的散列算法,把一个不固定长度的输入,转成一个固定长度的输出,输出的结果我们称之为哈希
map中,hash就是一个int值

哈希表:存储哈希值的数组 — 存取散列值(哈希值)的一个容器
哈希值到底该如何存,该如何取呢??? — 通过数组的角标实现数据的存取

需要有一个映射:不同的hash值存在对应角标位
hash值 ——运算—-》 index

哈希函数:将哈希值通过某种运算规则得到对应index

哈希冲突(哈希碰撞):两个元素通过哈希函数运算后,得到的角标是相同的

如何让存取效率是最高的???
— 如果元素都是均匀存储在数据的角标位,而不产生冲突,就是最好的
① 尽可能少的产生hash冲突
hash函数计算出来的角标要尽可以能均匀
static int indexFor(int h, int length) {
return h & (length-1); //length是map中数组的长度
}
length长度的规则是什么?? — 要求是2的幂次方数,为啥???
假设长度是8 -1 === 7

00000000000000000000000000000111 —- 长度8,参与hash运算是7
00000000000000000000000000001111 —- 长度16,参与hash运算是15
00000000000000000000000000011111 —- 长度32,参与hash运算是31

任何数:00110011000111111001110111101111
& 00000000000000000000000000001111
——————————————————————
00000000000000000000000000000000 — 00000000000000000000000000001111
【得到的值,正好是0-15的范围,该范围正好是长度为16的数组的角标】


假设长度不是2的幂次方:
奇数 — 长度5
00101001001001011111111111100111
& 00000000000000000000000000000100 — 长度5,参与hash运算是4
—————————————————————
得到的结果永远是一个偶数,代表获取的角标永远是偶数,奇数位的角标永远会都没有值
【数组的就浪费掉了一半】

偶数 — 长度6
00101001001001011111111111100111
& 00000000000000000000000000000101 — 长度6,参与hash运算是5
————————————————————————-
第二位永远是0,导致2,3角标位都不可能有值
【数组的就浪费掉了一半】

2的幂次方,在扩容时,扩容后的数组长度是原数组长度的2倍,结果还是2的幂次方
有啥好处???
假设原来是8
00000000000000000000000000000111
扩容后是16
00000000000000000000000000001111

在扩容时,数据要从原数组中迁移到新数组中

00000000000000000000000000001101
00000000000000000000000000000111
——————————————————-
101 === 5 原数组的角标位

00000000000000000000000000001101
00000000000000000000000000001111
———————————————————
1101 ==== 13(原角标位+扩容长度) 新数组的角标位
【扩容后,数据迁移时,数据要么在原来位置,要么在原来位置+扩容长度
不需要重新hash—效率更好】

② 确实产生了hash冲突 — 扩容+数据结构
扩容
什么时候扩容
jdk1.7
判断是否到达阈值(0.75*数组长度)
同时是否产生hash冲突

扩容后,再添加元素
jdk1.8
先添加元素

判断是否达到阈值

  1. **怎么扩容**<br /> jdk1.7 <br /> 添加元素使用头插法<br /> <br /> 将单向链表的数据进行迁移<br /> <br /> jdk1.8<br /> 添加元素使用尾插法<br /> <br /> 如果对应角标位是单向链表,将单向链表进行数据迁移<br /> 如果对应角标位是红黑树,将双向链表进行数据迁移<br /> 如果发现迁移完数据后,双向链表的结构小于/等于6,会将红黑树重新转回单向链表的结构<br /> <br /> **扩容后有什么问题(多线程环境)**<br /> jdk1.7<br /> 多线程环境下会形成环形链表(死循环)<br /> <br /> jdk1.8<br /> 多线程环境下会有数据丢失的问题<br /> <br /> **数据结构解决**<br /> jdk1.7产生冲突后,会形成单向链表<br /> <br /> jdk1.8产生冲突后<br /> 会形成单向链表<br /> 如果单向链表的长度大于/等于8,会转成红黑树+双向链表(扩容时使用)