1 map(1.2)

1.1 分类

双列数据,存储key-value对的数据

  • HashMap:map的主要实现类;1.2;线程不安全,效率高;可以存储null的key和value。底层:1.7及之前:数组+链表;1.8以后:数组+链表+红黑树
    • LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap。
  • TreeMap:保证按照添加的key-value对进行排序,实现排序遍历。考虑key的自然排序或定制排序。底层使用红黑树。
  • HashTable:古老的实现类;1.0;线程安全,效率低;不能存储null的key和value
    • Properties:常用来处置配置文件;key和value都是string类型

      1.2 map的结构:

      截屏2020-10-24 下午4.39.10.png
      key、entry:无序、不可重复,使用Set存储,要求key所在的类重写equals()和hashCode()方法(hashMap为例);value:无序、可重复,使用Collection存储,value所在的类重写equals()方法,跟key一一对应。一个entry包括一个key和value。

      1.3 继承体系

      截屏2021-05-16 下午3.08.12.png

      2. HashMap (jdk7)

  1. HashMap map = new HashMap(); 在实例化以后,底层创建了长度是16的一位数组Entry[ ] table。
  2. map.put(key, value); 首先,调用hash() 计算key哈希值,此哈希值经过某种算法计算以后,得到在entry数组中的存放位置。
    • 如果此位置上的数据为空,此时key-value添加成功;
    • 如果此位置上的数据不为空,意味着此位置上存在一个或多个数据(以链表形式存在),比较当前key和已经存在的一个或多个数据的哈希值:
      • 如果key的哈希值与已经存在的数据的哈希值都不相同,此时key-value能够添加成功;
      • 如果key的哈希值与某一个已经存在的哈希值相同,调用key所在类的equals方法,继续比较:
        • 如果equals()返回false:此时key-value添加成功;
        • 如果equals()返回的true,说明两个key是一样的,违背了key不能相同的准则,使用value去替换相同key的value值。
  1. 扩容问题:默认的扩容方式为扩容到原来的2倍,并将原有的数据复制过来。在超过临界值并且要存放的的位置上有数据就扩容(不再让其形成新的链表)。
  2. 在某个索引上添加新节点采用的是头插法。
  3. 数组+链表

    2.1 jdk7 源码

    https://www.cnblogs.com/red-code/p/6686738.html

    2.2 构造方法

    注:jdk7中的构造方法只是验证,不会新建一个数组,只有在put方法时,才会新建数组。真正新建数组的方法是inflateTable方法(2.3.1)
    带参数的构造方法:赋值和检验值是否合理。 ```java

/**

  1. * 生成一个空HashMap,传入容量与负载因子
  2. * @param initialCapacity 初始容量
  3. * @param loadFactor 负载因子
  4. */
  5. public HashMap(int initialCapacity, float loadFactor) {
  6. //初始容量不能小于0
  7. if (initialCapacity < 0)
  8. throw new IllegalArgumentException("Illegal initial capacity: " +
  9. initialCapacity);
  10. //初始容量不能大于默认的最大容量
  11. if (initialCapacity > MAXIMUM_CAPACITY)
  12. initialCapacity = MAXIMUM_CAPACITY;
  13. //负载因子不能小于0,且不能为“NaN”(NaN(“不是一个数字(Not a Number)”的缩写))
  14. if (loadFactor <= 0 || Float.isNaN(loadFactor))
  15. throw new IllegalArgumentException("Illegal load factor: " +
  16. loadFactor);
  17. //将传入的负载因子赋值给属性
  18. this.loadFactor = loadFactor;
  19. //此时并不会创建容器,因为没有 传具体值
  20. // 没下次扩容大小
  21. /**
  22. * 此时并不会创建容器,因为没有传具体值。
  23. * 当下次传具体值的时候,才会“根据这次的初始容量”,创建一个内部数组。
  24. * 所以此次的初始容量只是作为下一次扩容(新建)的容量。
  25. */
  26. threshold = initialCapacity;
  27. //该方法只在LinkedHashMap中有实现,主要在构造函数初始化和clone、readObject中有调用。
  28. init();
  29. }
  1. 不带参数的构造方法会调用带参数的构造方法(使用初始值)
  2. ```java
  3. /**
  4. * 生成一个空hashmap,传入初始容量,负载因子使用默认值(0.75)
  5. * @param initialCapacity 初始容量
  6. */
  7. public HashMap(int initialCapacity) {
  8. //生成空数组,并指定扩容值
  9. this(initialCapacity, DEFAULT_LOAD_FACTOR);
  10. }

2.3 hashmap中位运算的应用

2.3.1 计算初始容量

在新建(初始化)数组时进行:

  1. /**
  2. * 新建一个空的内部数组
  3. * @param toSize 新数组容量
  4. */
  5. private void inflateTable(int toSize) {
  6. //内部数组的大小必须是2的n次方,所以要找到“大于”toSize的“最小的2的n次方”。
  7. int capacity = roundUpToPowerOf2(toSize);
  8. // 在这里会产生新的临界值
  9. threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
  10. table = new Entry[capacity];
  11. //根据数组长度初始化hashseed
  12. initHashSeedAsNeeded(capacity);
  13. }

一定为2的幂次方数,1. 位置下标的与运算(计算位置下标用) 2.扩容时用

  1. /**
  2. * 找到number的最小的2的n次方
  3. * @param number
  4. * @return
  5. */
  6. private static int roundUpToPowerOf2(int number) {
  7. return number >= MAXIMUM_CAPACITY
  8. ? MAXIMUM_CAPACITY
  9. : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
  10. }
  11. public static int highestOneBit(int i) {
  12. // HD, Figure 3-1
  13. i |= (i >> 1);
  14. i |= (i >> 2);
  15. i |= (i >> 4);
  16. i |= (i >> 8);
  17. i |= (i >> 16);
  18. return i - (i >>> 1);
  19. }
  • highestOneBit() 方法解读:找到一个不大于当前数的最大的2的幂次方数 (15结果为8、16结果为16)
  1. 8位为例
  2. 原始数据 0001 ****
  3. i |= (i >> 1);
  4. 移动一位 0000 1***
  5. 或操作 0001 1***
  6. i |= (i >> 2);
  7. 移动两位 0000 11**
  8. 或操作 0001 11**
  9. .....
  10. 最后变成 0001 1111
  11. i - (i >>> 1);
  12. 右移一位 0000 1111
  13. 减之后得 0001 0000
  • roundUpToPowerOf2计算初始容量方法解读:

Integer.highestOneBit((number - 1) << 1) : 找到一个大于等于该number的最小的2的幂次方数。

  • number-1之后扩大到原来的2倍,就可以按照扩大后的数去找不大于当前数的最大的2的幂次方数。(例如num为16 ,num-1之后为15,左移一位扩大为30,30调用highestOneBit方法为16,即找到了16)
  • -1 是为了保证number本来就是2的幂次方数,如果左移扩大为2倍的话再调用该方方法得到的结果也是原来的2倍。(例如number为16,如果不-1的话左移扩大为32,32调用highestOneBit方法为32,而需要的结果为16,所以需要-1)

2.3.2 计算哈希值

增加散列次数的原因也是为了不让一个位置上的链表过长,多次散列可以使hashCode的值分布均匀,充分利用高位的值,使其参与到运算过程中而不是对结果没有影响。(因为计算数组中的位置下标只与数组长度的低位有关)

hashseed默认为0,改变方式参见2.4.2节

hash方法:

  1. /**
  2. * 根据传入的key生成hash值
  3. * @param k 键值名
  4. * @return hash值
  5. */
  6. final int hash(Object k) {
  7. int h = hashSeed;
  8. //如果key是字符串类型,就使用stringHash32来生成hash值
  9. if (0 != h && k instanceof String) {
  10. return sun.misc.Hashing.stringHash32((String) k);
  11. }
  12. //一次散列
  13. h ^= k.hashCode();
  14. //二次散列
  15. h ^= (h >>> 20) ^ (h >>> 12);
  16. return h ^ (h >>> 7) ^ (h >>> 4);
  17. }

2.3.3 计算在数组中的位置下标

indexFor方法

  1. /**
  2. * 返回hash值的索引,采用除模取余法,h & (length-1)操作 等价于 hash % length操作, 但&操作性能更优
  3. */
  4. /**
  5. * 根据key的hash值与数组长度,找到该key在table数组中的下标
  6. * @param h hash值
  7. * @param length 数组长度
  8. * @return 下标
  9. */
  10. static int indexFor(int h, int length) {
  11. //除模取余,相当于hash % length,&速度更快
  12. return h & (length-1);
  13. }
  • 举例:
    1. 长度为16,-1之后为15
    2. 15: 0000 1111
    3. H : 1010 1010
    4. &操作:0000 1010
    5. 结果其实就是hashcode的低4位,取值为0000-1111 0-15)恰好长度就是16
    可以看出与2的幂次方数有关,2的幂次方数-1之后其二进制高位全是0,低位全部都是1,同这些个1进行&操作就行了,高位可以全部舍弃。

    2.4 扩容问题

    2.4.1 什么时候扩容

    超过临界值并且要存放的的位置上有数据(jdk8没有)就扩容【即大于阈值,并且发生了碰撞】。扩容之后的位置坐标值在当前位置i或者是i+oldTable.length的位置(例如,hashmap数组位置为0,1,扩容之后为0,1,2,3,原先在1位置的值在扩容后有可能在1和3的位置出现,可以将其看成一半 (0,1),(1,3))
  1. /**
  2. * 查看是否需要扩容,然后添加新节点
  3. * @param hash key的hash值
  4. * @param key 结点内key
  5. * @param value 结点内value
  6. * @param bucketIndex 结点所在的table下标
  7. */
  8. void addEntry(int hash, K key, V value, int bucketIndex) {
  9. //如果当前键值对数量达到了临界值并且在新位置上加数据时发生了哈希碰撞,则扩容table
  10. if ((size >= threshold) && (null != table[bucketIndex])) {
  11. //容量扩容一倍
  12. resize(2 * table.length);
  13. //由于数组扩容了,重新计算hash值
  14. hash = (null != key) ? hash(key) : 0;
  15. //重新计算存储位置
  16. bucketIndex = indexFor(hash, table.length);
  17. }
  18. //将键值对与他的hash值作为一个entry,插入table的指定下标中的链表头中
  19. createEntry(hash, key, value, bucketIndex);
  20. }

2.4.2 单线程扩容转移的过程

原来是正序,扩容之后由于是头插法会变成倒序。

  1. **
  2. * 对数组扩容,即创建一个新数组,并将旧数组里的东西重新存入新数组
  3. * @param newCapacity 新数组容量
  4. */
  5. void resize(int newCapacity) {
  6. Entry[] oldTable = table;
  7. int oldCapacity = oldTable.length;
  8. //如果当前数组容量已经达到最大值了,则将扩容的临界值设置为Integer.MAX_VALUE(Integer.MAX_VALUE是容量的临界点)
  9. if (oldCapacity == MAXIMUM_CAPACITY) {
  10. threshold = Integer.MAX_VALUE;
  11. return;
  12. }
  13. //创建一个扩容后的新数组
  14. Entry[] newTable = new Entry[newCapacity];
  15. //将当前数组中的键值对存入新数组
  16. transfer(newTable, initHashSeedAsNeeded(newCapacity));
  17. //用新数组替换旧数组
  18. table = newTable;
  19. //计算下一个扩容临界点
  20. threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  21. }

哈希种子:需要自己提供一个值(jdk.map.althashing.threshold,ALTERNATIVE_HASHING_THRESHOLD),当容量超过这个值时,哈希种子会被随机赋一个值,在计算哈希值时会提高散列性。如果不设置,默认该值就是int的最大值,容量一般不会超过这个值,即哈希种子的值为0。

  1. //threshold的最大值
  2. static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
  3. private static class Holder {
  4. /**
  5. * 容量阈值,初始化hashSeed的时候会用到该值
  6. */
  7. static final int ALTERNATIVE_HASHING_THRESHOLD;
  8. static {
  9. //获取系统变量jdk.map.althashing.threshold
  10. String altThreshold = java.security.AccessController.doPrivileged(
  11. new sun.security.action.GetPropertyAction(
  12. "jdk.map.althashing.threshold"));
  13. int threshold;
  14. try {
  15. threshold = (null != altThreshold)
  16. ? Integer.parseInt(altThreshold)
  17. : ALTERNATIVE_HASHING_THRESHOLD_DEFAULT;
  18. // jdk.map.althashing.threshold系统变量默认为-1,如果为-1,则将阈值设为Integer.MAX_VALUE
  19. if (threshold == -1) {
  20. threshold = Integer.MAX_VALUE;
  21. }
  22. //阈值需要为正数
  23. if (threshold < 0) {
  24. throw new IllegalArgumentException("value must be positive integer.");
  25. }
  26. } catch(IllegalArgumentException failed) {
  27. throw new Error("Illegal value for 'jdk.map.althashing.threshold'", failed);
  28. }
  29. ALTERNATIVE_HASHING_THRESHOLD = threshold;
  30. }
  31. }
  1. /**
  2. * 根据内部数组长度初始化hashseed
  3. * @param capacity 内部数组长度
  4. * @return hashSeed是否初始化
  5. */
  6. final boolean initHashSeedAsNeeded(int capacity) {
  7. boolean currentAltHashing = hashSeed != 0;
  8. boolean useAltHashing = sun.misc.VM.isBooted() && (capacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
  9. boolean switching = currentAltHashing ^ useAltHashing;
  10. //为true则赋初始化值,currentAltHashing为false,只有useAltHashing为true时,
  11. // switching才会为true,useAltHashing为true时需要手动设置jdk.map.althashing.threshold的值,
  12. // 那么ALTERNATIVE_HASHING_THRESHOLD就为这个值,否则为默认值,
  13. // 当前hashmap数组容量>这个值时,useAltHashing就为true
  14. if (switching) {
  15. hashSeed = useAltHashing
  16. ? sun.misc.Hashing.randomHashSeed(this)
  17. : 0;
  18. }
  19. return switching;
  20. }
  • 重新计算哈希值:

if (rehash) { e.hash = null == e.key ? 0 : hash(e.key); }
如果设置jdk.map.althashing.threshold,扩容之后容量超过了这个值,那么哈希种子被改变了,rehash为true(默认为false),所以需要重新计算哈希值。主要还是为了扩容后,增加散列,使链表变短。

transfer方法,转移数据。两重循环,第一重循环的是数组,第二重循环的是每个位置上的链表。

  1. /**
  2. * 将现有数组中的内容重新通过hash计算存入新数组
  3. * @param newTable 新数组
  4. * @param rehash
  5. */
  6. void transfer(Entry[] newTable, boolean rehash) {
  7. int newCapacity = newTable.length;
  8. //遍历现有数组中的每一个单链表的头entry
  9. for (Entry<K,V> e : table) {
  10. //查找链表里的每一个entry
  11. while(null != e) {
  12. Entry<K,V> next = e.next;
  13. if (rehash) {
  14. e.hash = null == e.key ? 0 : hash(e.key);
  15. }
  16. //根据新的数组长度,重新计算此entry所在下标i
  17. int i = indexFor(e.hash, newCapacity);
  18. // 链表的头插法
  19. //将entry放入下标i处链表的头部(将新数组此处的原有链表存入entry的next指针)
  20. e.next = newTable[i];
  21. //将链表存回下标i
  22. newTable[i] = e;
  23. //查看下一个entry
  24. e = next;
  25. }
  26. }
  27. }

扩容转移数据使用的是头插法,所以在扩容的时候原先的数据跟扩容后的数据顺序是相反的。

image.png
image.png
image.png
image.png

2.4.3 多线程在扩容时使用头插法会出现循环链表

参见这篇文章 https://mp.weixin.qq.com/s/VtIpj-uuxFj5Bf6TmTJMTw

  • 线程1正常执行,扩容后数据与原来的数据是相反的,效果是这样的。

截屏2021-05-07 上午11.47.14.png

  • 线程2此时开始执行,由于线程1对hashmap的操作,线程2的指向是不变的,会跟着他移动

截屏2021-05-07 上午11.48.57.png

  • 线程2进行第一次扩容之后的结果

截屏2021-05-07 上午11.50.57.png

  • 线程2进行第二次扩容后的结果

截屏2021-05-07 上午11.55.03.png

  • 线程2进行第三次扩容后的结果

截屏2021-05-07 上午11.57.44.png
出现循环了

2.5 头插法(put方法)

put方法:

  • 如果是第一次添加元素,初始化
  • key为null,存在第0个位置
  • 生成key对应的哈希值(增加散列)
  • 根据哈希值找到对应的位置index
  • 先判断该位置,是否有元素,没有则直接进行下一步。遍历该位置的链表,判断是否存在该key,如果存在,更新value,返回旧的value
  • 否则,添加进链表中(头插法)。

    inflateTable方法(参见2.3.1) hash方法(参见2.3.2)indexFor方法(参见2.3.3) 都与位运算有关

  1. /**
  2. * 存入一个键值对,如果key重复,则更新value
  3. * @param key 键值名
  4. * @param value 键值
  5. * @return 如果存的是新key则返回null,如果覆盖了旧键值对,则返回旧value
  6. */
  7. public V put(K key, V value) {
  8. //如果数组为空,则初始化数组
  9. if (table == EMPTY_TABLE) {
  10. inflateTable(threshold);
  11. }
  12. //如果key为null,则把value放在table[0]中
  13. if (key == null)
  14. return putForNullKey(value);
  15. //生成key所对应的hash值
  16. int hash = hash(key);
  17. //根据hash值和数组的长度找到:该key所属entry在table中的位置i
  18. int i = indexFor(hash, table.length);
  19. /**
  20. * 数组中每一项存的都是一个链表,
  21. * 先找到i位置,然后循环该位置上的每一个entry,
  22. * 如果发现存在key与传入key相等,则替换其value。然后结束该方法。
  23. * 如果没有找到相同的key,则继续执行下一条指令,将此键值对存入链表头
  24. */
  25. for (Entry<K,V> e = table[i]; e != null; e = e.next) {
  26. Object k;
  27. if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
  28. V oldValue = e.value;
  29. e.value = value;
  30. // linkedHashmap使用
  31. e.recordAccess(this);
  32. return oldValue;
  33. }
  34. }
  35. //map操作次数加一
  36. modCount++;
  37. // 没有找到相同的key,则新增
  38. // 查看是否需要扩容,并将该键值对存入指定下标的链表头中
  39. addEntry(hash, key, value, i);
  40. //如果是新存入的键值对,则返回null
  41. return null;
  42. }

addEntry方法(具体内容参见2.4.1 ):

  1. void addEntry(int hash, K key, V value, int bucketIndex) {
  2. //如果当前键值对数量达到了临界值,或目标table下标不存在,则扩容table
  3. if ((size >= threshold) && (null != table[bucketIndex])) {
  4. //容量扩容一倍
  5. resize(2 * table.length);
  6. //由于数组扩容了,重新计算hash值
  7. hash = (null != key) ? hash(key) : 0;
  8. //重新计算存储位置
  9. bucketIndex = indexFor(hash, table.length);
  10. }
  11. //将键值对与他的hash值作为一个entry,插入table的指定下标中的链表头中
  12. createEntry(hash, key, value, bucketIndex);
  13. }

createEntry方法(头插法):

  1. /**
  2. * 将键值对与他的hash值作为一个entry,插入table的指定下标中的链表头中
  3. * @param hash hash值
  4. * @param key 键值名
  5. * @param value 键值
  6. * @param bucketIndex 被插入的下标
  7. */
  8. void createEntry(int hash, K key, V value, int bucketIndex) {
  9. // 取当前位置的头结点
  10. Entry<K,V> e = table[bucketIndex];
  11. // 新建一个节点,将新节点的next指针指向头结点e,并将新节点放在当前位置上
  12. table[bucketIndex] = new Entry<>(hash, key, value, e);
  13. size++;
  14. }

putForNullKey方法(如果key为null,则将其放在数组的0位置上)特例:

  1. /**
  2. * 如果key为null,则将其value存入table[0]的链表中
  3. * @param value 键值
  4. * @return 如果覆盖了旧value,则返回value,否则返回null
  5. */
  6. private V putForNullKey(V value) {
  7. //迭代table[0]中的链表里的每一个entry
  8. for (Entry<K, V> e = table[0]; e != null; e = e.next) {
  9. //如果找到key为null的entry,则覆盖其value,并返回旧value
  10. // 0位置的链表不止存key为null的值,还要存计算出的index为0的值,因此null会在中间出现。需要遍历。
  11. if (e.key == null) {
  12. V oldValue = e.value;
  13. e.value = value;
  14. e.recordAccess(this);
  15. return oldValue;
  16. }
  17. }
  18. //操作次数加一
  19. modCount++;
  20. //如果没有找到key为null的entry,则新增。
  21. //查看是否需要扩容,然后将entry插入table的指定下标中的链表头中,插入0的位置
  22. addEntry(0, null, value, 0);
  23. return null;
  24. }

2.6 modCount属性

记录hashmap的修改次数。fast-fail容错机制。
测试:
测试方法

  1. public static void main(String[] args) {
  2. HashMap<Integer, Integer> map = new HashMap<>();
  3. map.put(1, 1);
  4. map.put(2, 2);
  5. for (Integer key : map.keySet()) {
  6. if (key.equals(1)) {
  7. map.remove(key);
  8. }
  9. }
  10. }

报错:在遍历时修改(并发)

  1. Exception in thread "main" java.util.ConcurrentModificationException
  2. at java.util.HashMap$HashIterator.nextNode(HashMap.java:1445)
  3. at java.util.HashMap$KeyIterator.next(HashMap.java:1469)
  4. at com.ll.ch3.Test111.main(Test111.java:14)

报错原因分析:看class文件

  1. public static void main(String[] args) {
  2. HashMap<Integer, Integer> map = new HashMap();
  3. map.put(1, 1);
  4. map.put(2, 2);
  5. Iterator var2 = map.keySet().iterator();
  6. while(var2.hasNext()) {
  7. Integer key = (Integer)var2.next();
  8. if (key.equals(1)) {
  9. map.remove(key);
  10. }
  11. }
  12. }

第10行,使用的是map的remove方法,这个方法中有一个modCount++操作,会改变modCount值

  1. if (node != null && (!matchValue || (v = node.value) == value ||
  2. (value != null && value.equals(v)))) {
  3. if (node instanceof TreeNode)
  4. ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
  5. else if (node == p)
  6. tab[index] = node.next;
  7. else
  8. p.next = node.next;
  9. ++modCount;
  10. --size;
  11. afterNodeRemoval(node);
  12. return node;
  13. }

第8行执行的是hashmap的next方法 modCount与expectedModCount不相等时会抛出异常,modCount被修改了,expectedModCount没有被修改。

  1. final Node<K,V> nextNode() {
  2. Node<K,V>[] t;
  3. Node<K,V> e = next;
  4. if (modCount != expectedModCount)
  5. throw new ConcurrentModificationException();
  6. if (e == null)
  7. throw new NoSuchElementException();
  8. if ((next = (current = e).next) == null && (t = table) != null) {
  9. do {} while (index < t.length && (next = t[index++]) == null);
  10. }
  11. return e;
  12. }

而iteratior的next方法修改了expectedModCount值,不会抛出异常(第10行)。

  1. public final void remove() {
  2. Node<K,V> p = current;
  3. if (p == null)
  4. throw new IllegalStateException();
  5. if (modCount != expectedModCount)
  6. throw new ConcurrentModificationException();
  7. current = null;
  8. K key = p.key;
  9. removeNode(hash(key), key, null, false, false);
  10. expectedModCount = modCount;
  11. }

修改后的代码为:

  1. public static void main(String[] args) {
  2. HashMap<Integer, Integer> map = new HashMap<>();
  3. map.put(1, 1);
  4. map.put(2, 2);
  5. Iterator var2 = map.keySet().iterator();
  6. while(var2.hasNext()) {
  7. Integer key = (Integer)var2.next();
  8. if (key.equals(1)) {
  9. var2.remove();
  10. }
  11. }
  12. }

3. ConcurrentHashmap原理(jdk7)

结构:ConcurrentHashMap的数据结构是由一个Segment数组和多个HashEntry组成,如下图所示:
image.png
ConcurrentHashMap在初始化时会要求初始化concurrencyLevel作为segment数组长度,即并发度,代表最多有多少个线程可以同时操作ConcurrentHashMap,默认是16,每个segment片段里面含有键值对HashEntry数组,是真正存放键值对的地方,这就是ConcurrentHashMap的数据结构。
image.png

3.1 构造方法

  1. /**
  2. * ConcurrentHashMap
  3. * @param initialCapacity 初始化容量(总HashEntry容量,每一个HashEntry=initialCapacity/concurrencyLevel)
  4. * @param loadFactor 负载因子
  5. * @param concurrencyLevel 并发级别,也就是segments数组的长度
  6. */
  7. public ConcurrentHashMap(int initialCapacity,
  8. float loadFactor, int concurrencyLevel) {
  9. if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)
  10. throw new IllegalArgumentException();
  11. if (concurrencyLevel > MAX_SEGMENTS)
  12. concurrencyLevel = MAX_SEGMENTS;
  13. // 根据concurrencyLevel计算出ssize为segments数组的长度
  14. //如果我们传入的concurrencyLevel不是2的n次幂,计算出的size是大于等于我们传入的数的2
  15. // 的幂次方数
  16. int sshift = 0;
  17. int ssize = 1;
  18. // 该方法与hashmap的中求个数的含义相同
  19. while (ssize < concurrencyLevel) {
  20. ++sshift;
  21. ssize <<= 1;
  22. }
  23. this.segmentShift = 32 - sshift;
  24. this.segmentMask = ssize - 1;
  25. if (initialCapacity > MAXIMUM_CAPACITY)
  26. initialCapacity = MAXIMUM_CAPACITY;
  27. // 计算每个segment中table的容量
  28. int c = initialCapacity / ssize;
  29. //判断如果传入initialCapacity不是2的n次幂,所做的操作相当于向上取整
  30. if (c * ssize < initialCapacity)
  31. ++c;
  32. // HashEntry[]最小容量为2
  33. int cap = MIN_SEGMENT_TABLE_CAPACITY;
  34. // 保证cap是2^n
  35. while (cap < c)
  36. cap <<= 1;
  37. // create segments and segments[0]
  38. // 创建segments并初始化第一个segment数组,其余的segment延迟初始化,原型,
  39. // 相当于一个模板,别的segment为空时,就不用重复这些计算操作而可以直接用他的属性初始化新的segment
  40. Segment<K,V> s0 =
  41. new Segment<K,V>(loadFactor, (int)(cap * loadFactor),
  42. (HashEntry<K,V>[])new HashEntry[cap]);
  43. Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize];
  44. UNSAFE.putOrderedObject(ss, SBASE, s0); // 这里是unsafe操作,并发安全的为数组的第0个位置赋值
  45. this.segments = ss;
  46. }

3.1 HashEntry的结构

  1. static final class HashEntry<K,V> {
  2. final int hash;
  3. final K key;
  4. volatile V value;
  5. volatile HashEntry<K,V> next;
  6. HashEntry(int hash, K key, V value, HashEntry<K,V> next) {
  7. this.hash = hash;
  8. this.key = key;
  9. this.value = value;
  10. this.next = next;
  11. }
  12. /**
  13. * Sets next field with volatile write semantics. (See above
  14. * about use of putOrderedObject.)
  15. */
  16. final void setNext(HashEntry<K,V> n) {
  17. UNSAFE.putOrderedObject(this, nextOffset, n);
  18. }
  19. // Unsafe mechanics
  20. static final sun.misc.Unsafe UNSAFE; //可以理解为一个指针
  21. static final long nextOffset;//偏移量,可以简单的理解为内存地址
  22. static {
  23. try {
  24. UNSAFE = sun.misc.Unsafe.getUnsafe();//获取这个节点对应的内存指针
  25. Class k = HashEntry.class;//
  26. nextOffset = UNSAFE.objectFieldOffset
  27. (k.getDeclaredField("next")); //获取当前节点的next节点对于当前节点指针的偏移量
  28. //通过UNSAFE中有方法直接能够获取到当前引用变量的初始内存地址
  29. //通过初始内存地址和引用变量内部的局部变量的偏移量就可以通过Unsafe直接读取到对应的参数值
  30. } catch (Exception e) {
  31. throw new Error(e);
  32. }
  33. }
  34. }

4.HashMap底层原理(jdk 8)

与jdk7的区别:

  1. HashMap map = new HashMap(); 在实例化以后,底层并没有创建一个长度为16的数组
  2. jdk8底层的数组是:Node[ ],并不是Entry[ ]
  3. 首次调用put( )方法时,底层创建长度为16的数组。
  4. 在某个索引上添加新节点采用的是尾插法。
  5. 数组+链表+红黑树。当数组的某一个索引位置上的元素以链表形式存在的数据个数>8且当前数组的长度>64时,此时此索引位置上的所有数据改为使用红黑树存储。

    4.1 红黑树

    有关课程可B站搜《数据结构-邓俊辉》

    4.1.1 红黑树的定义

  • 每个节点是红色或黑色
  • 根节点是黑色
  • 每个叶节点是黑色(空叶子节点也算叶子节点)
  • 如果一个节点是红的,则它的两个儿子都是黑的(即父子节点之间不能出现两个连续的红节点)
  • 对每个节点,从该节点到其叶子节点的所有路径上包含相同数目的黑色节点(为满足此定义,新插入的节点一定是红色的)

    4.1.2 红黑树的转换

    红黑树本质是(2,4)B-树的实现
    截屏2021-05-13 上午11.13.55.png

    4.1.3 插入操作

    双红问题

    截屏2021-05-13 下午12.10.29.png

  • 情况1:x的叔叔节点u为黑色,重新染色即可(中间节点变黑,孩子节点变红)

截屏2021-05-13 下午12.19.01.png
截屏2021-05-13 下午12.37.48.png

  • 情况2:x的叔叔节点u为红色,不满足B树条件,对应的B树发生上溢。

截屏2021-05-13 下午1.01.36.png
转换过程
结构变化为:O(1) ,红色变化为O(logN )
截屏2021-05-13 下午1.41.38.png

插入节点的所有情况分析(新插入的节点一定是红色)

情形1

新插入的节点为根节点,则直接变为黑色即可。

情形2

新节点的父节点为黑色,无需调整。

情形3

新节点的父节点为红色,叔叔节点存在且也为红色。将父节点和叔叔节点变为黑色,祖父节点变为红色即可。
image.png

情形4

新节点为父节点的右孩子,父节点为红色,叔叔节点为黑色或者为null。
①左旋。旋转父节点。就变成了情形5
image.png
②右旋。先变色,父节点和叔叔节点变黑色,祖父节点变红色。祖父节点右旋。
image.png


情形5

新节点为父节点的左孩子,父节点为红色,叔叔节点为黑色或者为null。调整规则同情形4中的第二步

4.1.4 删除操作

截屏2021-05-13 下午2.38.56.png

双黑问题

截屏2021-05-13 下午2.24.30.png

  • 情况1

    删除x节点截屏2021-05-13 下午2.28.08.png
    截屏2021-05-13 下午2.29.56.png

  • 情况2:

截屏2021-05-13 下午2.33.48.png

  • 情况3:

截屏2021-05-13 下午2.37.37.png

  • 情况4:

截屏2021-05-13 下午2.41.48.png

4.1.5 HashMap中红黑树的调整代码

TreeNode结构:内部类,继承了Node结构,所以还有next,prev的属性

  1. TreeNode<K,V> parent; // red-black tree links
  2. TreeNode<K,V> left;
  3. TreeNode<K,V> right;
  4. TreeNode<K,V> prev; // needed to unlink next upon deletion
  5. boolean red;

1. 红黑树调整

balanceInsertion() 方法

  1. // root为当前红黑树的根节点,x为新增节点
  2. static <K,V> TreeNode<K,V> balanceInsertion(TreeNode<K,V> root,
  3. TreeNode<K,V> x) {
  4. // 新增节点默认为红节点
  5. x.red = true;
  6. // xp为x的父节点,xpp为x的祖父节点,xppl为xpp的左孩子节点(x的左叔叔节点),xppr为xpp的右孩子节点(x的右叔叔节点)
  7. for (TreeNode<K,V> xp, xpp, xppl, xppr;;) {
  8. // 如果x的父节点为空、说明当前节点就是根节点。->L1
  9. // 那么把当前节点标为黑色,返回当前节点
  10. if ((xp = x.parent) == null) {
  11. x.red = false;
  12. return x;
  13. }
  14. // x的父节点是黑色,或者x的祖父节点为null(插入之后只有两层)->L2
  15. // 直接返回root
  16. else if (!xp.red || (xpp = xp.parent) == null)
  17. return root;
  18. // 如果x的父节点是祖父节点的左孩子,则祖父节点的右孩子为右叔叔节点 ->L3
  19. if (xp == (xppl = xpp.left)) {
  20. // 如果x的右叔叔节点存在且为红色 (RR-2) ->L3_1
  21. if ((xppr = xpp.right) != null && xppr.red) {
  22. xppr.red = false; // 右叔叔节点变黑
  23. xp.red = false; // 父节点变黑
  24. xpp.red = true; // 祖父节点变红
  25. x = xpp; // x变为祖父节点(祖父节点为起始节点),递归调整
  26. }
  27. else { // x的右叔叔节点为null或者为黑色 ->L3_2
  28. // 如果x为父节点的右孩子,先左旋后右旋 -> L3_2_1
  29. if (x == xp.right) {
  30. // 父节点左旋,此时x为xp节点了
  31. root = rotateLeft(root, x = xp);
  32. // 左旋过后xp与x的父子关系颠倒了,
  33. // 更换x与xp的父子关系,获取爷爷节点,如果xp节点为null,xpp也为null
  34. xpp = (xp = x.parent) == null ? null : xp.parent;
  35. }
  36. // 如果xp节点不为空,直接右旋 -> L3_2_2
  37. if (xp != null) {
  38. xp.red = false; // 父节点变为黑色
  39. if (xpp != null) { // 爷爷节点不为空
  40. xpp.red = true; // 爷爷节点变红色,
  41. root = rotateRight(root, xpp); // 爷爷节点右旋
  42. }
  43. }
  44. }
  45. }
  46. else { // 如果x的父节点是祖父节点的右孩子 ->L4,过程基本与L3一样
  47. // 如果x的左叔叔节点存在空且是红色 ->L4_1
  48. if (xppl != null && xppl.red) {
  49. xppl.red = false; // 左叔叔节点变黑
  50. xp.red = false; // 父节点变黑
  51. xpp.red = true; // 祖父节点变红
  52. x = xpp; // x变为祖父节点(祖父节点为起始节点),递归调整
  53. }
  54. else { // 如果x的左叔叔为null或者是黑色 -> L4_2
  55. // 如果x节点是父节点xp的左孩子,先右旋后左旋 ->L4_2_1
  56. if (x == xp.left) {
  57. // 父节点右旋,此时x为xp节点了
  58. root = rotateRight(root, x = xp);
  59. // 右旋过后xp与x的父子关系颠倒了,
  60. // 更换x与xp的父子关系,获取爷爷节点,如果xp节点为null,xpp也为null
  61. xpp = (xp = x.parent) == null ? null : xp.parent;
  62. }
  63. // 如果xp节点不为空,直接左旋 -> L4_2_2
  64. if (xp != null) {
  65. xp.red = false; // 父节点变为黑色
  66. if (xpp != null) { // 爷爷节点不为空
  67. xpp.red = true; // 爷爷节点变红色,
  68. root = rotateLeft(root, xpp); // 爷爷节点右旋
  69. }
  70. }
  71. }
  72. }
  73. }
  74. }
  • 无旋转 L3_1 L4_1 L1

image.png

  • L3_2_1 与 L3_2_2的变化

image.png

  • L4_2_1与L4_2_2

image.png

2 左旋

  • 左旋代码 ```java x节点与x的父节点xp交换位置,即xp为左孩子节点,x为父节点 root 根节点,p为x的父节点。 static TreeNode rotateLeft(TreeNode root,

    1. TreeNode<K,V> p) {

    TreeNode r, pp, rl; if (p != null && (r = p.right) != null) { // 要左旋的节点以及要左旋的节点的右孩子不为空

    1. if ((rl = p.right = r.left) != null) // 要左旋的节点p的右孩子r的左节点rl不为null, 将其赋给 要左旋的节点p的右孩子 节点为:rl
    2. rl.parent = p; // 设置rl和要左旋的节点p的父子关系【之前只是爹认了孩子,孩子还没有答应,这一步孩子也认了爹】
    3. // 将要左旋的节点p的右孩子l的父节点 指向 要左旋的节点的父节点,相当于右孩子提升了一层,
    4. // 此时如果父节点为空, 说明r 已经是顶层节点了,应该作为root 并且标为黑色
    5. if ((pp = r.parent = p.parent) == null)
    6. (root = r).red = false;
    7. else if (pp.left == p) // 如果父节点pp不为空 并且 要左旋的节点p是个左孩子
    8. pp.left = r; // 设置r和父节点的父子关系【之前只是孩子认了爹,爹还没有答应,这一步爹也认了孩子】
    9. else // 要左旋的节点是个右孩子
    10. pp.right = r;
    11. r.left = p; // 要左旋的节点 作为 他的右孩子的左节点
    12. p.parent = r; // 要左旋的节点的右孩子 作为 他的父节点

    } return root; // 返回根节点 }

  1. - 第一种情况,ppp的左孩子
  2. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/12943861/1620893930480-d7e1b06b-c8ce-4f91-94a9-b6e9082a3ce2.png#clientId=ucfb9111b-4845-4&from=paste&height=393&id=u9c5e2d00&margin=%5Bobject%20Object%5D&name=image.png&originHeight=470&originWidth=865&originalType=binary&ratio=1&size=47455&status=done&style=none&taskId=u044b1423-6d18-4aca-858d-955478e9337&width=723.5)
  3. - 第二种情况,16ppp的右孩子
  4. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/12943861/1620893970802-df3f2f63-bd16-4c4e-8a63-f88d392d1f80.png#clientId=ucfb9111b-4845-4&from=paste&height=388&id=ue0828387&margin=%5Bobject%20Object%5D&name=image.png&originHeight=455&originWidth=790&originalType=binary&ratio=1&size=38635&status=done&style=none&taskId=u19278183-a6dd-4c3f-b4c1-85f13088d45&width=673)
  5. <a name="V6p9l"></a>
  6. #### 3 右旋
  7. ```java
  8. x节点与x的父节点xp交换位置,即xp为左孩子节点,x为父节点
  9. root 根节点,p为x的父节点。
  10. static <K,V> TreeNode<K,V> rotateRight(TreeNode<K,V> root,
  11. TreeNode<K,V> p) {
  12. TreeNode<K,V> l, pp, lr;
  13. if (p != null && (l = p.left) != null) { // 要右旋的节点不为空以及要右旋的节点的左孩子不为空
  14. if ((lr = p.left = l.right) != null) // 要右旋的节点的左孩子的右节点 赋给 要右旋节点的左孩子 节点为:lr
  15. lr.parent = p; // 设置lr和要右旋的节点的父子关系【之前只是爹认了孩子,孩子还没有答应,这一步孩子也认了爹】
  16. // 将要右旋的节点的左孩子的父节点 指向 要右旋的节点的父节点,相当于左孩子提升了一层,
  17. // 此时如果父节点为空, 说明l 已经是顶层节点了,应该作为root 并且标为黑色
  18. if ((pp = l.parent = p.parent) == null)
  19. (root = l).red = false;
  20. else if (pp.right == p) // 如果父节点不为空 并且 要右旋的节点是个右孩子
  21. pp.right = l; // 设置l和父节点的父子关系【之前只是孩子认了爹,爹还没有答应,这一步爹也认了孩子】
  22. else // 要右旋的节点是个左孩子
  23. pp.left = l; // 同上
  24. l.right = p; // 要右旋的节点 作为 他左孩子的右节点
  25. p.parent = l; // 要右旋的节点的父节点 指向 他的左孩子
  26. }
  27. return root;
  28. }

右旋过程与左旋过程类似,图示如下:
image.png
image.png

4.2 Node结构及相关参数

4.2.1 Node结构

  1. static class Node<K,V> implements Map.Entry<K,V> {
  2. final int hash;
  3. final K key;
  4. V value;
  5. Node<K,V> next;
  6. //...省略
  7. }

4.2.2 相关参数

常量

  1. // 默认table大小:16
  2. static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
  3. // 数组最大容量
  4. static final int MAXIMUM_CAPACITY = 1 << 30;
  5. // 默认负载因子,默认0.75,平衡空间开销和查找成本。过大容易发生哈希碰撞降低速度,过低容易引起频繁扩容,浪费空间
  6. static final float DEFAULT_LOAD_FACTOR = 0.75f;
  7. // 树化链表个数阈值 8,符合泊松分布
  8. static final int TREEIFY_THRESHOLD = 8;
  9. // 树降级成为链表的阈值 6
  10. static final int UNTREEIFY_THRESHOLD = 6;
  11. // 树化数组长度阈值64
  12. static final int MIN_TREEIFY_CAPACITY = 64;

属性

  1. // 哈希表
  2. transient Node<K,V>[] table;
  3. // 当前哈希表的元素(键值对)个数
  4. transient int size;
  5. // 当前哈希表的结构修改次数
  6. transient int modCount;
  7. // 扩容阈值
  8. int threshold;
  9. // 负载因子
  10. final float loadFactor;

4.3 构造方法

  1. public HashMap(int initialCapacity, float loadFactor) {
  2. // 参数校验
  3. if (initialCapacity < 0)
  4. throw new IllegalArgumentException("Illegal initial capacity: " +
  5. initialCapacity);
  6. if (initialCapacity > MAXIMUM_CAPACITY)
  7. initialCapacity = MAXIMUM_CAPACITY;
  8. if (loadFactor <= 0 || Float.isNaN(loadFactor))
  9. throw new IllegalArgumentException("Illegal load factor: " +
  10. loadFactor);
  11. this.loadFactor = loadFactor;
  12. // 找一个大于等于当前数组容量的最小的2的次方数
  13. this.threshold = tableSizeFor(initialCapacity);
  14. }
  15. public HashMap(int initialCapacity) {
  16. this(initialCapacity, DEFAULT_LOAD_FACTOR);
  17. }
  18. public HashMap() {
  19. this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
  20. }
  21. public HashMap(Map<? extends K, ? extends V> m) {
  22. this.loadFactor = DEFAULT_LOAD_FACTOR;
  23. putMapEntries(m, false);
  24. }
  1. static final int tableSizeFor(int cap) {
  2. int n = cap - 1;
  3. n |= n >>> 1;
  4. n |= n >>> 2;
  5. n |= n >>> 4;
  6. n |= n >>> 8;
  7. n |= n >>> 16;
  8. return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
  9. }

4.4 put方法

put方法

  1. public V put(K key, V value) {
  2. return putVal(hash(key), key, value, false, true);
  3. }

putVal方法

  1. final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
  2. boolean evict) {
  3. // tab 引用当前hashmap的散列表
  4. // p 表示当前散列表的元素
  5. // n 表示散列表数组的长度
  6. // i 表示寻址结果
  7. Node<K,V>[] tab; Node<K,V> p; int n, i;
  8. // tab为null 或者长度为0,调用resize方法。创建数组表。延迟初始化。
  9. // 第一次调用put方法会初始化hashmap对象的散列表,防止浪费内存
  10. if ((tab = table) == null || (n = tab.length) == 0)
  11. n = (tab = resize()).length;
  12. // 如果当前数组位置为null,就创建一个节点放进去,没有发生碰撞
  13. if ((p = tab[i = (n - 1) & hash]) == null)
  14. tab[i] = newNode(hash, key, value, null);
  15. else {// 这个位置不是null,发生碰撞了
  16. // e:临时node元素 k:表示临时的key
  17. Node<K,V> e; K k;
  18. // 如果当前位置的第一个节点与新节点的哈希值相等,key也相等,则后续会覆盖当前位置的该节点
  19. if (p.hash == hash &&
  20. ((k = p.key) == key || (key != null && key.equals(k))))
  21. e = p;
  22. else if (p instanceof TreeNode) // 如果存的是红黑树,则去红黑树里面添加
  23. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
  24. else { // 不是覆盖操作,则插入一个普通链表节点,
  25. // binCount是当前链表的长度,如果为8,转化为红黑树
  26. for (int binCount = 0; ; ++binCount) {
  27. // 没找到这个值
  28. if ((e = p.next) == null) {
  29. // 就加新节点进去,尾插法
  30. p.next = newNode(hash, key, value, null);
  31. // 临界值binCount为7(从0开始计算)
  32. // 因为是先插入后判断,当第9个节点插入后,binCount为7,转换为红黑树
  33. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  34. treeifyBin(tab, hash);
  35. break;
  36. }
  37. // 在链表上找到这个值了,就中断,进行修改
  38. if (e.hash == hash &&
  39. ((k = e.key) == key || (key != null && key.equals(k))))
  40. break;
  41. // 节点下移
  42. p = e;
  43. }
  44. }
  45. // 如果e不是null,说明找到了节点有需要覆盖的节点,修改
  46. if (e != null) { // existing mapping for key
  47. //则覆盖节点值,并返回原oldValue
  48. V oldValue = e.value;
  49. if (!onlyIfAbsent || oldValue == null)
  50. e.value = value;
  51. afterNodeAccess(e);
  52. return oldValue;
  53. }
  54. }
  55. // 散列表修改结构的次数+1
  56. ++modCount;
  57. // 如果size自增过后的值>扩容阈值,则进行扩容
  58. if (++size > threshold)
  59. // 扩容
  60. resize();
  61. afterNodeInsertion(evict);
  62. return null;
  63. }

4.4.1 计算hash值

与 jdk7中的hash方法(2.3.2) 不一样,简化了。因为加了红黑树,就不用那么复杂了。

  1. static final int hash(Object key) {
  2. int h;
  3. return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
  4. }

4.4.2 treeifyBin()方法

将单向链表改成双向链表(4.3扩容时操作链表更方便),并构建红黑树。

  1. final void treeifyBin(Node<K,V>[] tab, int hash) {
  2. int n, index; Node<K,V> e;
  3. // 如果数组为null,或者数组长度<MIN_TREEIFY_CAPACIT(64)扩容
  4. if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
  5. resize();
  6. else if ((e = tab[index = (n - 1) & hash]) != null) {
  7. TreeNode<K,V> hd = null, tl = null;
  8. do {
  9. // 转换为TreeNode节点
  10. TreeNode<K,V> p = replacementTreeNode(e, null);
  11. // 生成双向链表的过程
  12. if (tl == null)
  13. hd = p;
  14. else {
  15. p.prev = tl;
  16. tl.next = p;
  17. }
  18. tl = p;
  19. } while ((e = e.next) != null);
  20. if ((tab[index] = hd) != null)
  21. // 树化
  22. hd.treeify(tab);
  23. }
  24. }

replacementTreeNode方法

将hashmap的node节点,转换为红黑树的TreeNode节点。

  1. TreeNode<K,V> replacementTreeNode(Node<K,V> p, Node<K,V> next) {
  2. return new TreeNode<>(p.hash, p.key, p.value, next);
  3. }

treeify方法

构建红黑树

  1. final void treeify(Node<K,V>[] tab) {
  2. TreeNode<K,V> root = null;
  3. for (TreeNode<K,V> x = this, next; x != null; x = next) {
  4. // 依此遍历双向链表节点
  5. next = (TreeNode<K,V>)x.next;
  6. x.left = x.right = null;
  7. // 构建根节点,变成黑色
  8. if (root == null) {
  9. x.parent = null;
  10. x.red = false;
  11. root = x;
  12. }
  13. else {
  14. K k = x.key;
  15. int h = x.hash;
  16. Class<?> kc = null;
  17. // 从根节点开始找要插入的节点的位置,BST思想
  18. for (TreeNode<K,V> p = root;;) {
  19. int dir, ph;
  20. K pk = p.key;
  21. // 比较哈希值
  22. if ((ph = p.hash) > h)
  23. dir = -1;
  24. else if (ph < h)
  25. dir = 1;
  26. // 如果hash相等,看key所在的类是否实现了Comparable接口,如果实现了,再用Comparable比较
  27. else if ((kc == null &&
  28. (kc = comparableClassFor(k)) == null) ||
  29. (dir = compareComparables(kc, k, pk)) == 0)
  30. dir = tieBreakOrder(k, pk);
  31. TreeNode<K,V> xp = p;
  32. if ((p = (dir <= 0) ? p.left : p.right) == null) {
  33. // 找到插入位置进行插入
  34. x.parent = xp;
  35. if (dir <= 0)
  36. xp.left = x;
  37. else
  38. xp.right = x;
  39. // 红黑树平衡调整
  40. root = balanceInsertion(root, x);
  41. break;
  42. }
  43. }
  44. }
  45. }
  46. // 把树的根移到那个位置上
  47. moveRootToFront(tab, root);
  48. }
  • tieBreakOrder方法

    1. static int tieBreakOrder(Object a, Object b) {
    2. int d;
    3. if (a == null || b == null ||
    4. (d = a.getClass().getName().
    5. compareTo(b.getClass().getName())) == 0)
    6. d = (System.identityHashCode(a) <= System.identityHashCode(b) ?
    7. -1 : 1);
    8. return d;
    9. }
  • moveRootToFront方法

    1. static <K,V> void moveRootToFront(Node<K,V>[] tab, TreeNode<K,V> root) {
    2. int n;
    3. if (root != null && tab != null && (n = tab.length) > 0) {
    4. int index = (n - 1) & root.hash;
    5. TreeNode<K,V> first = (TreeNode<K,V>)tab[index];
    6. if (root != first) {
    7. Node<K,V> rn;
    8. // 将根节点放到那个位置上
    9. tab[index] = root;
    10. // 找到双向链表中根节点的位置放到头节点上
    11. TreeNode<K,V> rp = root.prev;
    12. if ((rn = root.next) != null)
    13. ((TreeNode<K,V>)rn).prev = rp;
    14. if (rp != null)
    15. rp.next = rn;
    16. if (first != null)
    17. first.prev = root;
    18. root.next = first;
    19. root.prev = null;
    20. }
    21. assert checkInvariants(root);
    22. }
    23. }

    红黑树插入位置的比较过程

  • hash()

  • key所在的类实现了Comparable接口的CompareTo()
  • getClass().getName()
  • System.identityHashCode() 获取该对象没有被重写的hash值

    4.5 扩容

    与1.7不同,8中的扩容仅仅是大于阈值即可,7中还有一个发生哈希碰撞的条件。

    1. if (++size > threshold)
    2. // 扩容
    3. resize();

    4.5.1 扩容方法

    ```java final Node[] resize() {

    1. Node<K,V>[] oldTab = table;
    2. // oldCap 扩容之前哈希表的数组长度
    3. int oldCap = (oldTab == null) ? 0 : oldTab.length;
    4. // 扩容之前的阈值
    5. int oldThr = threshold;
    6. // 扩容之后的数组大小和阈值大小
    7. int newCap, newThr = 0;
    8. // 给扩容后的两个变量赋值
    9. // hashmap已经初始化过了,正常扩容
    10. if (oldCap > 0) {
    11. // 达到最大值,赋给Integer最大值
    12. if (oldCap >= MAXIMUM_CAPACITY) {
    13. threshold = Integer.MAX_VALUE;
    14. return oldTab;
    15. }
    16. // 否则,正常扩容
    17. // 老容量翻倍之后依然小于最大值 且老容量>=16,则容量翻倍,扩容阈值也翻倍。
    18. // 注意此时如果不满足这个条件也不会给newThr赋值(情况1)
    19. else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
    20. oldCap >= DEFAULT_INITIAL_CAPACITY)
    21. newThr = oldThr << 1; // double threshold
    22. }
    23. // oldCap = 0,散列表没有初始化
    24. // 1.new HashMap(initCap, loadFactory)
    25. // 2.new HashMap(initCap)
    26. // 3.new HashMap(map) 且map有数据
    27. else if (oldThr > 0) // initial capacity was placed in threshold
    28. // 第一次初始化将 老阈值 赋给 新容量。注意此时并没有给newThr赋值(情况2)
    29. newCap = oldThr;
    30. else {
    31. // zero initial threshold signifies using defaults
    32. // oldCap oldThr全部都为0,赋默认值
    33. // new HashMap();
    34. newCap = DEFAULT_INITIAL_CAPACITY;
    35. newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    36. }
    37. // 上面有两种情况会导致newThr为0
    38. if (newThr == 0) {
    39. // 为newThr赋值
    40. float ft = (float)newCap * loadFactor;
    41. newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
    42. (int)ft : Integer.MAX_VALUE);
    43. }
    44. threshold = newThr;
    45. @SuppressWarnings({"rawtypes","unchecked"})
    46. Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    47. table = newTab;
    48. // 扩容部分
    49. if (oldTab != null) {
    50. for (int j = 0; j < oldCap; ++j) {
    51. Node<K,V> e;
    52. if ((e = oldTab[j]) != null) {
    53. // 置空,方便jvm回收,释放内存
    54. oldTab[j] = null;
    55. if (e.next == null)
    56. // 单个节点扩容,重新计算位置即可
    57. newTab[e.hash & (newCap - 1)] = e;
    58. else if (e instanceof TreeNode)
    59. // 红黑树扩容
    60. ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
    61. else { // 链表扩容
    62. // 将原先的一个链表拆成两个链表
    63. // 一部分放重新计算index为0的节点 lo 当前位置
    64. // 一部分放重新计算不为0的节点 hi 当前位置+老数组长度
    65. Node<K,V> loHead = null, loTail = null;
    66. Node<K,V> hiHead = null, hiTail = null;
    67. Node<K,V> next;
    68. do {
    69. next = e.next;
    70. if ((e.hash & oldCap) == 0) {
    71. if (loTail == null)
    72. loHead = e;
    73. else
    74. loTail.next = e;
    75. loTail = e;
    76. }
    77. else {
    78. if (hiTail == null)
    79. hiHead = e;
    80. else
    81. hiTail.next = e;
    82. hiTail = e;
    83. }
    84. } while ((e = next) != null);
    85. // 将两个链表放到新数组相应的位置上
    86. if (loTail != null) {
    87. loTail.next = null;
    88. newTab[j] = loHead;
    89. }
    90. if (hiTail != null) {
    91. hiTail.next = null;
    92. newTab[j + oldCap] = hiHead;
    93. }
    94. }
    95. }
    96. }
    97. }
    98. return newTab;

    }

  1. <a name="OrtbP"></a>
  2. #### 链表扩容
  3. 链表扩容部分与1.7不同,第40行到58行。将原先数组上的一个链表拆分成两个链表,挨个计算e的哈希值与老数组容量的与运算,结果为0表示低位部分loHead,连接到lo链表中;结果不为0表示高位部分hiHead,连接到hi链表中。之后lo链表重新放到到新数组中的原来的index位置,hi链表重新放到新数组中index+oldCap的位置。
  4. <a name="zWdBS"></a>
  5. #### 红黑树扩容(split方法)
  6. 红黑树部分含有一个双向链表(树化过程之前会将其变成双向链表),也是将一个链表拆成两个链表(要记录两个链表的个数)。低位放到原先的index位置,高位放到index+oldCap位置。同时判断两个新链表的个数是否达到_UNTREEIFY_THRESHOLD=6_,如果是6则退化成链表(Node类型,单向链表);否则,判断是否需要树化,如果低位链表存在而高位链表不存在(高位存在地位不存在),那还是原来的那棵树直接移走就行了不用树化,否则需要树化。
  7. ```java
  8. final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
  9. TreeNode<K,V> b = this;
  10. // Relink into lo and hi lists, preserving order
  11. TreeNode<K,V> loHead = null, loTail = null;
  12. TreeNode<K,V> hiHead = null, hiTail = null;
  13. int lc = 0, hc = 0;
  14. for (TreeNode<K,V> e = b, next; e != null; e = next) {
  15. next = (TreeNode<K,V>)e.next;
  16. e.next = null;
  17. if ((e.hash & bit) == 0) {
  18. if ((e.prev = loTail) == null)
  19. loHead = e;
  20. else
  21. loTail.next = e;
  22. loTail = e;
  23. // 记录个数
  24. ++lc;
  25. }
  26. else {
  27. if ((e.prev = hiTail) == null)
  28. hiHead = e;
  29. else
  30. hiTail.next = e;
  31. hiTail = e;
  32. ++hc;
  33. }
  34. }
  35. if (loHead != null) {
  36. if (lc <= UNTREEIFY_THRESHOLD)
  37. tab[index] = loHead.untreeify(map);
  38. else {
  39. tab[index] = loHead;
  40. if (hiHead != null) // (else is already treeified)
  41. loHead.treeify(tab);
  42. }
  43. }
  44. if (hiHead != null) {
  45. if (hc <= UNTREEIFY_THRESHOLD)
  46. tab[index + bit] = hiHead.untreeify(map);
  47. else {
  48. tab[index + bit] = hiHead;
  49. if (loHead != null)
  50. hiHead.treeify(tab);
  51. }
  52. }
  53. }

4.6 Get方法

  1. final Node<K,V> getNode(int hash, Object key) {
  2. // tab 引用当前hashmap的散列表
  3. // first 数组中的头元素
  4. // n 数组长度
  5. // k key
  6. Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
  7. // 数组当前位置不为空才去get
  8. if ((tab = table) != null && (n = tab.length) > 0 &&
  9. (first = tab[(n - 1) & hash]) != null) {
  10. // 只有一个节点比较值
  11. if (first.hash == hash && // always check first node
  12. ((k = first.key) == key || (key != null && key.equals(k))))
  13. return first;
  14. if ((e = first.next) != null) {
  15. // 找红黑树
  16. if (first instanceof TreeNode)
  17. return ((TreeNode<K,V>)first).getTreeNode(hash, key);
  18. // 找链表
  19. do {
  20. if (e.hash == hash &&
  21. ((k = e.key) == key || (key != null && key.equals(k))))
  22. return e;
  23. } while ((e = e.next) != null);
  24. }
  25. }
  26. return null;
  27. }

红黑树的查找方法

  1. final TreeNode<K,V> find(int h, Object k, Class<?> kc) {
  2. TreeNode<K,V> p = this;
  3. do {
  4. int ph, dir; K pk;
  5. TreeNode<K,V> pl = p.left, pr = p.right, q;
  6. if ((ph = p.hash) > h)
  7. p = pl;
  8. else if (ph < h)
  9. p = pr;
  10. else if ((pk = p.key) == k || (k != null && k.equals(pk)))
  11. return p;
  12. else if (pl == null)
  13. p = pr;
  14. else if (pr == null)
  15. p = pl;
  16. else if ((kc != null ||
  17. (kc = comparableClassFor(k)) != null) &&
  18. (dir = compareComparables(kc, k, pk)) != 0)
  19. p = (dir < 0) ? pl : pr;
  20. else if ((q = pr.find(h, k, kc)) != null)
  21. return q;
  22. else
  23. p = pl;
  24. } while (p != null);
  25. return null;
  26. }

4.7 remove方法

  1. final Node<K,V> removeNode(int hash, Object key, Object value,
  2. boolean matchValue, boolean movable) {
  3. Node<K,V>[] tab; Node<K,V> p; int n, index;
  4. // 判断该数组位置是否有节点
  5. if ((tab = table) != null && (n = tab.length) > 0 &&
  6. (p = tab[index = (n - 1) & hash]) != null) {
  7. Node<K,V> node = null, e; K k; V v;
  8. // 先找到这个节点
  9. if (p.hash == hash &&
  10. ((k = p.key) == key || (key != null && key.equals(k))))
  11. // 第一个节点
  12. node = p;
  13. else if ((e = p.next) != null) {
  14. // 红黑树中找
  15. if (p instanceof TreeNode)
  16. node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
  17. else {
  18. // 链表中找
  19. do {
  20. if (e.hash == hash &&
  21. ((k = e.key) == key ||
  22. (key != null && key.equals(k)))) {
  23. node = e;
  24. break;
  25. }
  26. p = e;
  27. } while ((e = e.next) != null);
  28. }
  29. }
  30. // node不为null,删除节点
  31. if (node != null && (!matchValue || (v = node.value) == value ||
  32. (value != null && value.equals(v)))) {
  33. if (node instanceof TreeNode)
  34. // 红黑树节点
  35. ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
  36. // 链表节点
  37. // 头结点
  38. else if (node == p)
  39. tab[index] = node.next;
  40. else
  41. // 中间节点
  42. p.next = node.next;
  43. ++modCount;
  44. --size;
  45. afterNodeRemoval(node);
  46. return node;
  47. }
  48. }
  49. return null;
  50. }

红黑树删除

  1. final void removeTreeNode(HashMap<K,V> map, Node<K,V>[] tab,
  2. boolean movable) {
  3. int n;
  4. if (tab == null || (n = tab.length) == 0)
  5. return;
  6. int index = (n - 1) & hash;
  7. TreeNode<K,V> first = (TreeNode<K,V>)tab[index], root = first, rl;
  8. TreeNode<K,V> succ = (TreeNode<K,V>)next, pred = prev;
  9. if (pred == null)
  10. tab[index] = first = succ;
  11. else
  12. pred.next = succ;
  13. if (succ != null)
  14. succ.prev = pred;
  15. if (first == null)
  16. return;
  17. if (root.parent != null)
  18. root = root.root();
  19. // 这里并没有采用与常量比较的方式,而是判断节点存不存在6个,提高性能
  20. if (root == null
  21. || (movable
  22. && (root.right == null
  23. || (rl = root.left) == null
  24. || rl.left == null))) {
  25. tab[index] = first.untreeify(map); // too small
  26. return;
  27. }
  28. TreeNode<K,V> p = this, pl = left, pr = right, replacement;
  29. if (pl != null && pr != null) {
  30. TreeNode<K,V> s = pr, sl;
  31. while ((sl = s.left) != null) // find successor
  32. s = sl;
  33. boolean c = s.red; s.red = p.red; p.red = c; // swap colors
  34. TreeNode<K,V> sr = s.right;
  35. TreeNode<K,V> pp = p.parent;
  36. if (s == pr) { // p was s's direct parent
  37. p.parent = s;
  38. s.right = p;
  39. }
  40. else {
  41. TreeNode<K,V> sp = s.parent;
  42. if ((p.parent = sp) != null) {
  43. if (s == sp.left)
  44. sp.left = p;
  45. else
  46. sp.right = p;
  47. }
  48. if ((s.right = pr) != null)
  49. pr.parent = s;
  50. }
  51. p.left = null;
  52. if ((p.right = sr) != null)
  53. sr.parent = p;
  54. if ((s.left = pl) != null)
  55. pl.parent = s;
  56. if ((s.parent = pp) == null)
  57. root = s;
  58. else if (p == pp.left)
  59. pp.left = s;
  60. else
  61. pp.right = s;
  62. if (sr != null)
  63. replacement = sr;
  64. else
  65. replacement = p;
  66. }
  67. else if (pl != null)
  68. replacement = pl;
  69. else if (pr != null)
  70. replacement = pr;
  71. else
  72. replacement = p;
  73. if (replacement != p) {
  74. TreeNode<K,V> pp = replacement.parent = p.parent;
  75. if (pp == null)
  76. root = replacement;
  77. else if (p == pp.left)
  78. pp.left = replacement;
  79. else
  80. pp.right = replacement;
  81. p.left = p.right = p.parent = null;
  82. }
  83. TreeNode<K,V> r = p.red ? root : balanceDeletion(root, replacement);
  84. if (replacement == p) { // detach
  85. TreeNode<K,V> pp = p.parent;
  86. p.parent = null;
  87. if (pp != null) {
  88. if (p == pp.left)
  89. pp.left = null;
  90. else if (p == pp.right)
  91. pp.right = null;
  92. }
  93. }
  94. if (movable)
  95. moveRootToFront(tab, r);
  96. }