HashMap 与 ConcurrentHashMap 的实现原理是怎样的?ConcurrentHashMap 是如何保证线程安全的?

HashMap

实现原理

HashMap主要用于存放KeyValue键值对。
JDK1.8 之前 HashMap 底层是 数组和链表 结合在一起使用。
JDK1.8及之后,使用的是 数据+链表+红黑树 的数据结构。利用key使用put、get方法进行存取。

实现原理:

  1. key 经过hash函数处理过后得到 hash 值
  2. 通过 (n - 1) & hash 取模判断当前元素应该存放的位置(这里的 n 指的是数组的长度)
  3. 如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同
    1. 相同,直接覆盖
    2. 不相同,通过拉链法解决冲突

JDK1.8之后,当链表长度大于阈值(默认为 8)时,会首先调用 treeifyBin()方法。这个方法会根据 HashMap 数组来决定是否转换为红黑树。只有当数组长度大于或者等于 64 的情况下,才会执行转换红黑树操作,以减少搜索时间。否则,就是只是执行 resize() 方法对数组扩容。

  1. // 当桶(bucket)上的结点数大于这个值时会转成红黑树
  2. static final int TREEIFY_THRESHOLD = 8;
  3. // 当桶(bucket)上的结点数小于这个值时树转链表
  4. static final int UNTREEIFY_THRESHOLD = 6;
  5. // 桶中结构转化为红黑树对应的table的最小大小
  6. static final int MIN_TREEIFY_CAPACITY = 64;

HashMap与ConcurrentHashMap - 图1

put()方法

介绍put()方法的具体流程
参数介绍:

  1. int hash
  2. K key
  3. V value
  4. boolean onlyIfAbsent
  5. boolean evict //
  1. final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
  2. boolean evict) {
  3. Node<K,V>[] tab; Node<K,V> p; int n, i;
  4. if ((tab = table) == null || (n = tab.length) == 0)
  5. n = (tab = resize()).length;
  6. if ((p = tab[i = (n - 1) & hash]) == null)
  7. tab[i] = newNode(hash, key, value, null);
  8. else {
  9. Node<K,V> e; K k;
  10. if (p.hash == hash &&
  11. ((k = p.key) == key || (key != null && key.equals(k))))
  12. e = p;
  13. else if (p instanceof TreeNode)
  14. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
  15. else {
  16. for (int binCount = 0; ; ++binCount) {
  17. if ((e = p.next) == null) {
  18. p.next = newNode(hash, key, value, null);
  19. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  20. treeifyBin(tab, hash);
  21. break;
  22. }
  23. if (e.hash == hash &&
  24. ((k = e.key) == key || (key != null && key.equals(k))))
  25. break;
  26. p = e;
  27. }
  28. }
  29. if (e != null) { // existing mapping for key
  30. V oldValue = e.value;
  31. if (!onlyIfAbsent || oldValue == null)
  32. e.value = value;
  33. afterNodeAccess(e);
  34. return oldValue;
  35. }
  36. }
  37. ++modCount;
  38. if (++size > threshold)
  39. resize();
  40. afterNodeInsertion(evict);
  41. return null;
  42. }

1、判断HashMap有没有被初始化
如果没有初始化,调用resize()方法进行初始化
2、根据Key计算得到hash值,再计算得到应该存放的桶的下标i
3-1、table[i]为空(p = tab[i = (n - 1) & hash]) == null
直接插入,tab[i] = newNode(hash, key, value, null);
3-2、table[i]不为空


会首先创建临时变量Node<K,V> e; K k;
3-2-1、第一个node的key哈希值=这次put的key哈希值,
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
将该节点赋值给e,执行e=p;
3-2-2、树结构p instanceof TreeNode
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
3-2-3、链表结构
在遍历查找的同时计算binCount
1、遍历到最后也没有找到相等的key,(e = p.next) == null,说明需要添加一个新的节点到链表,首先执行插入操作,p.next = newNode(hash, key, value, null);此时,需要检查是否存在binCount >= TREEIFY_THRESHOLD - 1,即插入链表第8个节点时需要修改链表结构为红黑树。
2、找到了相等的key,e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))),跳出遍历。
3-2-4、判断e是否为空值,即HashMap.put(key,value)这次的操作是插入还是更新。
e不为空,说明已经存在这个key的映射。
再进一步判断if (!onlyIfAbsent || oldValue == null),确认是否需要更新这个节点,(不管是否更新,如果是putIfAbsent就不更新)最后执行afterNodeAccess(e);方法,把更新后的节点放在链表的末尾(尾插法),return oldValue;结束流程。


4、e为空的情况,说明是插入了一个新的节点,++modCount (用于支持fail-fast)
5、++size>threshold,如果size大于threashold,需要进行扩容
threshold=Capacity*LoadFactor
6、执行afterNodeInsertion(evict);
默认evict=true,调用removeEldestEntry方法,但其实这个方法啥也没做

  1. /**
  2. * <p>This implementation merely returns <tt>false</tt> (so that this
  3. * map acts like a normal map - the eldest element is never removed).
  4. */
  5. protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
  6. return false;
  7. }

7、return null,结束插入

Conccurent HashMap

实现原理

Java7 : 使用ReentrantLock ,结构是Segment 数组 + HashEntry 数组 + 链表
Java8 : 使用 Synchronized 锁加 CAS 的机制。结构进化成了 Node 数组 + 链表 / 红黑树,Node 是类似于一个 HashEntry 的结构。它的冲突再达到一定大小时会转化成红黑树,在冲突小于一定数量时又退回链表。

put()方法

  1. final V putVal(K key, V value, boolean onlyIfAbsent) {
  2. if (key == null || value == null) throw new NullPointerException();
  3. int hash = spread(key.hashCode());
  4. int binCount = 0;
  5. for (Node<K,V>[] tab = table;;) {
  6. Node<K,V> f; int n, i, fh;
  7. if (tab == null || (n = tab.length) == 0)
  8. tab = initTable();
  9. else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
  10. if (casTabAt(tab, i, null,
  11. new Node<K,V>(hash, key, value, null)))
  12. break; // no lock when adding to empty bin
  13. }
  14. else if ((fh = f.hash) == MOVED)
  15. tab = helpTransfer(tab, f);
  16. else {
  17. V oldVal = null;
  18. synchronized (f) {
  19. if (tabAt(tab, i) == f) {
  20. if (fh >= 0) {
  21. binCount = 1;
  22. for (Node<K,V> e = f;; ++binCount) {
  23. K ek;
  24. if (e.hash == hash &&
  25. ((ek = e.key) == key ||
  26. (ek != null && key.equals(ek)))) {
  27. oldVal = e.val;
  28. if (!onlyIfAbsent)
  29. e.val = value;
  30. break;
  31. }
  32. Node<K,V> pred = e;
  33. if ((e = e.next) == null) {
  34. pred.next = new Node<K,V>(hash, key,
  35. value, null);
  36. break;
  37. }
  38. }
  39. }
  40. else if (f instanceof TreeBin) {
  41. Node<K,V> p;
  42. binCount = 2;
  43. if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
  44. value)) != null) {
  45. oldVal = p.val;
  46. if (!onlyIfAbsent)
  47. p.val = value;
  48. }
  49. }
  50. }
  51. }
  52. if (binCount != 0) {
  53. if (binCount >= TREEIFY_THRESHOLD)
  54. treeifyBin(tab, i);
  55. if (oldVal != null)
  56. return oldVal;
  57. break;
  58. }
  59. }
  60. }
  61. addCount(1L, binCount);
  62. return null;
  63. }

有几个临时变量Node<K,V> f; int n, i, fh;
1、首先判断key,value是否为空值,如果是抛出空指针异常
2、计算key的hash值
3、如果table为空,初始化table,initTable();
4-1、table[i]==null,尝试使用 CAS 直接在该位置插入新值,如果失败会重新尝试
casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null))
4-2、table[i]!=null,且(fh = f.hash) == _MOVED_,即头节点的hash值=-1,说明正在进行扩容操作,调用tab = helpTransfer(tab, f);,没有退出循环,之后会继续执行put。
4-3、table[i]!=null,且没有处在扩容状态,给数组第i个位置的节点加锁synchronized (f)
fh>=0,结构是链表,遍历的同时计算binCount,与HashMap不同的是,并没有把需要被修改的e暂存,而是在这个循环里面直接改掉并保存oldVal值。
f instanceof TreeBin,fh=-2,结构是红黑树,不需要计算binCount。
5、如果binCount!=0(即进入了4-3),需要看下是否满足binCount >= TREEIFY_THRESHOLD,来决定是否需要修改链表结构为红黑树
6、如果oldVal!=null(即更新了节点值),return oldVal;,结束流程。
7、走到这里,说明是以下三种插入了新节点的情况

  • table[i]==null,使用 CAS 直接在该位置插入新值,binCount=0
  • table[i]!=null,遍历链表,在尾部插入新值,binCount=添加节点后链表长度
  • table[i]!=null,遍历红黑树,插入新值,binCount=2

调用addCount(1L, binCount);方法,1L表示添加了1个,binCount=check,check大于0的情况下需要检查是否需要扩容(没太看懂)
8、return null;结束流程。