容器Collection - HashMap与ConcurrentHashMap - 《Java 基础》

HashMap
- 实现原理
- put()方法
Conccurent HashMap
- 实现原理
- put()方法

HashMap 与 ConcurrentHashMap 的实现原理是怎样的？ConcurrentHashMap 是如何保证线程安全的？

HashMap

实现原理

HashMap主要用于存放KeyValue键值对。
JDK1.8 之前 HashMap 底层是 数组和链表 结合在一起使用。
JDK1.8及之后，使用的是 数据+链表+红黑树 的数据结构。利用key使用put、get方法进行存取。

实现原理：

key 经过hash函数处理过后得到 hash 值
通过 (n - 1) & hash 取模判断当前元素应该存放的位置（这里的 n 指的是数组的长度）
如果当前位置存在元素的话，就判断该元素与要存入的元素的 hash 值以及 key 是否相同
1. 相同，直接覆盖
2. 不相同，通过拉链法解决冲突

JDK1.8之后，当链表长度大于阈值（默认为 8）时，会首先调用 treeifyBin()方法。这个方法会根据 HashMap 数组来决定是否转换为红黑树。只有当数组长度大于或者等于 64 的情况下，才会执行转换红黑树操作，以减少搜索时间。否则，就是只是执行 resize() 方法对数组扩容。

    // 当桶(bucket)上的结点数大于这个值时会转成红黑树
    static final int TREEIFY_THRESHOLD = 8;
    // 当桶(bucket)上的结点数小于这个值时树转链表
    static final int UNTREEIFY_THRESHOLD = 6;
    // 桶中结构转化为红黑树对应的table的最小大小
    static final int MIN_TREEIFY_CAPACITY = 64;

HashMap与ConcurrentHashMap - 图1

put()方法

介绍put()方法的具体流程
参数介绍：

int hash
K key
V value
boolean onlyIfAbsent
boolean evict //

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

1、判断HashMap有没有被初始化
如果没有初始化，调用resize()方法进行初始化
2、根据Key计算得到hash值，再计算得到应该存放的桶的下标i
3-1、table[i]为空，(p = tab[i = (n - 1) & hash]) == null
直接插入，tab[i] = newNode(hash, key, value, null);
3-2、table[i]不为空

会首先创建临时变量Node<K,V> e; K k;
3-2-1、第一个node的key哈希值=这次put的key哈希值，
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
将该节点赋值给e，执行e=p;
3-2-2、树结构p instanceof TreeNode
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
3-2-3、链表结构
在遍历查找的同时计算binCount
1、遍历到最后也没有找到相等的key，(e = p.next) == null，说明需要添加一个新的节点到链表，首先执行插入操作，p.next = newNode(hash, key, value, null);此时，需要检查是否存在binCount >= TREEIFY_THRESHOLD - 1，即插入链表第8个节点时需要修改链表结构为红黑树。
2、找到了相等的key，e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))，跳出遍历。
3-2-4、判断e是否为空值，即HashMap.put(key,value)这次的操作是插入还是更新。
e不为空，说明已经存在这个key的映射。
再进一步判断if (!onlyIfAbsent || oldValue == null)，确认是否需要更新这个节点，（不管是否更新，如果是putIfAbsent就不更新）最后执行afterNodeAccess(e);方法，把更新后的节点放在链表的末尾（尾插法），return oldValue;结束流程。

4、e为空的情况，说明是插入了一个新的节点，++modCount （用于支持fail-fast）
5、++size>threshold，如果size大于threashold，需要进行扩容
threshold=Capacity*LoadFactor
6、执行afterNodeInsertion(evict);
默认evict=true，调用removeEldestEntry方法，但其实这个方法啥也没做

    /** 
     * <p>This implementation merely returns <tt>false</tt> (so that this
     * map acts like a normal map - the eldest element is never removed).
     */
    protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
        return false;
    }

7、return null，结束插入

Conccurent HashMap

实现原理

Java7 ：使用ReentrantLock ，结构是Segment 数组 + HashEntry 数组 + 链表
Java8 ：使用 Synchronized 锁加 CAS 的机制。结构进化成了 Node 数组 + 链表 / 红黑树，Node 是类似于一个 HashEntry 的结构。它的冲突再达到一定大小时会转化成红黑树，在冲突小于一定数量时又退回链表。

put()方法

    final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }

有几个临时变量Node<K,V> f; int n, i, fh;
1、首先判断key，value是否为空值，如果是抛出空指针异常
2、计算key的hash值
3、如果table为空，初始化table，initTable();
4-1、table[i]==null，尝试使用 CAS 直接在该位置插入新值，如果失败会重新尝试
casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null))
4-2、table[i]!=null，且(fh = f.hash) == _MOVED_，即头节点的hash值=-1，说明正在进行扩容操作，调用tab = helpTransfer(tab, f);，没有退出循环，之后会继续执行put。
4-3、table[i]!=null，且没有处在扩容状态，给数组第i个位置的节点加锁，synchronized (f)
fh>=0，结构是链表，遍历的同时计算binCount，与HashMap不同的是，并没有把需要被修改的e暂存，而是在这个循环里面直接改掉并保存oldVal值。
f instanceof TreeBin，fh=-2，结构是红黑树，不需要计算binCount。
5、如果binCount!=0（即进入了4-3），需要看下是否满足binCount >= TREEIFY_THRESHOLD，来决定是否需要修改链表结构为红黑树
6、如果oldVal!=null（即更新了节点值），return oldVal;，结束流程。
7、走到这里，说明是以下三种插入了新节点的情况

table[i]==null，使用 CAS 直接在该位置插入新值，binCount=0
table[i]!=null，遍历链表，在尾部插入新值，binCount=添加节点后链表长度
table[i]!=null，遍历红黑树，插入新值，binCount=2

调用addCount(1L, binCount);方法，1L表示添加了1个，binCount=check，check大于0的情况下需要检查是否需要扩容（没太看懂）
8、return null;结束流程。