JavaLongAdder

前言

  • AtomicLongLongAdder都是可以实现并发计数操作。但实现方式不同,AtomicLongs是通过循环cas实 现,LongAdder是通过cas+Cell数组分散并发去实现的。
  • 两者都能支持非常大的并发,但AtomicLong在高并发下竞争比较激烈的情况下,会出现大量的cas操作失败,会造成大量的cas自旋操作,会给cpu带来巨大的消耗。
  • LongAdderAtomicLong基础上进行了优化处理。LongAdder继承了Striped64,内部维护了base和Cell数组(都是volatile),在进行操作LongAdder的时候,首先会进行base的cas操作,如果操作失败,再进行选取Cell数组的不同的元素进行操作,这样把多个线程分到不同的Cell去操作,大大减少了cas操作失败的可能性。

    源码解析

    首先看一下类的定义
    1. public class LongAdder extends Striped64 implements Serializable
    然后来看一下类的属性和方法
    LongAdder的神奇之处 - 图1
    这里让人困惑的一个问题是LongAdder中没有类似于AtomicLonggetAndIncrement()或者incrementAndGet()这样的原子操作,所以只能通过increment()方法和longValue()方法的组合来实现更新和获取的动作,然而这样不能保证这个组合操作的原子性,猜想也许LongAdder就是不具备这样的机制吧。那么就主要看一下increment()longValue()方法。
    longValue方法
    1. public long longValue() {
    2. return sum();
    3. }
    首先看一下获取值的longValue()方法,这里调用了sum()
    1. public long sum() {
    2. Cell[] as = cells; Cell a;
    3. long sum = base;
    4. if (as != null) {
    5. for (int i = 0; i < as.length; ++i) {
    6. if ((a = as[i]) != null)
    7. sum += a.value;
    8. }
    9. }
    10. return sum;
    11. }
    这里出现了一个类Cell,这个类是Striped64类的静态内部类,因此当Striped64对象初始化时并不会连带将Cell类初始化,其源码如下 ```java @sun.misc.Contended static final class Cell { volatile long value; Cell(long x) { value = x; } final boolean cas(long cmp, long val) {
    1. return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);
    }
  1. // Unsafe mechanics
  2. private static final sun.misc.Unsafe UNSAFE;
  3. private static final long valueOffset;
  4. static {
  5. try {
  6. UNSAFE = sun.misc.Unsafe.getUnsafe();
  7. Class<?> ak = Cell.class;
  8. valueOffset = UNSAFE.objectFieldOffset
  9. (ak.getDeclaredField("value"));
  10. } catch (Exception e) {
  11. throw new Error(e);
  12. }
  13. }

}

  1. 这里有一个`@sun.misc.Contended`标识非常奇怪,查了资料发现是用于解决伪共享(false sharing)问题的,这里就不深入讲解了。这个类只有一个`cas(long cmp, long val)`方法,做的事情也就是简单的CAS操作,接着来看一下cellsbase的定义,这两个属性都是Striped64中的
  2. ```java
  3. transient volatile Cell[] cells;
  4. transient volatile long base;

可以看到全部都是volatile类型的,因此都具有可见性,并且可以推测会遇到并发的操作。
回到sum()方法就很好理解了,这个方法返回的是base和cells数组中所有元素的和,这里的base像是一个初始值的作用,继续往下分析。
**increment**方法

  1. public void increment() {
  2. add(1L);
  3. }

接着分析increment()方法,可以看到该方法就是对add(long x)的封装,那么具体来分析一下这个方法

  1. public void add(long x) {
  2. Cell[] as; long b, v; int m; Cell a;
  3. if ((as = cells) != null || !casBase(b = base, b + x)) {
  4. boolean uncontended = true;
  5. if (as == null || (m = as.length - 1) < 0 ||
  6. (a = as[getProbe() & m]) == null ||
  7. !(uncontended = a.cas(v = a.value, v + x)))
  8. longAccumulate(x, null, uncontended);
  9. }
  10. }

这里重点是casBase(b = base, b + x),来看一下它做了什么

  1. final boolean casBase(long cmp, long val) {
  2. return UNSAFE.compareAndSwapLong(this, BASE, cmp, val);
  3. }

由于此处的x为1,那么该方法就是对Striped64的BASE的值进行累加并返回是否成功,顺带一提这里的BASE是base值所对应的内存偏移量,所以casBase(b = base, b + x)就是对base进行CAS操作,执行成功的话操作就结束了,那么什么时候会不成功呢,当然就是并发量大的时候,结合之前分析的longValue()方法,这里就可以得出一个结论——当并发不大的时候只对base进行更新,获取值得时候当然也只从base获取即可,这个时候其实和AtomicLong的原理几乎一模一样,看来区别就在于后面的分支,继续往下看。
首先置标志位uncontended为true,从字面意思也可以看出来uncontended意思是没有竞争的。当casBase不成功则将进入add(long x)的if分支中,分支由四部分组成中间用||连接,必须全部满足才会结束方法执行,否则进入longAccumulate(x, null, uncontended)方法,这四部分分别为

  1. as == null
  2. (m = as.length - 1) < 0
  3. (a = as[getProbe() & m]) == null
  4. !(uncontended = a.cas(v = a.value, v + x))

这里的四个条件其实并不是并列的,而是递进式的,1和2判断cells数组是否为空,3取cells数组中的任意一个元素a判断是否为空,4是对a进行cas操作并将执行结果赋值标志位uncontended。从这里可以给出第二个结论,当竞争激烈到一定程度无法对base进行累加操作时,会对cells数组中某个元素进行更新。
最后来看一下当上述条件只要有一个满足时调用的**longAccumulate(x, null, uncontended)**方法

  1. final void longAccumulate(long x, LongBinaryOperator fn,
  2. boolean wasUncontended) {
  3. int h;
  4. if ((h = getProbe()) == 0) {
  5. ThreadLocalRandom.current(); // force initialization
  6. h = getProbe(); //返回当前线程的threadLocalRandomProbe值
  7. wasUncontended = true;
  8. }
  9. boolean collide = false; // True if last slot nonempty
  10. for (;;) {
  11. Cell[] as; Cell a; int n; long v;
  12. if ((as = cells) != null && (n = as.length) > 0) {
  13. if ((a = as[(n - 1) & h]) == null) {
  14. if (cellsBusy == 0) { // cells数组中对应位置没有数据则插入新对象
  15. Cell r = new Cell(x);
  16. if (cellsBusy == 0 && casCellsBusy()) {
  17. boolean created = false;
  18. try { // Recheck under lock
  19. Cell[] rs; int m, j;
  20. if ((rs = cells) != null &&
  21. (m = rs.length) > 0 &&
  22. rs[j = (m - 1) & h] == null) {
  23. rs[j] = r;
  24. created = true;
  25. }
  26. } finally {
  27. cellsBusy = 0;
  28. }
  29. if (created)
  30. break;
  31. continue; // Slot is now non-empty
  32. }
  33. }
  34. collide = false;
  35. }
  36. else if (!wasUncontended) // CAS already known to fail
  37. wasUncontended = true; // Continue after rehash
  38. else if (a.cas(v = a.value, ((fn == null) ? v + x :
  39. fn.applyAsLong(v, x)))) //对该位置的cell元素进行累加
  40. break;
  41. else if (n >= NCPU || cells != as)
  42. collide = false; // At max size or stale //判断数组大小是否大于核数
  43. else if (!collide)
  44. collide = true;
  45. else if (cellsBusy == 0 && casCellsBusy()) { //对cells数组进行扩容,直接扩容为2倍
  46. try {
  47. if (cells == as) { // Expand table unless stale
  48. Cell[] rs = new Cell[n << 1];
  49. for (int i = 0; i < n; ++i)
  50. rs[i] = as[i];
  51. cells = rs;
  52. }
  53. } finally {
  54. cellsBusy = 0;
  55. }
  56. collide = false;
  57. continue; // Retry with expanded table
  58. }
  59. h = advanceProbe(h);
  60. }
  61. else if (cellsBusy == 0 && cells == as && casCellsBusy()) { //cellsBusy这里是做为一个自旋锁来使用的
  62. boolean init = false;
  63. try { // 初始化cells数组大小为2
  64. if (cells == as) {
  65. Cell[] rs = new Cell[2];
  66. rs[h & 1] = new Cell(x);
  67. cells = rs;
  68. init = true;
  69. }
  70. } finally {
  71. cellsBusy = 0;
  72. }
  73. if (init)
  74. break;
  75. }
  76. else if (casBase(v = base, ((fn == null) ? v + x :
  77. fn.applyAsLong(v, x)))) //对base进行CAS操作
  78. break; // Fall back on using base
  79. }
  80. }

这个方法比较长,大致对几个关键点做了注释,该方法主要是用一个死循环对cells数组中的元素进行操作,当要更新的位置的元素为空时插入新的cell元素,否则在该位置进行CAS的累加操作,如果CAS操作失败并且数组大小没有超过核数就扩容cells数组。

总结

LongAdder类与AtomicLong类的区别在于高并发时前者将对单一变量的CAS操作分散为对数组cells中多个元素的CAS操作,取值时进行求和;而在并发较低时仅对base变量进行CAS操作,与AtomicLong类原理相同。不得不说这种分布式的设计还是很巧妙的。