什么是CAS

CAS(Compare And Swap,比较并交换),通常指的是这样一种原子操作:针对一个变量,首先比较它的内存值与某个期望值是否相同,如果相同,就给它赋一个新值。
CAS 可以看作是它们合并后的整体——一个不可分割的原子操作,并且其原子性是直接在硬件层面得到保障的。
CAS可以看做是乐观锁(对比数据库的悲观、乐观锁)的一种实现方式,Java原子类中的递增操作就通过CAS自旋实现的。
CAS是一种无锁算法,在不使用锁(没有线程被阻塞)的情况下实现多线程之间的变量同步。

CAS应用

在 Java 中,CAS 操作是由 Unsafe 类提供支持的,该类定义了三种针对不同类型变量的 CAS 操作:
image.png
Hotspot 虚拟机对compareAndSwapInt 方法的实现如下:

  1. #unsafe.cpp
  2. UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
  3. UnsafeWrapper("Unsafe_CompareAndSwapInt");
  4. oop p = JNIHandles::resolve(obj);
  5. // 根据偏移量,计算value的地址
  6. jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);
  7. // Atomic::cmpxchg(x, addr, e) cas逻辑 x:要交换的值 e:要比较的值
  8. //cas成功,返回期望值e,等于e,此方法返回true
  9. //cas失败,返回内存中的value值,不等于e,此方法返回false
  10. return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
  11. UNSAFE_END

核心逻辑在Atomic::cmpxchg方法中,这个根据不同操作系统和不同CPU会有不同的实现。这里我们以linux_64x的为例,查看Atomic::cmpxchg的实现

  1. #atomic_linux_x86.inline.hpp
  2. inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint com pare_value) {
  3. //判断当前执行环境是否为多处理器环境
  4. int mp = os::is_MP();
  5. //LOCK_IF_MP(%4) 在多处理器环境下,为 cmpxchgl 指令添加 lock 前缀,以达到内存屏障 的效果
  6. //cmpxchgl 指令是包含在 x86 架构及 IA‐64 架构中的一个原子条件指令,
  7. //它会首先比较 dest 指针指向的内存值是否和 compare_value 的值相等,
  8. //如果相等,则双向交换 dest 与 exchange_value,否则就单方面地将 dest 指向的内存值交 给exchange_value。
  9. //这条指令完成了整个 CAS 操作,因此它也被称为 CAS 指令。
  10. __asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)"
  11. : "=a" (exchange_value)
  12. : "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
  13. : "cc", "memory");
  14. return exchange_value;
  15. }

Atomic::cmpxchg这个函数最终返回值是exchange_value,也就是说,如果cmpxchgl执行时compare_value和dest指针指向内存值相等则会使得dest指针指向内存值变成exchange_value,最终eax存的compare_value赋值给了exchange_value变量,即函数最终返回的值是原先的compare_value。此时Unsafe_CompareAndSwapInt的返回值(jint)(Atomic::cmpxchg(x, addr, e))== e就是true,表明CAS成功。如果cmpxchgl执行时compare_value和(dest)不等则会把当前dest指针指向内存的值写入eax,最终输出时赋值给exchange_value变量作为返回值,导致(jint)(Atomic::cmpxchg(x, addr, e))== e得到false,表明CAS失败。

CAS缺陷

  • 自旋 CAS 长时间地不成功,则会给 CPU 带来非常大的开销
  • 只能保证一个共享变量原子操作
  • ABA 问题

    ABA问题及其解决方案

    CAS算法实现一个重要前提需要取出内存中某时刻的数据,而在下时刻比较并替换,那么在这个时间差类会导致数据的变化。

    什么是ABA问题

    当有多个线程对一个原子类进行操作的时候,某个线程在短时间内将原子类的值A修改为B,又马上将其修改为A,此时其他线程不感知,还是会修改成功。

    ABA问题的解决方案

    数据库有个锁称为乐观锁,是一种基于数据版本实现数据同步的机制,每次修改一次数据,版本就会进行累加。同样,Java也提供了相应的原子引用类AtomicStampedReference
    image.png
    reference即我们实际存储的变量,stamp是版本,每次修改可以通过+1保证版本唯一性。这样就可以保证每次修改后的版本也会往上递增。
    补充:AtomicMarkableReference可以理解为上面AtomicStampedReference的简化版,就是不关心修改过几次,仅仅关心是否修改过。因此变量mark是boolean类型,仅记录值是否有过修改。