1 高并发下的锁

1 高并发下的锁

1.1 为什么要锁？

当多个线程访问共享资源时，为了避免资源竞争而导致数据错乱的问题，都会在访问共享资源之前加锁。
加锁的目的是保证共享资源在任意时间里，只有一个线程访问。当已经有一个线程加锁后，其他线程加锁则会失效。
如果选择了错误的锁，那么在一些高并发的场景下，可能会降低系统的性能，这样用户体验就会非常差了。
所以，为了选择合适的锁，我们不仅需要清楚知道加锁的成本开销有多大，还需要分析业务场景中访问的共享资源的方式，再来还要考虑并发访问共享资源时的冲突概率。

1.2 锁的分类

1.2.1 互斥锁和自旋锁

当已经有一个线程加锁后，其他线程加锁则会失效。互斥锁和自旋锁对于加锁失败后的处理方式是不一样的：

互斥锁加锁失败后，线程会释放CPU，给其他线程（线程切换）；
自旋锁加锁失败后，线程会忙等待，直到它拿到锁；

互斥锁是一种「独占锁」，比如当线程 A 加锁成功后，此时互斥锁已经被线程 A 独占了，只要线程 A 没有释放手中的锁，线程 B 加锁就会失败，于是就会释放 CPU 让给其他线程，既然线程 B 释放掉了 CPU，自然线程 B 加锁的代码就会被阻塞。

对于互斥锁加锁失败而阻塞的现象，是由操作系统内核实现的。当加锁失败时，内核会将线程置为「睡眠」状态，等到锁被释放后，内核会在合适的时机唤醒线程，当这个线程成功获取到锁后，于是就可以继续执行。
java高并发 - 图1
互斥锁加锁失败时，会有两次线程上下文切换的成本【从阻塞到获得锁】：

当线程加锁失败时，内核会把线程的状态从「运行」状态设置为「睡眠」状态，然后把 CPU 切换给其他线程运行；
接着，当锁被释放时，之前「睡眠」状态的线程会变为「就绪」状态，然后内核会在合适的时间，把 CPU 切换给该线程运行。

上下切换的耗时有大佬统计过，大概在几十纳秒到几微秒之间，如果你锁住的代码执行时间比较短，那可能上下文切换的时间都比你锁住的代码执行时间还要长。所以，如果你能确定被锁住的代码执行时间很短，就不应该用互斥锁，而应该选用自旋锁，否则使用互斥锁（自旋锁会等到拿到锁，不会有线程上下文切换成本）。

一般加锁过程包含两步：【这两步具有原子性，要么全都执行，要么全都不执行】

第一，查看锁的状态，如果锁是空闲的，执行第二步；
将锁设置为当前线程持有；

自旋锁是最比较简单的一种锁，一直自旋，利用 CPU 周期，直到锁可用。需要注意，在单核 CPU 上，需要抢占式的调度器（即不断通过时钟中断一个线程，运行其他线程）。否则，自旋锁在单 CPU 上无法使用，因为一个自旋的线程永远不会放弃 CPU。如果被锁住的代码执行时间过长，自旋的线程会长时间占用 CPU 资源，所以自旋的时间和被锁住的代码执行的时间是成「正比」的关系。

1.2.2 读写锁

读写锁适用于能明确区分读操作和写操作的场景，在【读多写少的情况下能发挥出优势】。
工作原理：

当线程没有持有【写锁】时，那多个线程可以并发地持有读锁，这可以大大提高共享资源的访问效率。（因为「读锁」是用于读取共享资源的，所以多个线程同时持有读锁也不会破坏共享资源的数据）
但是，一旦写锁被某线程持有后，那该线程获取读锁的操作会被阻塞，而且其他的写线程获取写锁的操作也会被阻塞。

总结：写锁是独占锁，任何时候只能有一个线程持有【写锁】，类似于互斥锁和自旋锁；而读锁是共享锁，读锁可以被多个线程同时持有。

读优先锁：
读锁能被更多的线程持有，以便提高读线程的并发性，它的工作方式是：当读线程 A 先持有了读锁，写线程 B 在获取写锁的时候，会被阻塞，并且在阻塞过程中，后续来的读线程 C 仍然可以成功获取读锁，最后直到读线程 A 和 C 释放读锁后，写线程 B 才可以成功获取写锁。如下图：
java高并发 - 图2
写优先锁：
优先服务写线程，其工作方式是：当读线程 A 先持有了读锁，写线程 B 在获取写锁的时候，会被阻塞，并且在阻塞过程中，后续来的读线程 C 获取读锁时会失败，于是读线程 C 将被阻塞在获取读锁的操作，这样只要读线程 A 释放读锁后，写线程 B 就可以成功获取写锁。如下图：
java高并发 - 图3
分析读写优先锁：
读优先锁对于读线程并发性更好，但是，如果一直有读线程获取读锁，那么写线程将永远获取不到写锁，这就造成了写线程「饥饿」的现象。
写优先锁可以保证写线程不会饿死，但是如果一直有写线程获取写锁，读线程也会被「饿死」。
既然不管优先读锁还是写锁，对方可能会出现饿死问题，那么我们就不偏袒任何一方，搞个「公平读写锁」。
公平读写锁比较简单的一种方式是：用队列把获取锁的线程排队，不管是写线程还是读线程都按照先进先出的原则加锁即可，这样读线程仍然可以并发，也不会出现「饥饿」的现象。

1.3 乐观锁 & 悲观锁

悲观锁：互斥锁、自旋锁、读写锁。
悲观锁做事比较悲观，它认为多线程同时修改共享资源的概率比较高，于是很容易出现冲突，所以访问共享资源前，先要上锁。

那相反的，如果多线程同时修改共享资源的概率比较低，就可以采用乐观锁。
乐观锁的工作方式：先修改完共享资源，再验证这段时间内有没有发生冲突，如果没有其他线程在修改资源，那么操作完成，如果发现有其他线程已经修改过这个资源，就放弃本次操作。（乐观锁的心态是，不管三七二十一，先改了资源再说。另外，你会发现乐观锁全程并没有加锁，所以它也叫无锁编程。）

乐观锁虽然去除了加锁解锁的操作，但是一旦发生冲突，重试的成本非常高，所以只有在冲突概率非常低，且加锁成本非常高的场景时，才考虑使用乐观锁。

1.4 总结

互斥锁加锁失败时，会用「线程切换」来应对，当加锁失败的线程再次加锁成功后的这一过程，会有两次线程上下文切换的成本，性能损耗比较大。

如果被锁住的代码的执行时间很短，那应该选择开销时间比较小的自旋锁，因为自旋锁加锁失败后，并不会主动产生线程切换，而是一直忙等待，直到获取到锁。那么如果被锁住的代码执行时间很短，那这个忙等待的时间相对应也很短。

为了避免饥饿的问题，于是就有了公平读写锁，它是用队列把请求锁的线程排队，并保证先入先出的原则来对线程加锁，这样便保证了某种线程不会被饿死，通用性也更好点。

另外，互斥锁、自旋锁、读写锁都属于悲观锁，悲观锁认为并发访问共享资源时，冲突概率可能非常高，所以在访问共享资源前，都需要先加锁。
相反的，如果并发访问共享资源时，冲突概率非常低的话，就可以使用乐观锁，它的工作方式是，在访问共享资源时，不用先加锁，修改完共享资源后，再验证这段时间内有没有发生冲突，如果没有其他线程在修改资源，那么操作完成，如果发现有其他线程已经修改过这个资源，就放弃本次操作。但是，一旦冲突概率上升，就不适合使用乐观锁了，因为它解决冲突的重试成本非常高。