1 高并发下的锁

1.1 为什么要锁?

当多个线程访问共享资源时,为了避免资源竞争而导致数据错乱的问题,都会在访问共享资源之前加锁。
加锁的目的是保证共享资源在任意时间里,只有一个线程访问。当已经有一个线程加锁后,其他线程加锁则会失效。
如果选择了错误的锁,那么在一些高并发的场景下,可能会降低系统的性能,这样用户体验就会非常差了。
所以,为了选择合适的锁,我们不仅需要清楚知道加锁的成本开销有多大,还需要分析业务场景中访问的共享资源的方式,再来还要考虑并发访问共享资源时的冲突概率。

1.2 锁的分类

1.2.1 互斥锁和自旋锁

当已经有一个线程加锁后,其他线程加锁则会失效。互斥锁和自旋锁对于加锁失败后的处理方式是不一样的:

  • 互斥锁加锁失败后,线程会释放CPU,给其他线程(线程切换);
  • 自旋锁加锁失败后,线程会忙等待,直到它拿到锁;

互斥锁是一种「独占锁」,比如当线程 A 加锁成功后,此时互斥锁已经被线程 A 独占了,只要线程 A 没有释放手中的锁,线程 B 加锁就会失败,于是就会释放 CPU 让给其他线程,既然线程 B 释放掉了 CPU,自然线程 B 加锁的代码就会被阻塞。

对于互斥锁加锁失败而阻塞的现象,是由操作系统内核实现的。当加锁失败时,内核会将线程置为「睡眠」状态,等到锁被释放后,内核会在合适的时机唤醒线程,当这个线程成功获取到锁后,于是就可以继续执行。
java高并发 - 图1
互斥锁加锁失败时,会有两次线程上下文切换的成本【从阻塞到获得锁】:

  • 当线程加锁失败时,内核会把线程的状态从「运行」状态设置为「睡眠」状态,然后把 CPU 切换给其他线程运行;
  • 接着,当锁被释放时,之前「睡眠」状态的线程会变为「就绪」状态,然后内核会在合适的时间,把 CPU 切换给该线程运行。

上下切换的耗时有大佬统计过,大概在几十纳秒到几微秒之间,如果你锁住的代码执行时间比较短,那可能上下文切换的时间都比你锁住的代码执行时间还要长。所以,如果你能确定被锁住的代码执行时间很短,就不应该用互斥锁,而应该选用自旋锁,否则使用互斥锁(自旋锁会等到拿到锁,不会有线程上下文切换成本)

一般加锁过程包含两步:【这两步具有原子性,要么全都执行,要么全都不执行】

  • 第一,查看锁的状态,如果锁是空闲的,执行第二步;
  • 将锁设置为当前线程持有;

自旋锁是最比较简单的一种锁,一直自旋,利用 CPU 周期,直到锁可用。需要注意,在单核 CPU 上,需要抢占式的调度器(即不断通过时钟中断一个线程,运行其他线程)。否则,自旋锁在单 CPU 上无法使用,因为一个自旋的线程永远不会放弃 CPU。如果被锁住的代码执行时间过长,自旋的线程会长时间占用 CPU 资源,所以自旋的时间和被锁住的代码执行的时间是成「正比」的关系。

1.2.2 读写锁

读写锁适用于能明确区分读操作和写操作的场景,在【读多写少的情况下能发挥出优势】。
工作原理:

  • 当线程没有持有【写锁】时,那多个线程可以并发地持有读锁,这可以大大提高共享资源的访问效率。(因为「读锁」是用于读取共享资源的,所以多个线程同时持有读锁也不会破坏共享资源的数据)
  • 但是,一旦写锁被某线程持有后,那该线程获取读锁的操作会被阻塞,而且其他的写线程获取写锁的操作也会被阻塞。

总结:写锁是独占锁,任何时候只能有一个线程持有【写锁】,类似于互斥锁和自旋锁;而读锁是共享锁,读锁可以被多个线程同时持有。

读优先锁:
读锁能被更多的线程持有,以便提高读线程的并发性,它的工作方式是:当读线程 A 先持有了读锁,写线程 B 在获取写锁的时候,会被阻塞,并且在阻塞过程中,后续来的读线程 C 仍然可以成功获取读锁,最后直到读线程 A 和 C 释放读锁后,写线程 B 才可以成功获取写锁。如下图:
java高并发 - 图2
写优先锁:
优先服务写线程,其工作方式是:当读线程 A 先持有了读锁,写线程 B 在获取写锁的时候,会被阻塞,并且在阻塞过程中,后续来的读线程 C 获取读锁时会失败,于是读线程 C 将被阻塞在获取读锁的操作,这样只要读线程 A 释放读锁后,写线程 B 就可以成功获取写锁。如下图:
java高并发 - 图3
分析读写优先锁:
读优先锁对于读线程并发性更好,但是,如果一直有读线程获取读锁,那么写线程将永远获取不到写锁,这就造成了写线程「饥饿」的现象。
写优先锁可以保证写线程不会饿死,但是如果一直有写线程获取写锁,读线程也会被「饿死」。
既然不管优先读锁还是写锁,对方可能会出现饿死问题,那么我们就不偏袒任何一方,搞个「公平读写锁」。
公平读写锁比较简单的一种方式是:用队列把获取锁的线程排队,不管是写线程还是读线程都按照先进先出的原则加锁即可,这样读线程仍然可以并发,也不会出现「饥饿」的现象。

1.3 乐观锁 & 悲观锁

悲观锁:互斥锁、自旋锁、读写锁。
悲观锁做事比较悲观,它认为多线程同时修改共享资源的概率比较高,于是很容易出现冲突,所以访问共享资源前,先要上锁

那相反的,如果多线程同时修改共享资源的概率比较低,就可以采用乐观锁
乐观锁的工作方式:先修改完共享资源,再验证这段时间内有没有发生冲突,如果没有其他线程在修改资源,那么操作完成,如果发现有其他线程已经修改过这个资源,就放弃本次操作。(乐观锁的心态是,不管三七二十一,先改了资源再说。另外,你会发现乐观锁全程并没有加锁,所以它也叫无锁编程。)

乐观锁虽然去除了加锁解锁的操作,但是一旦发生冲突,重试的成本非常高,所以只有在冲突概率非常低,且加锁成本非常高的场景时,才考虑使用乐观锁。

1.4 总结

互斥锁加锁失败时,会用「线程切换」来应对,当加锁失败的线程再次加锁成功后的这一过程,会有两次线程上下文切换的成本,性能损耗比较大。

如果被锁住的代码的执行时间很短,那应该选择开销时间比较小的自旋锁,因为自旋锁加锁失败后,并不会主动产生线程切换,而是一直忙等待,直到获取到锁。那么如果被锁住的代码执行时间很短,那这个忙等待的时间相对应也很短。

为了避免饥饿的问题,于是就有了公平读写锁,它是用队列把请求锁的线程排队,并保证先入先出的原则来对线程加锁,这样便保证了某种线程不会被饿死,通用性也更好点。

另外,互斥锁、自旋锁、读写锁都属于悲观锁,悲观锁认为并发访问共享资源时,冲突概率可能非常高,所以在访问共享资源前,都需要先加锁。
相反的,如果并发访问共享资源时,冲突概率非常低的话,就可以使用乐观锁,它的工作方式是,在访问共享资源时,不用先加锁,修改完共享资源后,再验证这段时间内有没有发生冲突,如果没有其他线程在修改资源,那么操作完成,如果发现有其他线程已经修改过这个资源,就放弃本次操作。但是,一旦冲突概率上升,就不适合使用乐观锁了,因为它解决冲突的重试成本非常高。