https://www.cnblogs.com/jajian/p/11442929.html

1. 线程池的 ctl

  1. ctl 是线程池源码中常常用到的一个变量。
  2. 它的主要作用是记录线程池的生命周期状态和当前工作的线程数
  3. 作者通过巧妙的设计,将一个整型变量按二进制位分成两部分,分别表示两个信息。

1.1 声明与初始化

源码:

  1. private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));

分析一波:

  1. ctl (线程池控制状态)是原子整型的,这意味这对它进行的操作具有原子性。
  2. 因此作为 ctl 组成部分的 runState (线程池生命周期状态) 和 workerCount (工作线程数) 也将同时具有原子性。
  3. ThreadPoolExecutor 使用 ctlOf 方法来将 runStateworkerCount 两个变量(都是整型) 打包成一个 ctl 变量。稍后将解读这个方法的实现。

1.2. 两个工具人常量 COUNT_BITSCAPACITY

源码:

  1. private static final int COUNT_BITS = Integer.SIZE - 3; // 29
  2. private static final int CAPACITY = (1 << COUNT_BITS) - 1; // 00011111 11111111 11111111 11111111

分析一波:

  1. COUNT_BITS 常量的值为 Integer.SIZE - 3(29) ,其中 Integer.SIZE 为整型最大位数,取其为 32 。
  2. 如此 COUNT_BITS 实际的值其实就是 29 。(因为线程池的状态有 5 个,需要 3 位去表示)
  3. CAPACITY 常量的值为 (1 << COUNT_BITS) - 1 ,其中 << 为左移运算符,这么说可能不太直观,我以二进制直接写出这个数将有助于理解:
  1. 00000000 00000000 00000000 00000001 << 29 - 1 00011111 11111111 11111111 11111111
  1. 因此在接下来的代码中, **COUNT_BITS**(即 29) 就用来表示分隔 **runState****workerCount** 的位数
  2. **CAPACITY** 则作为取这两个变量 ( **runState****workerCount** ) 的工具(具体是怎么使用的请看下文)

2. 线程池生命周期状态常量

源码:

  1. private static final int RUNNING = -1 <<COUNT_BITS;
  2. private static final int SHUTDOWN = 0 <<COUNT_BITS;
  3. private static final int STOP = 1 <<COUNT_BITS;
  4. private static final int TIDYING = 2 <<COUNT_BITS;
  5. private static final int TERMINATED = 3 << COUNT_BITS;
  1. RUNNING: 111 00000000000000000000000000000
  2. SHUTDOWN: 000 00000000000000000000000000000
  3. STOP: 001 00000000000000000000000000000
  4. TIDYING: 010 00000000000000000000000000000
  5. TERMINATED: 011 00000000000000000000000000000

分析一波:

  1. 这里解答了上边关于 COUNT_BITS 变量为什么要减 3 的问题:因为线程池的生命周期有 5 个状态,为了表达这 5 个状态,我们需要 3 个二进制位。
  2. 注意到这里标注状态使用的并不是 -1 ~ 3 ,而是这 5 个数字分别左移 COUNT_BITS 位,这样做的好处将在接下来的代码中得到体现。

3. 打包函数与拆包函数

源码:

  1. // capacity:00011111 11111111 11111111 11111111
  2. //拆包函数
  3. private static int runStateOf(int c) { return c & ~CAPACITY; }
  4. private static int workerCountOf(int c) { return c & CAPACITY; }
  5. //打包函数
  6. private static int ctlOf(int rs, int wc) { return rs | wc; }

分析一波:

  1. 此处我们解答了 **CAPACITY = 00011111 11111111 11111111 11111111** 常量的作用,他是一个后 29 位均为 1 ,前 3 位为 0 的整数,因此我们可以通过:
    1. 对 CAPACITY 和 ctl 进行 **&** (按位与)操作就能取到 ctl 的后 29 位,即 **workerCount**
    2. 对 CAPACITY 进行 **~** (按位取反)操作后,再和 ctl 进行 **&** 操作就能取到 **runState** 。它的高 3 位是 ctl 的高 3 位,低 29 位为 0。这也解释了为什么之前提到的生命周期常量要在 -1 ~ 3 的基础上再左移 29 位,因为不在常量初始化处左移的话就要在拆包的时候右移来保证取到的是正确的数值。然而拆包操作是要经常进行的,而常量的初始化只有一次。两下对比,明显在初始化时左移是效率更高的选择。
  2. 除了拆包时的效率,常量初始化时左移也提高了打包函数的效率:此处打包函数可以直接对 runState 和 workerCount 进行 | (按位或) 操作来得到 ctl 变量,就是因为 runState 的高 3 位为有效信息,而 workerCount 的低 29 位为有效信息,合起来正好得到一个含 32 位有效信息的整型变量。
  3. 说到这里可能仍有些让人疑惑,我将再以二进制的形式表示出所有涉及到的变量/常量:
  1. //下文中a和b分别代表runState和workerCount的有效信息
  2. //CAPACITY
  3. 0001 1111 1111 1111
  4. //ctl
  5. aaab bbbb bbbb bbbb
  6. //runState
  7. aaa0 0000 0000 0000
  8. //workerCount
  9. 000b bbbb bbbb bbbb

4. 运行状态的判断

源码:

  1. private static boolean runStateLessThan(int c, int s) {return c < s;}
  2. private static boolean runStateAtLeast(int c, int s) {return c >= s;}
  3. private static boolean isRunning(int c) {return c < SHUTDOWN;}

分析一波:

  1. 注意这里传入的s是用了之前定义的生命周期常量。
  2. 这里判断状态的大小时,直接将 c 和 s 进行了比较,这是因为代表状态的信息占据了两个变量的高 3 位,而比较高位的大小时,低位是没有影响的。

5. 修改 ctl 中 workCount 的大小

  1. /**
  2. * 尝试通过 cas 方式增加 ctl 中的 工作线程数
  3. */
  4. private boolean compareAndIncrementWorkerCount(int expect) {
  5. return ctl.compareAndSet(expect, expect + 1);
  6. }
  7. /**
  8. * 尝试通过 cas 方式减少 ctl 中的 工作线程数
  9. */
  10. private boolean compareAndDecrementWorkerCount(int expect) {
  11. return ctl.compareAndSet(expect, expect - 1);
  12. }
  13. /**
  14. * 递减 ctl 的 workerCount 字段. 仅在调用线程突然中止时(see processWorkerExit)
  15. */
  16. private void decrementWorkerCount() {
  17. do {} while (! compareAndDecrementWorkerCount(ctl.get()));
  18. }

注意到这里的修改都使用了原子整型的 CAS 方法。

6. 修改 ctl 中 runState 的大小

  1. ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))))

注意到修改 runState 并没有再提供专门的方法,而是直接使用了原子整型的 CAS 方法来替换原来的 ctl 。

7. 仍存在的疑问

  • Q1:如果经过递增 compareAndIncrementWorkerCount ,使得 workerCount 的大小超过29位,会发生什么?会有安全检查吗?
  • A1:有安全检查,在ThreadPoolExecutor 类的 addWorker 方法中有这样一行代码:
  1. if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize))
  2. return false;

8. threadPoolExecutor.execute

  1. public void execute(Runnable command) {
  2. // 1. 进行任务的非空校验
  3. if (command == null)
  4. throw new NullPointerException();
  5. // 2. 添加核心线程执行任务
  6. int c = ctl.get();
  7. if (workerCountOf(c) < corePoolSize) {
  8. if (addWorker(command, true))
  9. return;
  10. c = ctl.get();
  11. }
  12. // 3. 任务入队列 (会把逻辑判断和逻辑返回 true 后的执行(workQueue.offer(command))一并放到 if 里面)
  13. // 如果任务队列满了,workQueue.offer(command) 返回 false,否则插入队列
  14. if (isRunning(c) && workQueue.offer(command)) {
  15. int recheck = ctl.get();
  16. // 二次校验(如果没有在运行中,就从队列删除,然后执行拒绝策略)
  17. if (! isRunning(recheck) && remove(command))
  18. reject(command);
  19. // 如果线程池中没有线程了,开启一个新的线程执行任务(上边已经把任务放入队列中了,所以 commend 为 null)
  20. else if (workerCountOf(recheck) == 0)
  21. addWorker(null, false);
  22. }
  23. // 4. 添加普通线程执行任务,如果失败则执行拒绝策略
  24. else if (!addWorker(command, false))
  25. reject(command);
  26. }
  • 任务的非空校验。
  • 获取当前 RUNNING 的线程数,如果小于核心线程数,则创建核心线程去执行任务,否则走 #3。
  • 如果当前线程池处于 RUNNING 状态,那么就将任务放入队列中。这时还会再做个双重校验,因为可能存在有些线程在我们上次检查后死了,或者从我们进入这个方法后 pool 被关闭了,所以我们需要再次检查 state。如果线程池停止了就需要回滚刚才的添加任务到队列中的操作并通过拒绝策略拒绝该任务,或者如果池中没有线程了,则新开启一个线程执行任务。
  • 如果队列满了之后无法在将任务加入队列,则创建新的线程去执行任务,如果也失败了,那么就可能是线程池关闭了或者线程池饱和了,这时执行拒绝策略不再接受任务。

双重校验中有以下两个点需要注意:

  1. 为什么需要 double check 线程池的状态?

在多线程环境下,线程池的状态时刻在变化,而 ctl.get() 是非原子操作,很有可能刚获取了线程池状态后线程池状态就改变了。判断是否将 command 加入 workque 是线程池之前的状态。倘若没有 double check,万一线程池处于非 running 状态(在多线程环境下很有可能发生),那么 command 永远不会执行。

  1. 为什么 addWorker(null, false) 的任务为 null?

addWorker(null, false),这个方法执行时只是创建了一个新的线程,但是没有传入任务,这是因为前面已经将任务添加到队列中了

代码流程图:
image.png
以上的源码其实只有 10 几行,看起来很简单,主要是它的封装性比较好,其中主要有两个点需要重点解释,分别是:线程池的状态addWorker() 添加工作的方法,这两个点弄明白了这段线程池的源码差不多也就理解了。

线程池运行状态-runState

线程有状态,线程池也有它的运行状态,这些状态提供了主生命周期控制,伴随着线程池的运行,由内部来维护,从源码中我们可以发现线程池共有5个状态:RUNNINGSHUTDOWNSTOPTIDYINGTERMINATED
各状态值所代表的的含义和该状态值下可执行的操作,具体信息如下:

运行状态 状态描述
RUNNING 接收新任务,并且也能处理阻塞队列中的任务。
SHUTDOWN 不接收新任务,但是却可以继续处理阻塞队列中的任务。
STOP 不接收新任务,同时也不处理队列任务,并且中断正在进行的任务。
TIDYING 所有任务都已终止,workercount (有效线程数) 为0,线程转向 TIDYING 状态将会运行 terminated() 钩子方法。
TERMINATED terminated() 方法调用完成后变成此状态。

生命周期状态流转如下图所示:
线程池源码解析 - 图2
很多时候我们表示状态都是通过简单的 int 值来表示,例如数据库数据的删除标志 delete_flag 其中 0 表示有效,1 表示删除。而在线程池的源码里我们可以看到它是通过如下方式来进行表示的,

  1. private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
  2. private static final int COUNT_BITS = Integer.SIZE - 3;
  3. private static final int CAPACITY = (1 << COUNT_BITS) - 1;
  4. // runState is stored in the high-order bits
  5. private static final int RUNNING = -1 << COUNT_BITS;
  6. private static final int SHUTDOWN = 0 << COUNT_BITS;
  7. private static final int STOP = 1 << COUNT_BITS;
  8. private static final int TIDYING = 2 << COUNT_BITS;
  9. private static final int TERMINATED = 3 << COUNT_BITS;

线程池内部使用一个变量维护两个值:运行状态(runState)和线程数量 (workerCount)何做到的呢?将十进制 int 值转换为二进制的值,共32位,其中高 3 位代表运行状态(runState ),而低 29 位代表工作线程数(workerCount)。
线程池源码解析 - 图3
关于内部封装的获取生命周期状态、获取线程池线程数量的计算方法如以下代码所示:

  1. //获取线程池状态
  2. private static int runStateOf(int c) { return c & ~CAPACITY; }
  3. //获取线程数量
  4. private static int workerCountOf(int c) { return c & CAPACITY; }
  5. // Packing and unpacking ctl → 将 runState 和 workerCount 两个变量(都是整型)打包成一个 ctl 变量
  6. private static int ctlOf(int rs, int wc) { return rs | wc; }

通过巧妙的位运算可以分别获取高 3 位的运行状态值低 29 位的线程数量值

9. 添加工作线程-addWorker

添加线程是通过 addWorker() 方法来实现的,这个方法有两个入参,Runnable firstTaskboolean core

  1. private boolean addWorker(Runnable firstTask, boolean core){...}
  • Runnable firstTask 即是当前添加的线程需要执行的首个任务.
  • boolean core 用来标记当前执行的线程是否是核心线程还是普通线程.

返回前面的线程池的 execute() 方法的代码中,可以发现这个addWorker() 有三个地方在调用,分别在 #2,#3和#4。

  • 2:当工作线程数 < 核心线程数的时候,通过 addWorker(command, true) 添加核心线程执行 command 任务。

  • 3:double check 的时候,如果发现线程池处于正常运行状态但是里面没有工作线程,则添加个空任务和一个普通线程,这样一个 task 为空的 worker 在线程执行的时候会去阻塞任务队列里拿任务,这样就相当于创建了一个新的线程,只是没有马上分配任务。

  • 4:队列已满的情况下,通过添加普通线程(非核心线程)去执行当前任务,如果失败了则执行拒绝策略。

**addWorker()** 方法调用的地方我们看完了,接下来我们一起来看下它里面究竟做了些什么,源码如下:

  1. private boolean addWorker(Runnable firstTask, boolean core) {
  2. retry:
  3. for (;;) {
  4. int c = ctl.get();
  5. int rs = runStateOf(c);
  6. // Check if queue empty only if necessary.
  7. if (rs >= SHUTDOWN &&
  8. ! (rs == SHUTDOWN &&
  9. firstTask == null &&
  10. ! workQueue.isEmpty()))
  11. return false;
  12. for (;;) {
  13. int wc = workerCountOf(c);
  14. if (wc >= CAPACITY ||
  15. wc >= (core ? corePoolSize : maximumPoolSize))
  16. return false;
  17. if (compareAndIncrementWorkerCount(c))
  18. break retry;
  19. c = ctl.get(); // Re-read ctl
  20. if (runStateOf(c) != rs)
  21. continue retry;
  22. // else CAS failed due to workerCount change; retry inner loop
  23. }
  24. }
  25. boolean workerStarted = false;
  26. boolean workerAdded = false;
  27. Worker w = null;
  28. try {
  29. w = new Worker(firstTask);
  30. final Thread t = w.thread;
  31. if (t != null) {
  32. final ReentrantLock mainLock = this.mainLock;
  33. mainLock.lock();
  34. try {
  35. // Recheck while holding lock.
  36. // Back out on ThreadFactory failure or if
  37. // shut down before lock acquired.
  38. int rs = runStateOf(ctl.get());
  39. if (rs < SHUTDOWN ||
  40. (rs == SHUTDOWN && firstTask == null)) {
  41. if (t.isAlive()) // precheck that t is startable
  42. throw new IllegalThreadStateException();
  43. workers.add(w);
  44. int s = workers.size();
  45. if (s > largestPoolSize)
  46. largestPoolSize = s;
  47. workerAdded = true;
  48. }
  49. } finally {
  50. mainLock.unlock();
  51. }
  52. if (workerAdded) {
  53. t.start();
  54. workerStarted = true;
  55. }
  56. }
  57. } finally {
  58. if (! workerStarted)
  59. addWorkerFailed(w);
  60. }
  61. return workerStarted;
  62. }

这个方法稍微有点长,我们分段来看下,将上面的代码我们拆分成两个部分来看,首先看第一部分:

  1. retry:
  2. for (;;) {
  3. int c = ctl.get();
  4. int rs = runStateOf(c);//获取线程池的状态
  5. // Check if queue empty only if necessary.
  6. if (rs >= SHUTDOWN &&
  7. ! (rs == SHUTDOWN &&
  8. firstTask == null &&
  9. ! workQueue.isEmpty()))
  10. return false;
  11. for (;;) {
  12. int wc = workerCountOf(c);
  13. if (wc >= CAPACITY ||
  14. wc >= (core ? corePoolSize : maximumPoolSize))
  15. return false;
  16. // 尝试通过CAS方式增加workerCount
  17. if (compareAndIncrementWorkerCount(c))
  18. break retry;
  19. c = ctl.get(); // Re-read ctl
  20. // 如果线程池状态发生变化,重新从最外层循环
  21. if (runStateOf(c) != rs)
  22. continue retry;
  23. // else CAS failed due to workerCount change; retry inner loop
  24. }
  25. }

这部分代码有两层嵌套的 for 死循环,在第一行有个retry:代码,这个也许有些同学没怎么见过,这个是相当于是一个位置标记,retry后面跟循环,标记这个循环的位置。

我们平时写 for 循环的时候,是通过 continue;break; 来跳出当前循环,但是如果我们有多重嵌套的 for 循环,如果我们想在里层的某个循环体中当达到某个条件的时候直接跳出所有循环或跳出到某个指定的位置,则使用retry:来标记这个位置就可以了,之后跳转到这个位置时用 continue retry

代码中共有4个位置有改变循环体继续执行下去,分别是两个return false;,一个break retry;和一个continue retry;

首先我们来看下第一个 **return false;**,这个 return 在最外层的一个 for 循环,

  1. if (rs >= SHUTDOWN && !(rs == SHUTDOWN && firstTask == null && ! workQueue.isEmpty()))
  2. return false;

这是一个判断线程池状态和线程队列情况的代码,这个逻辑判断有点绕可以改成

  1. rs >= shutdown && (rs != shutdown || firstTask != null || workQueue.isEmpty())

这样就好理解了,逻辑判断成立可以分为以下几种情况直接返回 false,表示添加工作线程失败。

  • rs > shutdown : 线程池状态处于 STOPTIDYINGTERMINATED时,添加工作线程失败,不接受新任务。
  • rs >= shutdown && firstTask != null:线程池状态处于 SHUTDOWNSTOPTIDYINGTERMINATED 状态且 worker 的首个任务不为空时,添加工作线程失败,不接受新任务。
  • rs >= shutdown && workQueue.isEmpty:线程池状态处于 SHUTDOWNSTOPTIDYINGTERMINATED 状态且阻塞队列为空时,添加工作线程失败,不接受新任务。

    线程池处于 shutdown 且 队列任务不为空时,可以执行 addWork

这样看来,最外层的 for 循环是不断的校验当前的线程池状态是否能接受新任务,如果校验通过了之后才能继续往下运行。
然后接下来看第二个**return false;**,这个 return 是在内层的第二个 for 循环中,是判断线程池中当前的工作线程数量的,不满足条件的话直接返回 false,表示添加工作线程失败。

  • 工作线程数量是否超过可表示的最大容量(CAPACITY).
  • 如果添加核心工作线程,是否超过最大核心线程容量(corePoolSize).
  • 如果添加普通工作线程,是否超过线程池最大线程容量(maximumPoolSize).

后面的 **break retry;** ,表示如果尝试通过 CAS 方式增加工作线程数 workerCount 成功,则跳出这个双循环,往下执行后面第二部分的代码
continue retry; 是再次校验下线程池状态是否发生变化,如果发生了变化则重新从最外层 for 开始继续循环执行。

通过第一部分代码的解析,我们发现只有 break retry; 的时候才能执行到后面第二部分的代码,而后面第二部分代码做了些什么呢?

  1. boolean workerStarted = false;
  2. boolean workerAdded = false;
  3. Worker w = null;
  4. try {
  5. //创建 Worker 对象实例
  6. w = new Worker(firstTask);
  7. //获取 Worker 对象里的线程
  8. final Thread t = w.thread;
  9. if (t != null) {
  10. //开启可重入锁,独占
  11. final ReentrantLock mainLock = this.mainLock;
  12. mainLock.lock();
  13. try {
  14. // Recheck while holding lock.
  15. // Back out on ThreadFactory failure or if
  16. // shut down before lock acquired.
  17. //获取线程池运行状态
  18. int rs = runStateOf(ctl.get());
  19. //满足 rs < SHUTDOWN 判断线程池是否是RUNNING,或者
  20. //rs == SHUTDOWN && firstTask == null 线程池如果是SHUTDOWN,且首个任务firstTask 为空,
  21. if (rs < SHUTDOWN ||
  22. (rs == SHUTDOWN && firstTask == null)) {
  23. if (t.isAlive()) // precheck that t is startable
  24. throw new IllegalThreadStateException();
  25. //将Worker实例加入线程池 workers
  26. workers.add(w);
  27. int s = workers.size();
  28. if (s > largestPoolSize)
  29. largestPoolSize = s;
  30. //线程添加成功标志位 -> true
  31. workerAdded = true;
  32. }
  33. } finally {
  34. //释放锁
  35. mainLock.unlock();
  36. }
  37. //如果worker实例加入线程池成功,则启动线程,同时修改线程启动成功标志位 -> true
  38. if (workerAdded) {
  39. t.start();
  40. workerStarted = true;
  41. }
  42. }
  43. } finally {
  44. if (! workerStarted)
  45. //添加线程失败
  46. addWorkerFailed(w);
  47. }
  48. return workerStarted;

这部分代码主要的目的其实就是启动一个线程,前面是一堆的条件判断,看是否能够启动一个工作线程。它由两个try...catch...finally 内容组成,可以将他们拆开来看,这样就很容易看懂。

我们先看里面一层的 try...catch...finally,当 Worker 实例中的 Thread 线程不为空的时候,开启一个独占锁 ReentrantLock mainLock,防止其他线程也来修改操作。

  1. try {
  2. //获取线程池运行状态
  3. int rs = runStateOf(ctl.get());
  4. if (rs < SHUTDOWN ||
  5. (rs == SHUTDOWN && firstTask == null)) {
  6. if (t.isAlive()) // precheck that t is startable
  7. throw new IllegalThreadStateException();
  8. workers.add(w);
  9. int s = workers.size();
  10. if (s > largestPoolSize)
  11. largestPoolSize = s;
  12. workerAdded = true;
  13. }
  14. } finally {
  15. mainLock.unlock();
  16. }
  • 首先检查线程池的状态,当线程池处于 RUNNING 状态或者线程池处于 SHUTDOWN 状态但是当前线程的 firstTask 为空,满足以上条件时才能将 worker 实例添加进线程池,即 workers.add(w);
  • 同时修改 largestPoolSize,largestPoolSize 变量用于记录出现过的最大线程数。
  • 将标志位 workerAdded 设置为 true,表示添加工作线程成功。
  • 无论成功与否,在 finally 中都必须执行 mainLock.unlock()来释放锁。

外面一层的try...catch...finally主要是为了判断工作线程是否启动成功,如果内层 try...catch...finally 代码执行成功,即 worker 添加进线程池成功,workerAdded 标志位置为 true,则启动 worker 中的线程 t.start(),同时将标志位 workerStarted 置为 true,表示线程启动成功。

  1. if (workerAdded) {
  2. t.start();
  3. workerStarted = true;
  4. }

如果失败了,即 workerStarted == false,则在 finally 里面必须执行 addWorkerFailed(w) 方法,这个方法相当于是用来回滚操作的,前面增的这里移除,前面加的这里减去。

  1. private void addWorkerFailed(Worker w) {
  2. final ReentrantLock mainLock = this.mainLock;
  3. mainLock.lock();
  4. try {
  5. if (w != null)
  6. //从线程池中移除worker实例
  7. workers.remove(w);
  8. //通过CAS,将工作线程数量workerCount减1
  9. decrementWorkerCount();
  10. // 转换到 TERMINATED 状态
  11. tryTerminate();
  12. } finally {
  13. mainLock.unlock();
  14. }
  15. }

tryTeminate.java

  1. final void tryTerminate() {
  2. for (;;) {
  3. int c = ctl.get();
  4. if (isRunning(c) ||
  5. runStateAtLeast(c, TIDYING) ||
  6. (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
  7. return;
  8. if (workerCountOf(c) != 0) { // Eligible to terminate
  9. // 终端空闲线程
  10. interruptIdleWorkers(ONLY_ONE);
  11. return;
  12. }
  13. final ReentrantLock mainLock = this.mainLock;
  14. mainLock.lock();
  15. try {
  16. if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
  17. try {
  18. terminated(); // 钩子函数
  19. } finally {
  20. ctl.set(ctlOf(TERMINATED, 0));
  21. termination.signalAll();
  22. }
  23. return;
  24. }
  25. } finally {
  26. mainLock.unlock();
  27. }
  28. // else retry on failed CAS
  29. }
  30. }

如果(SHUTDOWN 状态,并且线程池和队列为空)或(STOP 状态并且池为空),则转换到 TERMINATED 状态。
如果有资格终止但 workerCount 非零,则中断空闲的工作程序以确保关闭信号传播。
必须在任何可能使终止成为可能的操作之后调用此方法
— 在关闭期间减少工作线程数或从队列中删除任务。该方法是非私有的,允许从 ScheduledThreadPoolExecutor 访问。

10. Worker类

上面我们分析了addWorker 方法的源码,并且看到了 Thread t = w.threadworkers.add(w)t.start()等代码,知道了线程池的运行状态和添加工作线程的流程,那么我们还有一些疑问:

  • 这里的 Worker 是什么?和 Thread 有什么区别?
  • 线程启动后是如何拿任务?在哪拿任务去执行的?
  • 阻塞队列满后,额外新创建的线程是去队列里拿任务的吗?如果不是那它是去哪拿的?
  • 核心线程会一直存在于线程池中吗?额外创建的普通线程执行完任务后会销毁吗?

**Worker**ThreadPoolExecutor 的一个内部类,主要是用来维护线程执行任务的中断控制状态,它实现了 Runnable 接口同时继承了 AQS,实现 Runnable 接口意味着 Worker 就是一个线程,继承 AQS 是为了实现独占锁这个功能。

  1. private final class Worker
  2. extends AbstractQueuedSynchronizer
  3. implements Runnable
  4. {
  5. /** Thread this worker is running in. Null if factory fails. */
  6. final Thread thread;
  7. /** Initial task to run. Possibly null. */
  8. Runnable firstTask;
  9. /** Per-thread task counter */
  10. volatile long completedTasks;
  11. //构造函数,初始化AQS的state值为-1
  12. Worker(Runnable firstTask) {
  13. setState(-1); // inhibit interrupts until runWorker
  14. this.firstTask = firstTask;
  15. this.thread = getThreadFactory().newThread(this);
  16. }
  17. }

至于为什么没有使用可重入锁 ReentrantLock,而是使用 AQS,为的就是实现不可重入的特性去反应线程现在的执行状态。

  1. lock 方法一旦获取了独占锁,表示当前线程正在执行任务中。
  2. 如果正在执行任务,则不应该中断线程。
  3. 如果该线程现在不是独占锁的状态,也就是空闲的状态,说明它没有在处理任务,这时可以对该线程进行中断。
  4. 线程池在执行 shutdown 方法或 tryTerminate 方法时会调用 interruptIdleWorkers 方法来中断空闲的线程,interruptIdleWorkers 方法会使用 tryLock 方法来判断线程池中的线程是否是空闲状态;如果线程是空闲状态则可以安全回收。

interruptIdleWorkers.java

  1. private void interruptIdleWorkers(boolean onlyOne) {
  2. final ReentrantLock mainLock = this.mainLock;
  3. mainLock.lock();
  4. try {
  5. for (Worker w : workers) {
  6. Thread t = w.thread;
  7. if (!t.isInterrupted() && w.tryLock()) {
  8. try {
  9. t.interrupt();
  10. } catch (SecurityException ignore) {
  11. } finally {
  12. w.unlock();
  13. }
  14. }
  15. if (onlyOne)
  16. break;
  17. }
  18. } finally {
  19. mainLock.unlock();
  20. }
  21. }

Worker 类有一个构造方法,构造参数为给定的首个任务 firstTask,并持有一个线程 thread。thread 是在调用构造方法时通过 ThreadFactory 来创建的线程,可以用来执行任务;

firstTask 用它来初始化时传入的第一个任务,这个任务可以有也可以为 null。如果这个值是非空的,那么线程就会在启动初期立即执行这个任务(核心线程创建时的情况);如果这个值是 null,那么就需要创建一个线程去执行任务列表(workQueue)中的任务,也就是非核心线程的创建。
image.png

11. 任务运行-runWorker

上面我们一起看过线程的启动 t.start(),具体运行是在 Worker 的 run() 方法中

  1. public void run() {
  2. runWorker(this);
  3. }

run() 方法中又调用了 runWorker() 方法,所有的实现都在这里

  1. final void runWorker(Worker w) {
  2. Thread wt = Thread.currentThread();
  3. Runnable task = w.firstTask;
  4. w.firstTask = null;
  5. w.unlock(); // allow interrupts
  6. boolean completedAbruptly = true;
  7. try {
  8. while (task != null || (task = getTask()) != null) {
  9. w.lock();
  10. // If pool is stopping, ensure thread is interrupted;
  11. // if not, ensure thread is not interrupted. This
  12. // requires a recheck in second case to deal with
  13. // shutdownNow race while clearing interrupt
  14. if ((runStateAtLeast(ctl.get(), STOP) ||
  15. (Thread.interrupted() &&
  16. runStateAtLeast(ctl.get(), STOP))) &&
  17. !wt.isInterrupted())
  18. wt.interrupt();
  19. try {
  20. beforeExecute(wt, task);
  21. Throwable thrown = null;
  22. try {
  23. task.run();
  24. } catch (RuntimeException x) {
  25. thrown = x; throw x;
  26. } catch (Error x) {
  27. thrown = x; throw x;
  28. } catch (Throwable x) {
  29. thrown = x; throw new Error(x);
  30. } finally {
  31. afterExecute(task, thrown);
  32. }
  33. } finally {
  34. task = null;
  35. w.completedTasks++;
  36. w.unlock();
  37. }
  38. }
  39. completedAbruptly = false;
  40. } finally {
  41. processWorkerExit(w, completedAbruptly);
  42. }
  43. }

很多人看到这样的代码就感觉头痛,其实你细看,这里面我们可以看关键点,里面有三块 try...catch...finally 代码,我们将这三块分别单独拎出来看并且将抛异常的地方暂时删掉或注释掉,这样它看起来就清爽了很多

  1. Thread wt = Thread.currentThread();
  2. Runnable task = w.firstTask;
  3. w.firstTask = null;
  4. //由于Worker初始化时AQS中state设置为-1,这里要先做一次解锁把state更新为0,允许线程中断
  5. w.unlock(); // allow interrupts
  6. boolean completedAbruptly = true;
  7. try {
  8. // 循环的判断任务(firstTask或从队列中获取的task)是否为空
  9. while (task != null || (task = getTask()) != null) {
  10. // Worker加锁,本质是AQS获取资源并且尝试CAS更新state由0更变为1
  11. w.lock();
  12. // 如果线程池运行状态是stopping, 确保线程是中断状态;
  13. // 如果不是stopping, 确保线程是非中断状态.
  14. if ((runStateAtLeast(ctl.get(), STOP) ||
  15. (Thread.interrupted() &&
  16. runStateAtLeast(ctl.get(), STOP))) &&
  17. !wt.isInterrupted())
  18. wt.interrupt();
  19. //此处省略了第二个try...catch...finally
  20. }
  21. // 走到这里说明某一次getTask()返回为null,线程正常退出
  22. completedAbruptly = false;
  23. } finally {
  24. //处理线程退出
  25. processWorkerExit(w, completedAbruptly);
  26. }

第二个try...catch...finally

  1. try {
  2. beforeExecute(wt, task);
  3. Throwable thrown = null;
  4. //此处省略了第三个try...catch...finally
  5. } finally {
  6. task = null;
  7. w.completedTasks++;
  8. w.unlock();
  9. }

第三个try...catch...finally

  1. try {
  2. // 运行任务
  3. task.run();
  4. } catch (RuntimeException x) {
  5. thrown = x; throw x;
  6. } catch (Error x) {
  7. thrown = x; throw x;
  8. } catch (Throwable x) {
  9. thrown = x; throw new Error(x);
  10. } finally {
  11. afterExecute(task, thrown);
  12. }

上面的代码中可以看到有 **beforeExecute****afterExecute****terminaerd** 三个函数,它们都是钩子函数,可以分别在子类中重写它们用来扩展 ThreadPoolExecutor,例如添加日志、计时、监视或者统计信息收集的功能。

  • beforeExecute():线程执行之前调用
  • afterExecute():线程执行之后调用
  • terminaerd():线程池退出时候调用

这样拆分完之后发现,其实主要注意两个点就行了,分别是 getTask()task.run()task.run() 就是运行任务,那我们继续来看下 getTask() 是如何获取任务的。

12. 获取任务-getTask

  1. private Runnable getTask() {
  2. boolean timedOut = false; // Did the last poll() time out?
  3. for (;;) {
  4. int c = ctl.get();
  5. int rs = runStateOf(c);
  6. //1.线程池状态是 STOP,TIDYING,TERMINATED
  7. //2.线程池 shutdown 并且队列是空的.
  8. //满足以上两个条件之一则工作线程数wc减去1,然后直接返回null
  9. if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
  10. decrementWorkerCount();
  11. return null;
  12. }
  13. int wc = workerCountOf(c);
  14. //允许核心工作线程对象销毁淘汰 or 工作线程数 > 最大核心线程数
  15. boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
  16. //1.工作线程数 > 最大线程数maximumPoolSize or (timed == true && timedOut == true)
  17. //2.工作线程数 > 1 或者队列为空
  18. //同时满足以上两个条件则通过CAS把线程数减去1,同时返回null。CAS把线程数减去1失败会进入下一轮循环做重试
  19. if ((wc > maximumPoolSize || (timed && timedOut))
  20. && (wc > 1 || workQueue.isEmpty())) {
  21. if (compareAndDecrementWorkerCount(c))
  22. return null;
  23. continue;
  24. }
  25. try {
  26. /// 如果timed为true,通过poll()方法做超时拉取,keepAliveTime时间内没有等待到有效的任务,则返回null
  27. // 如果timed为false,通过take()做阻塞拉取,会阻塞到有下一个有效的任务时候再返回(一般不会是null)
  28. Runnable r = timed ?
  29. workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
  30. workQueue.take();
  31. if (r != null)
  32. return r;
  33. timedOut = true;
  34. } catch (InterruptedException retry) {
  35. timedOut = false;
  36. }
  37. }
  38. }

里面有个关键字 allowCoreThreadTimeOut它的默认值为 **false**,在 Java1.6 开始你可以通过 threadPoolExecutor.allowCoreThreadTimeOut(true) 方式来设置为 true,通过字面意思就可以明白这个字段的作用是什么了,即是否允许核心线程超时销毁。

:::info 默认的情况下核心线程数量会一直保持,即使这些线程是空闲的它也是会一直存在的,而当设置为 true 时,线程池中 corePoolSize 线程空闲时间达到 keepAliveTime 也将销毁关闭。 :::

  • execute 里根据 corePoolSize 、 workCount、maximumPoolSize 和 queue_size 判断要不要 执行 addWork()
  • addWorker 方法的主要工作是在线程池中创建一个新的线程并执行,firstTask 参数 用于指定新增的线程执行的第一个任务
  • 线程池中的每一个线程被封装成一个 Worker 对象,ThreadPool 维护的其实就是一组 Worker 对象,Worker 类继承了 AQS,并实现了 Runnable 接口

线程池如何做到复用?

  • **runWorker()** 通过循环来取任务,通过 **getTask()**方法。
  • 如果工作线程数大于核心线程数,则通过 poll() 从队列取任务;如果工作线程数小于核心线程数,则通过 take() 从队列取任务;
    • 这 2 个方法等区别是 take() 取任务时,如果队列中没有任务了会调用 await() 阻塞当前线程。这样的话,是不是已经搞清楚线程池中的核心线程复用的原因了。
  • 线程的唤醒是在 execute 时,当调用 workQueue.offer() 方法,将任务放入阻塞队列时,会调用 Condition.signal() 方法唤醒一个之前阻塞的线程。这部分不细讲,感兴趣的同学自行查看。

总结

  • 当 Thread 的 run 方法执行完一个任务之后,会循环地从阻塞队列中取任务来执行,这样执行完一个任务之后就不会立即销毁了;
  • 当工作线程数小于核心线程数,那些空闲的核心线程再去队列取任务的时候,如果队列中的 Runnable 数量为0,就会阻塞当前线程,这样线程就不会回收了

[

](https://blog.csdn.net/weixin_48509270/article/details/106795567)

一篇详实的源码分析:链接