Java7HashMap与Java8HashMap

java7 HashMap导致死锁演示

  1. public class MapTest {
  2. public static void main(String[] args) {
  3. for (int i = 0; i < 30; i++) {
  4. new Thread(new MapThread()).start();
  5. }
  6. }
  7. static class MapThread implements Runnable {
  8. static HashMap<Integer, Integer> map = new HashMap<Integer, Integer>();
  9. AtomicInteger ai = new AtomicInteger();
  10. public void run() {
  11. while (ai.get() < 100000) {
  12. map.put(ai.incrementAndGet(), ai.incrementAndGet());
  13. }
  14. }
  15. }
  16. }

执行上述代码多次会出现死锁的现象,这是由于java7中的HashMap在多线程中执行时,当有多个线程同时扩容时,链表上元素交换位置(transfer())时形成了闭环,从而导致死锁。java7与java8都会产生死锁外会可能会导致数据丢失、get时导致出现空值等等情况。java8通过两组指针(loHead、loTail与hiHead、hiTail)的搭配,避免相邻的的交换。

线程池

“线程池”,顾名思义就是一个线程缓存,线程是稀缺资源,如果被无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,因此Java中提供线程池对线程进行统一分配、调优和监控。

线程池介绍

在web开发中,服务器需要接受并处理请求,所以会为一个请求来分配一个线程来进行处理。如果每次请求都新创建一个线程的话实现起来非常简便,但是存在一个问题:如果并发的请求数量非常多,但每个线程执行的时间很短,这样就会频繁的创建和销毁线程,如此一来会大大降低系统的效率。可能出现服务器在为每个请求创建新线程和销毁线程上花费的时间和消耗的系统资源要比处理实际的用户请求的时间和资源更多。
那么有没有一种办法使执行完一个任务,并不被销毁,而是可以继续执行其他的任务呢?这就是线程池的目的了。线程池为线程生命周期的开销和资源不足问题提供了解决方案。通过对多个任务重用线程,线程创建的开销被分摊到了多个任务上。

什么时候使用线程池?

单个任务处理时间比较短,需要处理的任务数量很大

线程池优势

  • 重用存在的线程,减少线程创建,消亡的开销,提高性能
  • 提高响应速度。当任务到达时,任务可以不需要的等到线程创建就能立即执行。
  • 提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控。

    线程的实现方式

    Runnable,Thread,Callable
    1. // 实现Runnable接口的类将被Thread执行,表示一个基本的任务
    2. public interface Runnable {
    3. // run方法就是它所有的内容,就是实际执行的任务
    4. public abstract void run();
    5. }
    1. //Callable同样是任务,与Runnable接口的区别在于它接收泛型,同时它执行任务后带有返回内容
    2. public interface Callable<V> {
    3. // 相对于run方法的带有返回值的call方法
    4. V call() throws Exception;
    5. }

    Executor框架

    Executor接口是线程池框架中最基础的部分,定义了一个用于执行Runnable的execute方法。下图为它的继承与实现
    image.png
    从图中可以看出Executor下有一个重要子接口ExecutorService,其中定义了线程池的具体行为
  1. execute(Runnable command):履行Ruannable类型的任务
  2. submit(task):可用来提交Callable或Runnable任务,并返回代表此任务的Future对象
  3. shutdown():在完成已提交的任务后封闭办事,不再接管新任务
  4. shutdownNow():停止所有正在履行的任务并封闭办事
  5. isTerminated():测试是否所有任务都履行完毕了
  6. isShutdown():测试是否该ExecutorService已被关闭

    线程池重点属性

    1. private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING,0));
    2. private static final int COUNT_BITS = Integer.SIZE ­ 3;
    3. private static final int CAPACITY = (1 << COUNT_BITS) ­ 1;
    ctl 是对线程池的运行状态和线程池中有效线程的数量进行控制的一个字段,它包含两部分的信息: 线程池的运行状态 (runState) 和线程池内有效线程的数量 (workerCount),这里可以看到,使用了Integer类型来保存,高3位保存runState,低29位保存workerCount。COUNT_BITS 就是29,CAPACITY就是1左移29位减1(29个1),这个常量表示workerCount的上限值,大约是5亿。

    ctl相关方法

    1. private static int runStateOf(int c) { return c & ~CAPACITY; }
    2. private static int workerCountOf(int c) { return c & CAPACITY; }
    3. private static int ctlOf(int rs, int wc) { return rs | wc; }
    runStateOf:获取运行状态;

workerCountOf:获取活动线程数;
ctlOf:获取运行状态和活动线程数的值。

线程池存在5种状态重要

RUNNING = ­1 << COUNT_BITS; //高3位为111
SHUTDOWN = 0 << COUNT_BITS; //高3位为000
STOP = 1 << COUNT_BITS; //高3位为001
TIDYING = 2 << COUNT_BITS; //高3位为010
TERMINATED = 3 << COUNT_BITS; //高3位为011
1、RUNNING
(1) 状态说明:线程池处在RUNNING状态时,能够接收新任务,以及对已添加的任务进行处理。
(2) 状态切换:线程池的初始化状态是RUNNING。换句话说,线程池被一旦被创建,就处于RUNNING状态,并且线程池中的任务数为0!
2、 SHUTDOWN
(1) 状态说明:线程池处在SHUTDOWN状态时,不接收新任务,但能处理已添加的任务
(2) 状态切换:调用线程池的shutdown()接口时,线程池由RUNNING -> SHUTDOWN。
3、STOP
(1) 状态说明:线程池处在STOP状态时,不接收新任务,不处理已添加的任务,并且会中断正在处理的任务
(2) 状态切换:调用线程池的shutdownNow()接口时,线程池由(RUNNING/SHUTDOWN ) -> STOP。
4、TIDYING
(1) 状态说明:当所有的任务已终止,ctl记录的“任务数量”为0,线程池会变为TIDYING状态。当线程池变为TIDYING状态时,会执行钩子函数terminated()。terminated()在ThreadPoolExecutor类中是空的,若用户想在线程池变为TIDYING时,进行相应的处理;可以通过重载terminated()函数来实现。
(2) 状态切换:当线程池在SHUTDOWN状态下,阻塞队列为空并且线程池中执行的任务也为空时,就会由 SHUTDOWN -> TIDYING。 当线程池在STOP状态下,线程池中执行的任务为空时,就会由STOP -> TIDYING。
5、 TERMINATED
(1) 状态说明:线程池彻底终止,就变成TERMINATED状态
(2) 状态切换:线程池处在TIDYING状态时,执行完terminated()之后,就会由 TIDYING -> TERMINATED。
进入TERMINATED的条件如下:

  • 线程池不是RUNNING状态;
  • 线程池状态不是TIDYING状态或TERMINATED状态;
  • 如果线程池状态是SHUTDOWN并且workerQueue为空;
  • workerCount为0;
  • 设置TIDYING状态成功。

image.png

线程池的具体实现

ThreadPoolExecutor 默认线程池
ScheduledThreadPoolExecutor 定时线程池

ThreadPoolExecutor

线程池的创建

  1. public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler)

任务提交

1、public void execute() //提交任务无返回值
2、public Future<?> submit() //任务执行完成后有返回值

参数解释

corePoolSize
线程池中的核心线程数,当提交一个任务时,线程池创建一个新线程执行任务,直到当前线程数等于corePoolSize;如果当前线程数为corePoolSize,继续提交的任务被保存到阻塞队列中,等待被执行;如果执行了线程池的prestartAllCoreThreads()方法,线程池会提前创建并启动所有核心线程。
maximumPoolSize
线程池中允许的最大线程数。如果当前阻塞队列满了,且继续提交任务,则创建新的线程执行任务,前提是当前线程数小于maximumPoolSize;
keepAliveTime
线程池维护线程所允许的空闲时间。当线程池中的线程数量大于corePoolSize的时候,如果这时没有新的任务提交,核心线程外的线程不会立即销毁,而是会等待,直到等待的时间超过了keepAliveTime才会销毁;
unit
keepAliveTime的单位;
workQueue
用来保存等待被执行的任务的阻塞队列,且任务必须实现Runable接口,在JDK中提供了如下阻塞队列:
1、ArrayBlockingQueue:基于数组结构的有界阻塞队列,按FIFO排序任务;
2、LinkedBlockingQuene:基于链表结构的阻塞队列,按FIFO排序任务,吞吐量通常要高于ArrayBlockingQuene;
3、SynchronousQuene:一个不存储元素的阻塞队列,每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻塞状态,吞吐量通常要高于LinkedBlockingQuene;
4、priorityBlockingQuene:具有优先级的无界阻塞队列;
threadFactory
它是ThreadFactory类型的变量,用来创建新线程。默认使用Executors.defaultThreadFactory() 来创建线程。使用默认的ThreadFactory来创建线程时,会使新创建的线程具有相同的NORM_PRIORITY优先级并且是非守护线程,同时也设置了线程的名称。
handler
线程池的饱和策略,当阻塞队列满了,且没有空闲的工作线程,如果继续提交任务,必须采取一种策略处理该任务,线程池提供了4种策略:
1、AbortPolicy:直接抛出异常,默认策略;
2、CallerRunsPolicy:用调用者所在的线程来执行任务;
3、DiscardOldestPolicy:丢弃阻塞队列中靠最前的任务,并执行当前任务;
4、DiscardPolicy:直接丢弃任务;
上面的4种策略都是ThreadPoolExecutor的内部类。当然也可以根据应用场景实现RejectedExecutionHandler接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务。

线程池监控

  1. public long getTaskCount() //线程池已执行与未执行的任务总数
  2. public long getCompletedTaskCount() //已完成的任务数
  3. public int getPoolSize() //线程池当前的线程数
  4. public int getActiveCount() //线程池中正在执行任务的线程数量

线程池原理

image.png

源码分析

execute方法

  1. public void execute(Runnable command) {
  2. if (command == null)
  3. throw new NullPointerException();
  4. /*
  5. * clt记录着runState和workerCount
  6. */
  7. int c = ctl.get();
  8. /*
  9. * workerCountOf方法取出低29位的值,表示当前活动的线程数;
  10. * 如果当前活动线程数小于corePoolSize,则新建一个线程放入线程池中;
  11. * 并把任务添加到该线程中。
  12. */
  13. if (workerCountOf(c) < corePoolSize) {
  14. /*
  15. * addWorker中的第二个参数表示限制添加线程的数量是根据corePoolSize来判断还是maximumPoolSize来判断;
  16. * 如果为true,根据corePoolSize来判断;
  17. * 如果为false,则根据maximumPoolSize来判断
  18. */
  19. if (addWorker(command, true))
  20. return;
  21. /*
  22. * 如果添加失败,则重新获取ctl值
  23. */
  24. c = ctl.get();
  25. }
  26. /*
  27. * 如果当前线程池是运行状态并且任务添加到队列成功
  28. */
  29. if (isRunning(c) && workQueue.offer(command)) {
  30. // 重新获取ctl值
  31. int recheck = ctl.get();
  32. //再次判断线程池的运行状态,如果不是运行状态,由于之前已经把command添加到workQueue中了,这时需要移除该command,执行过后通过handler使用拒绝策略对该任务进行处理,整个方法返回
  33. if (! isRunning(recheck) && remove(command))
  34. reject(command
  35. /*
  36. * 获取线程池中的有效线程数,如果数量是0,则执行addWorker方法,这里传入的参数表示:
  37. * 1. 第一个参数为null,表示在线程池中创建一个线程,但不去启动;
  38. * 2. 第二个参数为false,将线程池的有限线程数量的上限设置为maximumPoolSize,添加线程时根据maximumPoolSize来判断;
  39. * 如果判断workerCount大于0,则直接返回,在workQueue中新增的command会在将来的某个时刻被执行。
  40. */
  41. else if (workerCountOf(recheck) == 0)
  42. addWorker(null, false
  43. }
  44. /*
  45. * 如果执行到这里,有两种情况:
  46. * 1. 线程池已经不是RUNNING状态;
  47. * 2. 线程池是RUNNING状态,但workerCount >= corePoolSize并且workQueue已满。
  48. * 这时,再次调用addWorker方法,但第二个参数传入为false,将线程池的有限线程数量的上限设置为maximumPoolSize;
  49. * 如果失败则拒绝该任务
  50. */
  51. else if (!addWorker(command, false))
  52. reject(command
  53. }

简单来说,在执行execute()方法时如果状态一直是RUNNING时的执行过程如下:
1. 如果workerCount < corePoolSize,则创建并启动一个线程来执行新提交的任务;
2. 如果workerCount >= corePoolSize,且线程池内的阻塞队列未满,则将任务添加到该阻塞队列中;
3. 如 果 workerCount >= corePoolSize && workerCount 4. 如果workerCount >= maximumPoolSize,并且线程池内的阻塞队列已满, 则根据拒绝策略来处理该任务, 默认的处理方式是直接抛异常。
这里要注意一下addWorker(null, false);,也就是创建一个线程,但并没有传入任务,因为任务已经被添加到workQueue中了,所以worker在执行的时候,会直接从workQueue中获取任务。所以,在workerCountOf(recheck) == 0时执行addWorker(null, false);也是为了保证线程池在RUNNING状态下必须要有一个线程来执行任务。
execute方法执行流程如下:
image.png

addWorker方法

addWorker方法的主要工作是在线程池中创建一个新的线程并执行,firstTask参数用于指定新增的线程执行的第一个任务,core参数为true表示在新增线程时会判断当前活动线程数是否少于corePoolSize,false表示新增线程前需要判断当前活动线程数是否少于maximumPoolSize,代码如下:

  1. private boolean addWorker(Runnable firstTask, boolean core) {
  2. retry:
  3. for (;;) {
  4. int c = ctl.get();
  5. // 获取运行状态
  6. int rs = runStateOf(c
  7. /*
  8. * 如果rs >= SHUTDOWN,则表示此时不再接收新任务;接着判断以下3个条件,
  9. * 只要有1个不满足,则返回false:
  10. * 1. rs == SHUTDOWN,这时表示关闭状态,不再接受新提交的任务,但却可以继续处理阻塞队列中已保存的任务
  11. * 2. firsTask为空
  12. * 3. 阻塞队列不为空
  13. *
  14. * 首先考虑rs == SHUTDOWN的情况
  15. * 这种情况下不会接受新提交的任务,所以在firstTask不为空的时候会返回false;
  16. * 然后,如果firstTask为空,并且workQueue也为空,则返回false,
  17. * 因为队列中已经没有任务了,不需要再添加线程了
  18. */
  19. // Check if queue empty only if necessary.
  20. if (rs >= SHUTDOWN && ! (rs == SHUTDOWN && firstTask == null && ! workQueue.isEmpty()))
  21. return false;
  22. for (;;) {
  23. // 获取线程数
  24. int wc = workerCountOf(c
  25. // 如果wc超过CAPACITY,也就是ctl的低29位的最大值(二进制是29个1),返回false;
  26. // 这里的core是addWorker方法的第二个参数,如果为true表示根据corePoolSize来比较,
  27. // 如果为false则根据maximumPoolSize来比较。
  28. //
  29. if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize))
  30. return false;
  31. // 尝试增加workerCount,如果成功,则跳出第一个for循环
  32. if (compareAndIncrementWorkerCount(c))
  33. break retry;
  34. // 如果增加workerCount失败,则重新获取ctl的值
  35. c = ctl.get(); // Reread ctl
  36. // 如果当前的运行状态不等于rs,说明状态已被改变,返回第一个for循环继续执行
  37. if (runStateOf(c) != rs)
  38. continue retry;
  39. // else CAS failed due to workerCount change; retry
  40. inner loop
  41. }
  42. }
  43. boolean workerStarted = false;
  44. boolean workerAdded = false;
  45. Worker w = null;
  46. try {
  47. // 根据firstTask来创建Worker对象
  48. w = new Worker(firstTask
  49. // 每一个Worker对象都会创建一个线程
  50. final Thread t = w.thread;
  51. if (t != null) {
  52. final ReentrantLock mainLock = this.mainLock;
  53. mainLock.lock();
  54. try {
  55. int rs = runStateOf(ctl.get());
  56. // rs < SHUTDOWN表示是RUNNING状态;
  57. // 如果rs是RUNNING状态或者rs是SHUTDOWN状态并且firstTask为null,向线程池中添加线程。
  58. // 因为在SHUTDOWN时不会在添加新的任务,但还是会执行workQueue中的任务
  59. if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) {
  60. if (t.isAlive()) // precheck that t is startable
  61. throw new IllegalThreadStateException();
  62. // workers是一个HashSet
  63. workers.add(w
  64. int s = workers.size();
  65. // largestPoolSize记录着线程池中出现过的最大线程数量
  66. if (s > largestPoolSize)
  67. largestPoolSize = s;
  68. workerAdded = true;
  69. }
  70. } finally {
  71. mainLock.unlock();
  72. }
  73. if (workerAdded) {
  74. // 启动线程
  75. t.start();
  76. workerStarted = true;
  77. }
  78. }
  79. } finally {
  80. if (! workerStarted)
  81. addWorkerFailed(w
  82. }
  83. return workerStarted;
  84. }

Worker类

线程池中的每一个线程被封装成一个Worker对象,ThreadPool维护的其实就是一组Worker对象,请参见JDK源码。
Worker类继承了AQS,并实现了Runnable接口,注意其中的firstTask和thread属性:firstTask用它来保存传入的任务;thread是在调用构造方法时通过ThreadFactory来创建的线程,是用来处理任务的线程。
在调用构造方法时,需要把任务传入,通过getThreadFactory().newThread(this);来新建一个线程,newThread方法传入的参数是this,因为Worker本身继承了Runnable接口,也就是一个线程,所以一个Worker对象在启动的时候会调用Worker类中的run方法。
Worker继承了AQS,使用AQS来实现独占锁的功能。为什么不使用ReentrantLock来实现呢?可以看到tryAcquire方法,它是不允许重入的,而ReentrantLock是允许重入的:
1. lock方法一旦获取了独占锁,表示当前线程正在执行任务中;
2. 如果正在执行任务,则不应该中断线程;
3. 如果该线程现在不是独占锁的状态,也就是空闲的状态,说明它没有在处理任务,这时可以对该线程进行中断;
4. 线程池在执行shutdown方法或tryTerminate方法时会调用interruptIdleWorkers方法来中断空闲的线程,interruptIdleWorkers方法会使用tryLock方法来判断线程池中的线程是否是空闲状态;
5. 之所以设置为不可重入,是因为我们不希望任务在调用像setCorePoolSize这样的线程池控制方法时重新获取锁。如果使用ReentrantLock,它是可重入的,这样如果在任务中调用了如setCorePoolSize这类线程池控制的方法,会中断正在运行的线程。所以,Worker继承自AQS,用于判断线程是否空闲以及是否可以被中断。
此外,在构造方法中执行了setState(-1);,把state变量设置为-1,为什么这么做呢?是因为AQS中默认的state是0,如果刚创建了一个Worker对象,还没有执行任务时,这时就不应该被中断,看一下tryAquire方法:

  1. protected boolean tryAcquire(int unused) {
  2. //cas修改state,不可重入 因为只有原数值为0时才会加锁成功,一旦加锁成功,原数值就变为1,就不能在进行加锁操作
  3. if (compareAndSetState(0, 1)) {
  4. setExclusiveOwnerThread(Thread.currentThread());
  5. return true;
  6. }
  7. return false;
  8. }

tryAcquire方法是根据state是否是0来判断的,所以,setState(-1);将state设置为-1是为了禁止在执行任务前对线程进行中断。
正因为如此,在runWorker方法中会先调用Worker对象的unlock方法将state设置为0。

runWorker方法

在Worker类中的run方法调用了runWorker方法来执行任务,runWorker方法的代码如下:

  1. final void runWorker(Worker w) {
  2. Thread wt = Thread.currentThread();
  3. // 获取第一个任务
  4. Runnable task = w.firstTask;
  5. w.firstTask = null;
  6. // 允许中断
  7. w.unlock(); // allow interrupts
  8. // 是否因为异常退出循环
  9. boolean completedAbruptly = true;
  10. try {
  11. // 如果task为空,则通过getTask来获取任务
  12. while (task != null || (task = getTask()) != null) {
  13. w.lock();
  14. if ((runStateAtLeast(ctl.get(), STOP) || (Thread.interrupted() && runStateAtLeast(ctl.get(), STOP))) && !wt.isInterrupted())
  15. wt.interrupt();
  16. try {
  17. beforeExecute(wt, task
  18. Throwable thrown = null;
  19. try {
  20. task.run();
  21. } catch (RuntimeException x) {
  22. thrown = x; throw x;
  23. } catch (Error x) {
  24. thrown = x; throw x;
  25. } catch (Throwable x) {
  26. thrown = x; throw new Error(x
  27. } finally {
  28. afterExecute(task, thrown
  29. }
  30. } finally {
  31. task = null;
  32. w.completedTasks++;
  33. w.unlock();
  34. }
  35. }
  36. completedAbruptly = false;
  37. } finally {
  38. processWorkerExit(w, completedAbruptly
  39. }
  40. }

这里说明一下第一个if判断,目的是:

  • 如果线程池正在停止,那么要保证当前线程是中断状态;
  • 如果不是的话,则要保证当前线程不是中断状态;

这里要考虑在执行该if语句期间可能也执行了shutdownNow方法,shutdownNow方法会把状态设置为STOP,回顾一下STOP状态:
不接受新任务,也不处理队列中的任务,会中断正在处理任务的线程。在线程池处于RUNNING或SHUTDOWN 状态时,调用 shutdownNow() 方法会使线程池进入到该状态。
STOP状态要中断线程池中的所有线程,这里使用Thread.interrupted()来判断是否中断是为了确保在RUNNING或SHUTDOWN状态时线程是非中断状态的,因为Thread.interrupted()方法会复位中断的状态
总结一下runWorker方法的执行过程:

  1. while循环不断地通过getTask()方法获取任务;
  2. getTask()方法从阻塞队列中取任务;
  3. 如果线程池正在停止,那么要保证当前线程是中断状态,否则要保证当前线程不是中断状态;
  4. 调用task.run()执行任务;
  5. 如果task为null则跳出循环,执行processWorkerExit()方法;
  6. runWorker方法执行完毕,也代表着Worker中的run方法执行完毕,销毁线程。

这里的beforeExecute方法和afterExecute方法在ThreadPoolExecutor类中是空的,留给子类来实现。
completedAbruptly 变量来表示在执行任务过程中是否出现了异 常,在processWorkerExit方法中会对该变量的值进行判断。

getTask方法

getTask方法用来从阻塞队列中取任务,代码如下:

  1. private Runnable getTask() {
  2. // timeOut变量的值表示上次从阻塞队列中取任务时是否超时
  3. boolean timedOut = false; // Did the last poll() time out?
  4. for (;;) {
  5. int c = ctl.get();
  6. int rs = runStateOf(c
  7. /*
  8. * 如果线程池状态rs >= SHUTDOWN,也就是非RUNNING状态,再进行以下判断:
  9. * 1. rs >= STOP,线程池是否正在stop;
  10. * 2. 阻塞队列是否为空。
  11. * 如果以上条件满足,则将workerCount减1并返回null。
  12. * 因为如果当前线程池状态的值是SHUTDOWN或以上时,不允许再向阻塞队列中添加任务。
  13. */
  14. if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())){
  15. decrementWorkerCount();
  16. return null;
  17. }
  18. int wc = workerCountOf(c
  19. // timed变量用于判断是否需要进行超时控制。
  20. // allowCoreThreadTimeOut默认是false,也就是核心线程不允许进行超时;
  21. // wc > corePoolSize,表示当前线程池中的线程数量大于核心线程数量;
  22. // 对于超过核心线程数量的这些线程,需要进行超时控制
  23. boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
  24. /*
  25. * wc > maximumPoolSize的情况是因为可能在此方法执行阶段同时执行了setMaximumPoolSize方法;
  26. * timed && timedOut 如果为true,表示当前操作需要进行超时控制,
  27. * 并且上次从阻塞队列中获取任务发生了超时
  28. * 接下来判断,如果有效线程数量大于1,或者阻塞队列是空的,那么尝试将workerCount减1;
  29. * 如果减1失败,则返回重试。
  30. * 如果wc == 1时,也就说明当前线程是线程池中唯一的一个线程了。
  31. */
  32. if ((wc > maximumPoolSize || (timed && timedOut)) && (wc > 1 || workQueue.isEmpty())) {
  33. if (compareAndDecrementWorkerCount(c))
  34. return null;
  35. continue;
  36. }
  37. try {
  38. /*
  39. * 根据timed来判断,如果为true,则通过阻塞队列的poll方法进行超时控制,
  40. * 如果在keepAliveTime时间内没有获取到任务,则返回null;
  41. * 否则通过take方法,如果这时队列为空,则take方法会阻塞直到队列不为空。
  42. */
  43. Runnable r = timed ? workQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS) : workQueue.take();
  44. if (r != null)
  45. return r;
  46. // 如果 r == null,说明已经超时,timedOut设置为true
  47. timedOut = true;
  48. } catch (InterruptedException retry) {
  49. // 如果获取任务时当前线程发生了中断,则设置timedOut为false并返回循环重试
  50. timedOut = false;
  51. }
  52. }
  53. }

这里重要的地方是第二个if判断,目的是控制线程池的有效线程数量。由上文中的分析可以知道,在执行execute方法时,如果当前线程池的线程数量超过了corePoolSize且小于maximumPoolSize,并且workQueue已满时,则可以增加工作线程,但这时如果超时没有获取到任务,也就是timedOut为true的情况,说明workQueue已经为空了,也就说明了当前线程池中不需要那么多线程来执行任务了,可以把多于corePoolSize数量的线程销毁掉,保持线程数量在corePoolSize即可。
什么时候会销毁?当然是runWorker方法执行完之后,也就是Worker中的run方法执行完,由JVM自动回收。
getTask方法返回null时,在runWorker方法中会跳出while循环,然后会执行processWorkerExit方法

processWorkerExit方法

  1. private void processWorkerExit(Worker w, boolean completedAbruptly) {
  2. // 如果completedAbruptly值为true,则说明线程执行时出现了异常,需要将workerCount减1;
  3. // 如果线程执行时没有出现异常,说明在getTask()方法中已经已经对workerCount进行了减1操作,这里就不必再减了。
  4. if (completedAbruptly)
  5. decrementWorkerCount();
  6. final ReentrantLock mainLock = this.mainLock;
  7. mainLock.lock();
  8. try {
  9. //统计完成的任务数
  10. completedTaskCount += w.completedTasks;
  11. // 从workers中移除,也就表示着从线程池中移除了一个工作线程
  12. workers.remove(w
  13. } finally {
  14. mainLock.unlock();
  15. }
  16. // 根据线程池状态进行判断是否结束线程池
  17. tryTerminate();
  18. int c = ctl.get();
  19. /*
  20. * 当线程池是RUNNING或SHUTDOWN状态时,如果worker是异常结束,那么会直接addWorker;
  21. * 如果allowCoreThreadTimeOut=true,并且等待队列有任务,至少保留一个worker;
  22. * 如果allowCoreThreadTimeOut=false,workerCount不少于corePoolSize。
  23. */
  24. if (runStateLessThan(c, STOP)) {
  25. if (!completedAbruptly) {
  26. int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
  27. if (min == 0 && ! workQueue.isEmpty())
  28. min = 1;
  29. if (workerCountOf(c) >= min)
  30. return; // replacement not needed
  31. }
  32. addWorker(null, false
  33. }
  34. }

至此,processWorkerExit执行完之后,工作线程被销毁,以上就是整个工作线程的生命周期,从execute方法开始,Worker使用ThreadFactory创建新的工作线程,runWorker通过getTask获取任务,然后执行任务,如果getTask返回null,进入processWorkerExit方法,整个线程结束,如图所示:
image.png

务性质类型

CPU密集型(CPU-bound)

CPU密集型也叫计算密集型,指的是系统的硬盘、内存性能相对CPU要好很多,此时,系统运作大部分的状况是CPU Loading 100%,CPU要读/写I/O(硬盘/内存),I/O在很短的时间就可以完成,而CPU还有许多运算要处理,CPU Loading很高。
在多重程序系统中,大部份时间用来做计算、逻辑判断等CPU动作的程序称之CPU bound。例如一个计算圆周率至小数点一千位以下的程序,在执行的过程当中绝大部份时间用在三角函数和开根号的计算,便是属于CPU bound的程序。
CPU bound的程序一般而言CPU占用率相当高。这可能是因为任务本身不太需要访问I/O设备,也可能是因为程序是多线程实现因此屏蔽掉了等待I/O的时间。
线程数一般设置为:线程数 = CPU核数+1 (现代CPU支持超线程)

IO密集型(I/O bound)

IO密集型指的是系统的CPU性能相对硬盘、内存要好很多,此时,系统运作,大部分的状况是CPU在等I/O (硬盘/内存) 的读/写操作,此时CPU Loading并不高。I/O bound的程序一般在达到性能极限时,CPU占用率仍然较低。这可能是因为任务本身需要大量I/O操作,而pipeline做得不是很好,没有充分利用处理器能力。
线程数一般设置为:线程数 = ((线程等待时间+线程CPU时间)/线程CPU时间 )* CPU数目

CPU密集型 vs IO密集型

我们可以把任务分为计算密集型和IO密集型。
计算密集型任务的特点是要进行大量的计算,消耗CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠CPU的运算能力。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数
计算密集型任务由于主要消耗CPU资源,因此,代码运行效率至关重要。Python这样的脚本语言运行效率很低,完全不适合计算密集型任务。对于计算密集型任务,最好用C语言编写。
第二种任务的类型是IO密集型,涉及到网络、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。常见的大部分任务都是IO密集型任务,比如Web应用。
IO密集型任务执行期间,99%的时间都花在IO上,花在CPU上的时间很少,因此,用运行速度极快的C语言替换用Python这样运行速度极低的脚本语言,完全无法提升运行效率。对于IO密集型任务,最合适的语言就是开发效率最高(代码量最少)的语言,脚本语言是首选,C语言最差。