Spring、Netty、Mybatis 等框架的代码中大量运用了 Java 多线程编程技巧。并发编程处理的恰当与否,将直接影响架构的性能。本章通过对 这些框架源码 的分析,结合并发编程的常用技巧,来讲解多线程编程在这些主流框架中的应用。

Java 内存模型

JVM 规范 定义了 Java 内存模型 来屏蔽掉各种操作系统、虚拟机实现厂商和硬件的内存访问差异,以确保 Java 程序 在所有操作系统和平台上能够达到一致的内存访问效果。

工作内存和主内存

Java 内存模型 规定所有的变量都存储在主内存中,每个线程都有自己独立的工作内存,工作内存保存了 对应该线程使用的变量的主内存副本拷贝。线程对这些变量的操作都在自己的工作内存中进行,不能直接操作主内存 和 其他工作内存中存储的变量或者变量副本。线程间的变量传递需通过主内存来完成,三者的关系如下图所示。 在这里插入图片描述

Java 内存操作协议

Java 内存模型定义了 8 种操作来完成主内存和工作内存的变量访问,具体如下。 在这里插入图片描述

  • read:把一个变量的值从主内存传输到线程的工作内存中,以便随后的 load 动作使用。
  • load:把从主内存中读取的变量值载入工作内存的变量副本中。
  • use:把工作内存中一个变量的值传递给 Java 虚拟机执行引擎。
  • assign:把从执行引擎接收到的变量的值赋值给工作内存中的变量。
  • store:把工作内存中一个变量的值传送到主内存中,以便随后的 write 操作。
  • write:工作内存传递过来的变量值放入主内存中。
  • lock:把主内存的一个变量标识为某个线程独占的状态。
  • unlock:把主内存中 一个处于锁定状态的变量释放出来,被释放后的变量才可以被其他线程锁定。

内存模型三大特性

1、原子性

这个概念与事务中的原子性大概一致,表明此操作是不可分割,不可中断的,要么全部执行,要么全部不执行。 Java 内存模型直接保证的原子性操作包括 read、load、use、assign、store、write、lock、unlock 这八个。

2、可见性

可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。Java 内存模型 是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的,无论是普通变量还是 volatile 变量 都是如此,普通变量与 volatile 变量 的区别是,volatile 的特殊规则保证了新值能立即同步到主内存,以及每次使用前立即从主内存刷新。因此,可以说 volatile 保证了多线程操作时变量的可见性,而普通变量则不能保证这一点。除了 volatile 外,synchronized 也提供了可见性,synchronized 的可见性是由 “对一个变量执行 unlock 操作 之前,必须先把此变量同步回主内存中(执行 store、write 操作)” 这条规则获得。

3、有序性

单线程环境下,程序会 “有序的”执行,即:线程内表现为串行语义。但是在多线程环境下,由于指令重排,并发执行的正确性会受到影响。在 Java 中使用 volatile 和 synchronized 关键字,可以保证多线程执行的有序性。volatile 通过加入内存屏障指令来禁止内存的重排序。synchronized 通过加锁,保证同一时刻只有一个线程来执行同步代码。

volatile 的应用

打开 NioEventLoop 的代码中,有一个控制 IO 操作 和 其他任务运行比例的,用 volatile 修饰的 int 类型字段 ioRatio,代码如下。

  1. private volatile int ioRatio = 50;

这里为什么要用 volatile 修饰呢?我们首先对 volatile 关键字进行说明,然后再结合 Netty 的代码进行分析。

关键字 volatile 是 Java 提供的最轻量级的同步机制,Java 内存模型对 volatile 专门定义了一些特殊的访问规则。下面我们就看它的规则。当一个变量被 volatile 修饰后,它将具备以下两种特性。

  • 线程可见性:当一个线程修改了被 volatile 修饰的变量后,无论是否加锁,其他线程都可以立即看到最新的修改(什么叫立即看到最新的修改?感觉这句话太口语化且模糊,搞不太懂!),而普通变量却做不到这点。
  • 禁止指令重排序优化:普通的变量仅仅保证在该方法的执行过程中所有依赖赋值结果的地方都能获取正确的结果,而不能保证变量赋值操作的顺序与程序代码的执行顺序一致。举个简单的例子说明下指令重排序优化问题,代码如下。
  1. public class ThreadStopExample {
  2. private static boolean stop;
  3. public static void main(String[] args) throws InterruptedException {
  4. Thread workThread = new Thread(new Runnable() {
  5. public void run() {
  6. int i= 0;
  7. while (!stop) {
  8. i++;
  9. try{
  10. TimeUnit.SECONDS.sleep(1);
  11. } catch (InterruptedException e) {
  12. e.printStackTrace();
  13. }
  14. }
  15. }
  16. });
  17. workThread.start();
  18. TimeUnit.SECONDS.sleep(3);
  19. stop = true;
  20. }
  21. }

我们预期程序会在 3s 后停止,但是实际上它会一直执行下去,原因就是虚拟机对代码进行了指令重排序和优化,优化后的指令如下。

  1. if (!stop)
  2. While(true)
  3. ......

workThread 线程 在执行重排序后的代码时,是无法发现 变量 stop 被其它线程修改的,因此无法停止运行。要解决这个问题,只要将 stop 前增加 volatile 修饰符即可。volatile 解决了如下两个问题。第一,主线程对 stop 的修改在 workThread 线程 中可见,也就是说 workThread 线程 立即看到了其他线程对于 stop 变量 的修改。第二,禁止指令重排序,防止因为重排序导致的并发访问逻辑混乱。

一些人认为使用 volatile 可以代替传统锁,提升并发性能,这个认识是错误的。volatile 仅仅解决了可见性的问题,但是它并不能保证互斥性,也就是说多个线程并发修改某个变量时,依旧会产生多线程问题。因此,不能靠 volatile 来完全替代传统的锁。根据经验总结,volatile 最适用的场景是 “ 一个线程写,其他线程读 ”,如果有多个线程并发写操作,仍然需要使用锁或者线程安全的容器或者原子变量来代替。下面我们继续对 Netty 的源码做分析。上面讲到了 ioRatio 被定义成 volatile,下面看看代码为什么要这样定义。

  1. final long ioTime = System.nanoTime() - ioStartTime;
  2. runAllTasks(ioTime * (100 - ioRatio) / ioRatio);

通过代码分析我们发现,在 NioEventLoop 线程 中,ioRatio 并没有被修改,它是只读操作。既然没有修改,为什么要定义成 volatile 呢?继续看代码,我们发现 NioEventLoop 提供了重新设置 IO 执行时间比例的公共方法。

  1. public void setIoRatio(int ioRatio) {
  2. if (ioRatio <= 0 || ioRatio > 100) {
  3. throw new IllegalArgumentException("ioRatio: " + ioRatio + " (expected: 0 < ioRatio <= 100)");
  4. }
  5. this.ioRatio = ioRatio;
  6. }

首先,NioEventLoop 线程 没有调用该 set 方法,说明调整 IO 执行时间比例 是外部发起的操作,通常是由业务的线程调用该方法,重新设置该参数。这样就形成了一个线程写、一个线程读。根据前面针对 volatile 的应用总结,此时可以使用 volatile 来代替传统的 synchronized 关键字,以提升并发访问的性能。

ThreadLocal 的应用及源码解析

ThreadLocal 又称为线程本地存储区(Thread Local Storage,简称为 TLS),每个线程都有自己的私有的本地存储区域,不同线程之间彼此不能访问对方的 TLS 区域。使用 ThreadLocal 变量 的 set(T value)方法 可以将数据存入 该线程本地存储区,使用 get() 方法 可以获取到之前存入的值。

ThreadLocal 的常见应用

不使用 ThreadLocal。

  1. public class SessionBean {
  2. public static class Session {
  3. private String id;
  4. public String getId() {
  5. return id;
  6. }
  7. public void setId(String id) {
  8. this.id = id;
  9. }
  10. }
  11. public Session createSession() {
  12. return new Session();
  13. }
  14. public void setId(Session session, String id) {
  15. session.setId(id);
  16. }
  17. public String getId(Session session) {
  18. return session.getId();
  19. }
  20. public static void main(String[] args) {
  21. //没有使用ThreadLocal,在方法间共享session需要进行session在方法间的传递
  22. new Thread(() -> {
  23. SessionBean bean = new SessionBean();
  24. Session session = bean.createSession();
  25. bean.setId(session, "susan");
  26. System.out.println(bean.getId(session));
  27. }).start();
  28. }
  29. }

上述代码中,session 需要在方法间传递才可以修改和读取,保证线程中各方法操作的是一个。下面看一下使用 ThreadLocal 的代码。

  1. public class SessionBean {
  2. //定义一个静态ThreadLocal变量session,就能够保证各个线程有自己的一份,并且方法可以方便获取,不用传递
  3. private static ThreadLocal<Session> session = new ThreadLocal<>();
  4. public static class Session {
  5. private String id;
  6. public String getId() {
  7. return id;
  8. }
  9. public void setId(String id) {
  10. this.id = id;
  11. }
  12. }
  13. public void createSession() {
  14. session.set(new Session());
  15. }
  16. public void setId(String id) {
  17. session.get().setId(id);
  18. }
  19. public String getId() {
  20. return session.get().getId();
  21. }
  22. public static void main(String[] args) {
  23. new Thread(() -> {
  24. SessionBean bean = new SessionBean();
  25. bean.createSession();
  26. bean.setId("susan");
  27. System.out.println(bean.getId());
  28. }).start();
  29. }
  30. }

在方法的内部实现中,直接可以通过 session.get() 获取到当前线程的 session,省掉了参数在方法间传递的环节。

ThreadLocal 的实现原理

一般,类属性中的数据是多个线程共享的,但 ThreadLocal 类型的数据 声明为类属性,却可以为每一个使用它(通过 set(T value)方法)的线程存储 线程私有的数据,通过其源码我们可以发现其中的原理。

  1. public class ThreadLocal<T> {
  2. /**
  3. * 下面的 getMap()方法 传入当前线程,获得一个ThreadLocalMap对象,说明每一个线程维护了
  4. * 自己的一个 map,保证读取出来的value是自己线程的。
  5. *
  6. * ThreadLocalMap 是ThreadLocal静态内部类,存储value的键值就是ThreadLocal本身。
  7. *
  8. * 因此可以断定,每个线程维护一个ThreadLocalMap的键值对映射Map。不同线程的Map的 key值 是一样的,
  9. * 都是ThreadLocal,但 value 是不同的。
  10. */
  11. public T get() {
  12. Thread t = Thread.currentThread();
  13. ThreadLocalMap map = getMap(t);
  14. if (map != null) {
  15. ThreadLocalMap.Entry e = map.getEntry(this);
  16. if (e != null) {
  17. @SuppressWarnings("unchecked")
  18. T result = (T)e.value;
  19. return result;
  20. }
  21. }
  22. return setInitialValue();
  23. }
  24. public void set(T value) {
  25. Thread t = Thread.currentThread();
  26. ThreadLocalMap map = getMap(t);
  27. if (map != null)
  28. map.set(this, value);
  29. else
  30. createMap(t, value);
  31. }
  32. }

ThreadLocal 在 Spring 中的使用

Spring 事务处理的设计与实现中大量使用了 ThreadLocal 类,比如,TransactionSynchronizationManager 维护了一系列的 ThreadLocal 变量,用于存储线程私有的 事务属性及资源。源码如下。

  1. /**
  2. * 管理每个线程的资源和事务同步的中心帮助程序。供资源管理代码使用,但不供典型应用程序代码使用。
  3. *
  4. * 资源管理代码应该检查线程绑定的资源,如,JDBC连接 或 Hibernate Sessions。
  5. * 此类代码通常不应该将资源绑定到线程,因为这是事务管理器的职责。另一个选项是,
  6. * 如果事务同步处于活动状态,则在首次使用时延迟绑定,以执行跨任意数量资源的事务。
  7. */
  8. public abstract class TransactionSynchronizationManager {
  9. /**
  10. * 一般是一个线程持有一个 独立的事务,以相互隔离地处理各自的事务。
  11. * 所以这里使用了很多 ThreadLocal对象,为每个线程绑定 对应的事务属性及资源,
  12. * 以便后续使用时能直接获取。
  13. */
  14. private static final ThreadLocal<Map<Object, Object>> resources =
  15. new NamedThreadLocal<Map<Object, Object>>("Transactional resources");
  16. private static final ThreadLocal<Set<TransactionSynchronization>> synchronizations =
  17. new NamedThreadLocal<Set<TransactionSynchronization>>("Transaction synchronizations");
  18. private static final ThreadLocal<String> currentTransactionName =
  19. new NamedThreadLocal<String>("Current transaction name");
  20. private static final ThreadLocal<Boolean> currentTransactionReadOnly =
  21. new NamedThreadLocal<Boolean>("Current transaction read-only status");
  22. private static final ThreadLocal<Integer> currentTransactionIsolationLevel =
  23. new NamedThreadLocal<Integer>("Current transaction isolation level");
  24. private static final ThreadLocal<Boolean> actualTransactionActive =
  25. new NamedThreadLocal<Boolean>("Actual transaction active");
  26. /**
  27. * 为当前线程 绑定 对应的resource资源
  28. */
  29. public static void bindResource(Object key, Object value) throws IllegalStateException {
  30. Object actualKey = TransactionSynchronizationUtils.unwrapResourceIfNecessary(key);
  31. Assert.notNull(value, "Value must not be null");
  32. Map<Object, Object> map = resources.get();
  33. // 如果当前线程的 resources中,绑定的数据map为空,则为 resources 绑定 map
  34. if (map == null) {
  35. map = new HashMap<Object, Object>();
  36. resources.set(map);
  37. }
  38. Object oldValue = map.put(actualKey, value);
  39. if (oldValue instanceof ResourceHolder && ((ResourceHolder) oldValue).isVoid()) {
  40. oldValue = null;
  41. }
  42. if (oldValue != null) {
  43. throw new IllegalStateException("Already value [" + oldValue + "] for key [" +
  44. actualKey + "] bound to thread [" + Thread.currentThread().getName() + "]");
  45. }
  46. if (logger.isTraceEnabled()) {
  47. logger.trace("Bound value [" + value + "] for key [" + actualKey + "] to thread [" +
  48. Thread.currentThread().getName() + "]");
  49. }
  50. }
  51. /**
  52. * 返回当前线程绑定的所有资源
  53. */
  54. public static Map<Object, Object> getResourceMap() {
  55. Map<Object, Object> map = resources.get();
  56. return (map != null ? Collections.unmodifiableMap(map) : Collections.emptyMap());
  57. }
  58. }

ThreadLocal 在 Mybatis 中的使用

Mybatis 的 SqlSession 对象 也是各线程私有的资源,所以对其的管理也使用到了 ThreadLocal 类。源码如下。

  1. public class SqlSessionManager implements SqlSessionFactory, SqlSession {
  2. private final ThreadLocal<SqlSession> localSqlSession = new ThreadLocal<>();
  3. public void startManagedSession() {
  4. this.localSqlSession.set(openSession());
  5. }
  6. public void startManagedSession(boolean autoCommit) {
  7. this.localSqlSession.set(openSession(autoCommit));
  8. }
  9. public void startManagedSession(Connection connection) {
  10. this.localSqlSession.set(openSession(connection));
  11. }
  12. public void startManagedSession(TransactionIsolationLevel level) {
  13. this.localSqlSession.set(openSession(level));
  14. }
  15. public void startManagedSession(ExecutorType execType) {
  16. this.localSqlSession.set(openSession(execType));
  17. }
  18. public void startManagedSession(ExecutorType execType, boolean autoCommit) {
  19. this.localSqlSession.set(openSession(execType, autoCommit));
  20. }
  21. public void startManagedSession(ExecutorType execType, TransactionIsolationLevel level) {
  22. this.localSqlSession.set(openSession(execType, level));
  23. }
  24. public void startManagedSession(ExecutorType execType, Connection connection) {
  25. this.localSqlSession.set(openSession(execType, connection));
  26. }
  27. public boolean isManagedSessionStarted() {
  28. return this.localSqlSession.get() != null;
  29. }
  30. @Override
  31. public Connection getConnection() {
  32. final SqlSession sqlSession = localSqlSession.get();
  33. if (sqlSession == null) {
  34. throw new SqlSessionException("Error: Cannot get connection. No managed session is started.");
  35. }
  36. return sqlSession.getConnection();
  37. }
  38. @Override
  39. public void clearCache() {
  40. final SqlSession sqlSession = localSqlSession.get();
  41. if (sqlSession == null) {
  42. throw new SqlSessionException("Error: Cannot clear the cache. No managed session is started.");
  43. }
  44. sqlSession.clearCache();
  45. }
  46. @Override
  47. public void commit() {
  48. final SqlSession sqlSession = localSqlSession.get();
  49. if (sqlSession == null) {
  50. throw new SqlSessionException("Error: Cannot commit. No managed session is started.");
  51. }
  52. sqlSession.commit();
  53. }
  54. @Override
  55. public void commit(boolean force) {
  56. final SqlSession sqlSession = localSqlSession.get();
  57. if (sqlSession == null) {
  58. throw new SqlSessionException("Error: Cannot commit. No managed session is started.");
  59. }
  60. sqlSession.commit(force);
  61. }
  62. @Override
  63. public void rollback() {
  64. final SqlSession sqlSession = localSqlSession.get();
  65. if (sqlSession == null) {
  66. throw new SqlSessionException("Error: Cannot rollback. No managed session is started.");
  67. }
  68. sqlSession.rollback();
  69. }
  70. @Override
  71. public void rollback(boolean force) {
  72. final SqlSession sqlSession = localSqlSession.get();
  73. if (sqlSession == null) {
  74. throw new SqlSessionException("Error: Cannot rollback. No managed session is started.");
  75. }
  76. sqlSession.rollback(force);
  77. }
  78. @Override
  79. public List<BatchResult> flushStatements() {
  80. final SqlSession sqlSession = localSqlSession.get();
  81. if (sqlSession == null) {
  82. throw new SqlSessionException("Error: Cannot rollback. No managed session is started.");
  83. }
  84. return sqlSession.flushStatements();
  85. }
  86. @Override
  87. public void close() {
  88. final SqlSession sqlSession = localSqlSession.get();
  89. if (sqlSession == null) {
  90. throw new SqlSessionException("Error: Cannot close. No managed session is started.");
  91. }
  92. try {
  93. sqlSession.close();
  94. } finally {
  95. localSqlSession.set(null);
  96. }
  97. }
  98. }

J.U.C 包的实际应用

线程池 ThreadPoolExecutor

首先通过 ThreadPoolExecutor 的源码 看一下线程池的主要参数及方法。

  1. public class ThreadPoolExecutor extends AbstractExecutorService {
  2. /**
  3. * 核心线程数
  4. * 当向线程池提交一个任务时,若线程池已创建的线程数小于corePoolSize,即便此时存在空闲线程,
  5. * 也会通过创建一个新线程来执行该任务,直到已创建的线程数大于或等于corePoolSize
  6. */
  7. private volatile int corePoolSize;
  8. /**
  9. * 最大线程数
  10. * 当队列满了,且已创建的线程数小于maximumPoolSize,则线程池会创建新的线程来执行任务。
  11. * 另外,对于无界队列,可忽略该参数
  12. */
  13. private volatile int maximumPoolSize;
  14. /**
  15. * 线程存活保持时间
  16. * 当线程池中线程数 超出核心线程数,且线程的空闲时间也超过 keepAliveTime时,
  17. * 那么这个线程就会被销毁,直到线程池中的线程数小于等于核心线程数
  18. */
  19. private volatile long keepAliveTime;
  20. /**
  21. * 任务队列
  22. * 用于传输和保存等待执行任务的阻塞队列
  23. */
  24. private final BlockingQueue<Runnable> workQueue;
  25. /**
  26. * 线程工厂
  27. * 用于创建新线程。threadFactory 创建的线程也是采用 new Thread() 方式,threadFactory
  28. * 创建的线程名都具有统一的风格:pool-m-thread-n(m为线程池的编号,n为线程池中线程的编号
  29. */
  30. private volatile ThreadFactory threadFactory;
  31. /**
  32. * 线程饱和策略
  33. * 当线程池和队列都满了,再加入的线程会执行此策略
  34. */
  35. private volatile RejectedExecutionHandler handler;
  36. /**
  37. * 构造方法提供了多种重载,但实际上都使用了最后一个重载 完成了实例化
  38. */
  39. public ThreadPoolExecutor(int corePoolSize,
  40. int maximumPoolSize,
  41. long keepAliveTime,
  42. TimeUnit unit,
  43. BlockingQueue<Runnable> workQueue) {
  44. this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
  45. Executors.defaultThreadFactory(), defaultHandler);
  46. }
  47. public ThreadPoolExecutor(int corePoolSize,
  48. int maximumPoolSize,
  49. long keepAliveTime,
  50. TimeUnit unit,
  51. BlockingQueue<Runnable> workQueue,
  52. ThreadFactory threadFactory) {
  53. this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
  54. threadFactory, defaultHandler);
  55. }
  56. public ThreadPoolExecutor(int corePoolSize,
  57. int maximumPoolSize,
  58. long keepAliveTime,
  59. TimeUnit unit,
  60. BlockingQueue<Runnable> workQueue,
  61. RejectedExecutionHandler handler) {
  62. this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
  63. Executors.defaultThreadFactory(), handler);
  64. }
  65. public ThreadPoolExecutor(int corePoolSize,
  66. int maximumPoolSize,
  67. long keepAliveTime,
  68. TimeUnit unit,
  69. BlockingQueue<Runnable> workQueue,
  70. ThreadFactory threadFactory,
  71. RejectedExecutionHandler handler) {
  72. if (corePoolSize < 0 ||
  73. maximumPoolSize <= 0 ||
  74. maximumPoolSize < corePoolSize ||
  75. keepAliveTime < 0)
  76. throw new IllegalArgumentException();
  77. if (workQueue == null || threadFactory == null || handler == null)
  78. throw new NullPointerException();
  79. this.corePoolSize = corePoolSize;
  80. this.maximumPoolSize = maximumPoolSize;
  81. this.workQueue = workQueue;
  82. this.keepAliveTime = unit.toNanos(keepAliveTime);
  83. this.threadFactory = threadFactory;
  84. this.handler = handler;
  85. }
  86. /**
  87. * 执行一个任务,但没有返回值
  88. */
  89. public void execute(Runnable command) {
  90. if (command == null)
  91. throw new NullPointerException();
  92. int c = ctl.get();
  93. if (workerCountOf(c) < corePoolSize) {
  94. if (addWorker(command, true))
  95. return;
  96. c = ctl.get();
  97. }
  98. if (isRunning(c) && workQueue.offer(command)) {
  99. int recheck = ctl.get();
  100. if (! isRunning(recheck) && remove(command))
  101. reject(command);
  102. else if (workerCountOf(recheck) == 0)
  103. addWorker(null, false);
  104. }
  105. else if (!addWorker(command, false))
  106. reject(command);
  107. }
  108. /**
  109. * 提交一个线程任务,有返回值。该方法继承自其父类 AbstractExecutorService,有多种重载,这是最常用的一个。
  110. * 通过future.get()获取返回值(阻塞直到任务执行完)
  111. */
  112. public <T> Future<T> submit(Callable<T> task) {
  113. if (task == null) throw new NullPointerException();
  114. RunnableFuture<T> ftask = newTaskFor(task);
  115. execute(ftask);
  116. return ftask;
  117. }
  118. /**
  119. * 关闭线程池,不再接收新的任务,但会把已有的任务执行完
  120. */
  121. public void shutdown() {
  122. final ReentrantLock mainLock = this.mainLock;
  123. mainLock.lock();
  124. try {
  125. checkShutdownAccess();
  126. advanceRunState(SHUTDOWN);
  127. interruptIdleWorkers();
  128. onShutdown(); // hook for ScheduledThreadPoolExecutor
  129. } finally {
  130. mainLock.unlock();
  131. }
  132. tryTerminate();
  133. }
  134. /**
  135. * 立即关闭线程池,已有的任务也会被抛弃
  136. */
  137. public List<Runnable> shutdownNow() {
  138. List<Runnable> tasks;
  139. final ReentrantLock mainLock = this.mainLock;
  140. mainLock.lock();
  141. try {
  142. checkShutdownAccess();
  143. advanceRunState(STOP);
  144. interruptWorkers();
  145. tasks = drainQueue();
  146. } finally {
  147. mainLock.unlock();
  148. }
  149. tryTerminate();
  150. return tasks;
  151. }
  152. public boolean isShutdown() {
  153. return ! isRunning(ctl.get());
  154. }
  155. }

线程池执行流程,如下图所示。

avatar

Executors 提供的 4 种线程池

Executors 类 通过 ThreadPoolExecutor 封装了 4 种常用的线程池:CachedThreadPool,FixedThreadPool,ScheduledThreadPool 和 SingleThreadExecutor。其功能如下。

  1. CachedThreadPool:用来创建一个几乎可以无限扩大的线程池(最大线程数为 Integer.MAX_VALUE),适用于执行大量短生命周期的异步任务。
  2. FixedThreadPool:创建一个固定大小的线程池,保证线程数可控,不会造成线程过多,导致系统负载更为严重。
  3. SingleThreadExecutor:创建一个单线程的线程池,可以保证任务按调用顺序执行。
  4. ScheduledThreadPool:适用于执行 延时 或者 周期性 任务。

如何配置线程池

  • CPU 密集型任务
    尽量使用较小的线程池,一般为 CPU 核心数+1。 因为 CPU 密集型任务 使得 CPU 使用率 很高,若开过多的线程数,会造成 CPU 过度切换。

  • IO 密集型任务
    可以使用稍大的线程池,一般为 2*CPU 核心数。 IO 密集型任务 CPU 使用率 并不高,因此可以让 CPU 在等待 IO 的时候有其他线程去处理别的任务,充分利用 CPU 时间。

线程池的实际应用

Tomcat 在分发 web 请求 时使用了线程池来处理。

BlockingQueue

核心方法

  1. public interface BlockingQueue<E> extends Queue<E> {
  2. // 将给定元素设置到队列中,如果设置成功返回true, 否则返回false。如果是往限定了长度的队列中设置值,推荐使用offer()方法。
  3. boolean add(E e);
  4. // 将给定的元素设置到队列中,如果设置成功返回true, 否则返回false. e的值不能为空,否则抛出空指针异常。
  5. boolean offer(E e);
  6. // 将元素设置到队列中,如果队列中没有多余的空间,该方法会一直阻塞,直到队列中有多余的空间。
  7. void put(E e) throws InterruptedException;
  8. // 将给定元素在给定的时间内设置到队列中,如果设置成功返回true, 否则返回false.
  9. boolean offer(E e, long timeout, TimeUnit unit)
  10. throws InterruptedException;
  11. // 从队列中获取值,如果队列中没有值,线程会一直阻塞,直到队列中有值,并且该方法取得了该值。
  12. E take() throws InterruptedException;
  13. // 在给定的时间里,从队列中获取值,时间到了直接调用普通的 poll()方法,为null则直接返回null。
  14. E poll(long timeout, TimeUnit unit)
  15. throws InterruptedException;
  16. // 获取队列中剩余的空间。
  17. int remainingCapacity();
  18. // 从队列中移除指定的值。
  19. boolean remove(Object o);
  20. // 判断队列中是否拥有该值。
  21. public boolean contains(Object o);
  22. // 将队列中值,全部移除,并发设置到给定的集合中。
  23. int drainTo(Collection<? super E> c);
  24. // 指定最多数量限制将队列中值,全部移除,并发设置到给定的集合中。
  25. int drainTo(Collection<? super E> c, int maxElements);
  26. }

主要实现类

  • ArrayBlockingQueue
    基于数组的阻塞队列实现,在 ArrayBlockingQueue 内部,维护了一个定长数组,以便缓存队列中的数据对象,这是一个常用的阻塞队列,除了一个定长数组外,ArrayBlockingQueue 内部还保存着两个整形变量,分别标识着队列的头部和尾部在数组中的位置。
    ArrayBlockingQueue 在生产者放入数据 和 消费者获取数据时,都是共用同一个锁对象,由此也意味着两者无法真正并行运行,这点尤其不同于 LinkedBlockingQueue。ArrayBlockingQueue 和 LinkedBlockingQueue 间还有一个明显的不同之处在于,前者在插入或删除元素时不会产生或销毁任何额外的对象实例,而后者则会生成一个额外的 Node 对象。这在长时间内需要高效并发地处理大批量数据的系统中,其对于 GC 的影响还是存在一定的区别。而在创建 ArrayBlockingQueue 时,我们还可以控制对象的内部锁是否采用公平锁,默认采用非公平锁。

  • LinkedBlockingQueue
    基于链表的阻塞队列,同 ArrayListBlockingQueue 类似,其内部也维持着一个数据缓冲队列(该队列由一个链表构成),当生产者往队列中放入一个数据时,队列会从生产者手中获取数据,并缓存在队列内部,而生产者立即返回;只有当队列缓冲区达到最大值缓存容量时(LinkedBlockingQueue 可以通过构造函数指定该值),才会阻塞生产者队列,直到消费者从队列中消费掉一份数据,生产者线程会被唤醒,反之对于消费者这端的处理也基于同样的原理。而 LinkedBlockingQueue 之所以能够高效的处理并发数据,还因为其对于生产者端和消费者端分别采用了独立的锁来控制数据同步,这也意味着在高并发的情况下生产者和消费者可以并行地操作队列中的数据,以此来提高整个队列的并发性能。
    需要注意的是,如果构造一个 LinkedBlockingQueue 对象,而没有指定其容量大小,LinkedBlockingQueue 会默认一个类似无限大小的容量(Integer.MAX_VALUE),这样的话,如果生产者的速度一旦大于消费者的速度,也许还没有等到队列满阻塞产生,系统内存就有可能已被消耗殆尽了。

  • PriorityBlockingQueue
    基于优先级的阻塞队列(优先级的判断通过构造函数传入的 Compator 对象来决定),但需要注意的是 PriorityBlockingQueue 并不会阻塞数据生产者,而只会在没有可消费的数据时,阻塞数据的消费者。因此使用的时候要特别注意,生产者生产数据的速度绝对不能快于消费者消费数据的速度,否则时间一长,会最终耗尽所有的可用堆内存空间。在实现 PriorityBlockingQueue 时,内部控制线程同步的锁采用的是公平锁。

CAS 指令和原子类(应用比较多的就是计数器)

互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能的额外损耗,因此这种同步被称为阻塞同步,它属于一种悲观的并发策略,我们称之为悲观锁。随着硬件和操作系统指令集的发展和优化,产生了非阻塞同步,被称为乐观锁。简单地说,就是先进行操作,操作完成之后再判断操作是否成功,是否有并发问题,如果有则进行失败补偿,如果没有就算操作成功,这样就从根本上避免了同步锁的弊端。

目前,在 Java 中应用最广泛的非阻塞同步就是 CAS。从 JDK1.5 以后,可以使用 CAS 操作,该操作由 sun.misc.Unsafe 类里的 compareAndSwapInt() 和 compareAndSwapLong() 等方法实现。通常情况下 sun.misc.Unsafe 类 对于开发者是不可见的,因此,JDK 提供了很多 CAS 包装类 简化开发者的使用,如 AtomicInteger。使用 Java 自带的 Atomic 原子类,可以避免同步锁带来的并发访问性能降低的问题,减少犯错的机会。