1. 基本概念

1.1. 进程与线程

1.1.1. 二者概念

【进程】

  • 进程是操作系统结构的基础,是程序在一个数据集合上运行的过程,是系统进行资源分配和调度的基本单位
  • 程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至CPU,数据加载至内存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载指令、管理内存、管理IO等。
  • 当一个程序被运行,从磁盘加载这个程序的代码至内存,这时就开启了一个进程。
  • 进程就可以视为程序的一个实例。有的程序可以同时运行多个实例进程(浏览器),有的只能运行一个实例进程(QQ音乐)

【线程】

  • 线程是操作系统调度的最小单位,也叫作轻量级进程。
  • 一个进程内可以分为多个线程。
  • 一个线程就是一个指令流,将指令流中的一条条指令以一定的顺序交给CPU执行。
  • Java中,线程作为最小调度单位,进程作为资源分配的最小单位。在windows中进程是不活动的,只是作为线程的容器。

1.1.2. 二者区别

  • 进程基本上相互独立的,而线程存在于进程内,是进程的一个子集。
  • 迸程拥有共享的资源,如内存空间等,供其内部的线程共享。
  • 进程间通信较为复杂:
    • 同一台计算机的进程通信称为 IPC (Inter-process communication)。
    • 不同计算机之间的进程通信,需要通过网络,并遵守共同的协议,例如http。
  • 线程通信相对简单,因为它们共享进程内的内存,例如多个线程可以访问同一个共享变量。
  • 线程更轻量,线程上下文切换成本一般上要比进程上下文切换低。

1.2. 并行与并发

【并行 parallel】

在同一时刻,有多条指令在多个处理器上同时执行。在宏观上和微观上,都是一起执行的。

java并发(进程、线程、协程) - 图1

当系统有一个以上 CPU 时,则线程的操作有可能并行。当一个 CPU 执行一个线程时,另一个 CPU 可以执行另一个线程,两个线程互不抢占 CPU 资源,可以同时进行。

【并发 concurrency】

在同一时刻,只有一条指令执行,但多个指令被快速的轮换执行。在宏观上是一起执行的效果,在微观上不是一起执行。

java并发(进程、线程、协程) - 图2

当系统只有一个 CPU时,则它不可能同时进行一个以上的线程,只能把 CPU 运行时间划分成若干个时间段,再将时间段分配给各个线程执行,在一个时间段的线程代码运行时,其它线程处于挂起状态。


2. 线程

2.1. 线程运行的原理

2.1.1. 栈与栈帧

JVM 虚拟机在每个线程启动后,就会为其分配一块 Java 虚拟机栈内存。

java并发(进程、线程、协程) - 图3

  • 每个栈由多个栈帧组成,对应着每次方法调用时所占用的内存。
  • 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法。

2.1.2. 线程上下文切换

因为一些原因导致 CPU 不再执行当前的线程,转而执行另一个线程的代码。

  • 线程的 CPU 时间片用完。
  • 垃圾回收。
  • 有更高优先级的线程需要运行。
  • 线程自己调用了 sleepyieldwaitjoinparksynchronizedlock 等方法。

当上下文切换发生时,需要由操作系统保存当前线程的状态,并恢复另一个线程的状态,Java 中程序计数器就是用来记住下一条 JVM 指令的执行地址, 是线程私有的。

  • 状态包括程序计数器、虚拟机栈中每个栈帧的信息,如局部变量、操作数栈、返回地址等。
  • 上下文切换频繁发生会影响性能。

2.2. 创建线程

2.2.1. 直接创建 Thread

创建一个 Thread 对象,并重写 run 方法。

  1. Thread thread = new Thread("subThread"){
  2. @Override
  3. public void run() {
  4. System.out.println("run subThread!");
  5. }
  6. };
  7. thread.start();
  8. System.out.println("run main!");

run subThread!

run main!

2.2.2. 结合 Runnable

创建一个 Runnable 对象,并重写 run 方法;再创建一个 Thread 对象,并传入 Runnable 对象。

推荐使用:能使任务线程解耦。

  1. Runnable runnable = new Runnable() {
  2. @Override
  3. public void run() {
  4. System.out.println("run runnable!");
  5. }
  6. };
  7. Thread thread = new Thread(runnable, "subThread");
  8. thread.start();
  9. System.out.println("run main!");

run main!

run runnable!

2.2.3. 结合 FutureTask

创建一个 FutureTask 对象,并传入 Callable 对象且重写 call 方法;再创建一个 Thread 对象,并传入 FutureTask 对象。

用途FutureTask 能够接收 Callable 类型的参数,用来处理有返回结果的情况。

  1. FutureTask<Integer> futureTask = new FutureTask<>(new Callable<Integer>() {
  2. @Override
  3. public Integer call() throws Exception {
  4. System.out.println("run futureTask!");
  5. return 200;
  6. }
  7. });
  8. Thread thread = new Thread(futureTask, "subThread");
  9. thread.start();
  10. // 获取任务执行完后的返回值。会阻塞当前线程,直到任务结束返回之后,才继续运行
  11. System.out.println(futureTask.get());
  12. System.out.println("run main!");

run futureTask!

return 200

run main!

2.3. 常见方法

2.3.1. start() 与 run()

start()

  • 启动线程,真正的多线程运行,无需等待 run() 方法执行完毕而直接继续执行下面的代码。
  • 调用 start() 后,线程就处于就绪(可运行)状态,但并没有运行,一旦得到 CPU 时间片,就开始执行 run()run() 方法运行结束,此线程随即终止。
  1. Thread thread = new Thread(() -> System.out.println("run subThread!"));
  2. thread.start();
  3. System.out.println("run main!");

run main!

run subThread!

run()

  • 使用当前线程运行 run() 方法中的线程体,并不会创建一个线程,因此必须等待 run() 方法执行完毕后才能继续执行后面的代码。
  1. Thread thread = new Thread(() -> System.out.println("run subThread!"));
  2. thread.run();
  3. System.out.println("run main!");

run subThread!

run main!

2.3.2. sleep() 与 yield()

sleep():

  • 调用 sleep() 会让当前线程从 Running 进入Tined Waiting 状态。
  • 其它线程可以使用 interrupt() 方法打断正在睡眠的线程,这时 sleep()方法会抛出 InterruptedException
  • 睡眠结束后的线程未必会立刻得到执行。
  • 建议用 TimeUnitsleep() 代替 Threadsleep() 来获得更好的可读性。
  1. Thread thread = new Thread(() -> {
  2. try {
  3. // 内部进行单位换算,比Thread.sleep(1000)可读性更高
  4. TimeUnit.SECONDS.sleep(1);
  5. } catch (InterruptedException e) {
  6. e.printStackTrace();
  7. }
  8. });
  9. System.out.println(thread.getState()); // NEW
  10. thread.start();
  11. // 主线程先运行,则子线程可能还没执行run方法
  12. System.out.println(thread.getState()); // RUNNABLE 或 TIMED_WAITING
  13. // 子线程肯定已经执行到run方法
  14. Thread.sleep(100);
  15. System.out.println(thread.getState()); // TIMED_WAITING
  16. // 子线程在睡眠时被打断,则子线程抛出异常
  17. thread.interrupt(); // java.lang.InterruptedException: sleep interrupted。

yield():

  • 调用 yield() 会让当前线程从 Running 进入 Runnable 状态,然后调度执行其它同优先级的线程。如果这时没有同优先级的线程,那么不能保证让当前线程暂停的效果。
  • 主动让出 CPU 使用权,但如果只有一个线程在运行,则让不出去。具体的实现依赖于操作系统的任务调度器。

线程优先级:

  • 线程优先级会提示 (hint) 调度器优先调度该线程,但它仅仅是一个提示,调度器可以忽略它。
  • 如果 CPU 比较忙,优先级高的线程会获得更多的时间片,但 CPU 闲时,优先级几乎没作用。

sleep() 和 yield() 的应用

防止 CPU 利用率100%。在没有利用 CPU 来计算时(如:线程保活),不要让 while(true)空转浪费 CPU。这时可以使用 yield()sleep() 来让出 CPU 的使用权给其他程序。

  1. new Thread(() -> {
  2. while (true) {
  3. try {
  4. // 防止死循环中,CPU利用率达到100%
  5. TimeUnit.MILLISECONDS.sleep(50);
  6. } catch (InterruptedException e) {
  7. e.printStackTrace();
  8. }
  9. }
  10. }).start();

2.3.3. join()

等待线程运行结束。使异步并发变成同步并发执行,把多个线程按顺序执行。

  1. static int i = 0;
  2. public static void main(String[] args) throws Exception {
  3. Thread thread = new Thread(() -> {
  4. System.out.println("子线程开始");
  5. try {
  6. TimeUnit.SECONDS.sleep(1);
  7. } catch (InterruptedException e) {
  8. e.printStackTrace();
  9. }
  10. i = 100;
  11. System.out.println("子线程结束");
  12. });
  13. thread.start();
  14. System.out.println(i);
  15. }

由于主线程打印 i 的时候,子线程还没有对变量 i 赋值

0

子线程开始

子线程结束

  1. thread.start();
  2. thread.join();
  3. System.out.println(i);

如果加上 thread.join(); 则主线程会等待子线程运行结束后,再执行。

子线程开始

子线程结束

100

2.3.4. interrupt()

中断线程。

注意: 仅仅是把线程的运行状态置为中断状态,并不会停止线程。需自己去监视线程的状态(抛出 InterruptedException 的方法)为并做处理。

中断处于阻塞状态的线程:

sleep、wait、join 导致线程处于阻塞状态。

  1. Thread thread = new Thread(() -> {
  2. System.out.println("子线程开始");
  3. try {
  4. TimeUnit.SECONDS.sleep(2);
  5. } catch (InterruptedException e) {
  6. e.printStackTrace();
  7. }
  8. System.out.println("子线程结束");
  9. });
  10. thread.start();
  11. TimeUnit.SECONDS.sleep(1);
  12. System.out.println("主线程让主线程中断");
  13. thread.interrupt();
  14. // 如果中断是以InterruptedException形式抛出,则isInterrupted为false
  15. // 由于中断已经处理,所以中断标记恢复为false,否则isInterrupted为true
  16. System.out.println("中断标记:" + thread.isInterrupted());

子线程开始

主线程让子线程中断

子线程结束

java.lang.InterruptedException: sleep interrupted

中断标记:false

中断处于运行状态的线程:

  1. Thread thread = new Thread(() -> {
  2. System.out.println("子线程开始");
  3. while (true) {
  4. // isInterrupted()为true,终止死循环,则子线程结束
  5. if (Thread.currentThread().isInterrupted()) break;
  6. }
  7. System.out.println("子线程结束");
  8. });
  9. thread.start();
  10. TimeUnit.SECONDS.sleep(1);
  11. System.out.println("主线程让子线程中断");
  12. thread.interrupt();
  13. TimeUnit.SECONDS.sleep(1);
  14. // 同理,由于子线程内部已经处理了此次中断,所以中断标记恢复为false
  15. System.out.println("中断标记:" + thread.isInterrupted());

子线程开始

主线程让子线程中断

子线程结束

打断标记:false

中断处于Park状态的线程:

  1. Thread thread = new Thread(() -> {
  2. System.out.println("子线程park");
  3. LockSupport.park();
  4. System.out.println("子线程unpark");
  5. System.out.println("中断标记:" + Thread.currentThread().isInterrupted());
  6. LockSupport.park(); // 由于中断标记为true,因此再次park无效
  7. System.out.println("子线程继续运行");
  8. });
  9. thread.start();
  10. TimeUnit.SECONDS.sleep(1);
  11. System.out.println("主线程让子线程中断");
  12. thread.interrupt();

子线程park

主线程让子线程中断

子线程unpark

中断标记:true

子线程继续运行

2.4. 终止线程-两阶段终止法

A线程优雅的停止B线程,并让B线程完成收尾工作。

java并发(进程、线程、协程) - 图4

  1. Thread thread = new Thread(() -> {
  2. System.out.println("子线程开始");
  3. while (true) {
  4. if (Thread.currentThread().isInterrupted()) {
  5. // 运行过程中被中断
  6. System.out.println("执行收尾工作");
  7. break;
  8. }
  9. try {
  10. TimeUnit.SECONDS.sleep(1);
  11. System.out.println("执行循环任务");
  12. } catch (InterruptedException e) {
  13. e.printStackTrace();
  14. // 睡眠过程中被中断
  15. // 抛出异常后中断标记会置为false,所以需要手动将中断标记设为true,以便下一轮循环时能退出
  16. Thread.currentThread().interrupt();
  17. }
  18. }
  19. System.out.println("子线程结束");
  20. });
  21. thread.start();
  22. // 三秒钟之后中断线程
  23. TimeUnit.SECONDS.sleep(3);
  24. thread.interrupt();

子线程开始

执行循环任务

执行循环任务

执行循环任务

java.lang.InterruptedException: sleep interrupted

执行收尾工作

子线程结束

2.5. 主线程与守护线程

只要有一个线程未结束,进程就不会结束。因此,如果需要主线程运行结束,守护线程(如 GC 线程)也同时结束,则需要将该线程设置为守护线程。

  1. Thread thread = new Thread(() -> {
  2. while (true) {
  3. if (Thread.currentThread().isInterrupted()) break;
  4. }
  5. // 守护线程在循环中突然结束,后面的代码不会执行。
  6. System.out.println("守护线程结束");
  7. });
  8. // 设置为守护线程
  9. thread.setDaemon(true);
  10. thread.start();
  11. TimeUnit.SECONDS.sleep(1);
  12. System.out.println("主线程结束");

2.6. 线程的状态(五种)

从操作系统层面来理解。

java并发(进程、线程、协程) - 图5

  1. 新建状态(New): 线程对象被创建,未与操作系统线程关联。例如 Thread thread = new Thread()
  2. 就绪状态(Runnable): 线程对象被创建后,其它线程调用了该对象的 start() 方法来启动该线程,与操作系统线程关联。这种状态随时可能被CPU调度执行。
  3. 运行状态(Running): 线程获取 CPU 权限进行执行。且线程只能从就绪状态进入到运行状态。如果 CPU 时间片用完,又会切换到就绪状态,同时发生线程上线文切换。
  4. 阻塞状态(Blocked): 阻塞状态是线程因为某种原因放弃 CPU 使用权,暂时停止运行。直到线程进入就绪状态,才有机会转到运行状态。阻塞的情况分三种
  • 等待阻塞:通过调用线程的 wait() 方法,让线程等待某工作的完成。
  • 同步阻塞:线程在获取 synchronized 同步锁失败(锁被其它线程占用)。
  • 其他阻塞:通过调用线程的 sleep()join() 或发出了 I/O 请求时,线程会进入到阻塞状态。当 sleep() 状态超时、join() 等待线程终止或者超时、或者 I/O 处理完毕时,线程重新转入就绪状态。
  1. 终止状态(Dead): 线程正常结束或异常退出了 run() 方法,该线程生命周期结束。

2.7. 线程的状态(六种)

从 Java API (Thread.State)层面来理解。

java并发(进程、线程、协程) - 图6

  1. 初始(NEW): 新创建了一个线程对象,但还没有调用 start() 方法。
  2. 运行(RUNNABLE): Java 线程中将就绪(ready)和运行中(running)两种状态笼统的称为 “运行”。线程对象创建后,其他线程 (比如 main 线程)调用了该对象的 start() 方法。该状态的线程位于可运行线程池中,等待被线程调度选中,获取 CPU 的使用权,此时处于就绪状态(ready)。就绪状态的线程在获得 CPU 时间片后变为运行中状态(running)。
  3. 阻塞(BLOCKED): 表示线程阻塞于锁。
  4. 等待(WAITING): 进入该状态的线程需要等待其他线程做出一些特定动作(通知或中断)。
  5. 超时等待(TIMED_WAITING): 该状态不同于 WAITING,它可以在指定的时间后自行返回。
  6. 终止(TERMINATED): 表示该线程已经执行完毕。
  1. // NEW:只创建,但是没有运行
  2. Thread thread1 = new Thread(() -> {
  3. });
  4. // RUNNABLE:一直运行
  5. Thread thread2 = new Thread(() -> {
  6. while (true) {
  7. }
  8. });
  9. thread2.start();
  10. // TERMINATED:很快就运行结束了
  11. Thread thread3 = new Thread(() -> {
  12. });
  13. thread3.start();
  14. // TIMED_WAITING:睡眠1小时,计时等待。同时对Main.class加锁
  15. Thread thread4 = new Thread(() -> {
  16. synchronized (Main.class) {
  17. try {
  18. TimeUnit.HOURS.sleep(1);
  19. } catch (InterruptedException e) {
  20. e.printStackTrace();
  21. }
  22. }
  23. });
  24. thread4.start();
  25. // WAITING:等待thread2运行完毕,不计时等待
  26. Thread thread5 = new Thread(() -> {
  27. try {
  28. thread2.join();
  29. } catch (InterruptedException e) {
  30. e.printStackTrace();
  31. }
  32. });
  33. thread5.start();
  34. // BLOCKED:thread4已经对Main.class加锁,等待thread4把锁释放
  35. Thread thread6 = new Thread(() -> {
  36. synchronized (Main.class) {
  37. }
  38. });
  39. thread6.start();

3. 协程

3.1. 概念

协程(Coroutine)最直观的解释是线程中的线程轻量级线程或者用户态线程,一个线程可以拥有多个协程,且不被操作系统内核管理,完全由程序所控制(即协程的调度、切换都发生在用户态)。

⭐️ Java 语言并没有对协程的原生支持,但是某些开源框架(Kilim)模拟出了协程的功能。以后的代码使用 JavaScript 来演示:

【线程的缺点】

  • 线程中的同步锁是重量级操作。
  • 线程在阻塞状态和可运行状态之间切换,需要耗费一定的 CPU 资源。
  • 线程的上线文切换,需要耗费一定的 CPU 资源。

【协程的优点】

  • 不会引起线程上下文切换。
  • 协程的开销远远小于线程的开销。

3.2. 运行流程

【普通函数】

  1. function fun() {
  2. console.log("A"); // A
  3. console.log("B"); // B
  4. console.log("C"); // C
  5. }
  1. 调用 fun。
  2. fun 开始执行函数体。
  3. fun 执行完成,return。

【协程函数】

协程是一个很神奇的函数,它会自己记住之前的执行状态,当再次调用时会从上一次的返回点继续执行。

  1. function* fun() {
  2. yield console.log("A");
  3. // 暂停
  4. yield console.log("B");
  5. // 暂停
  6. yield console.log("C");
  7. }
  8. var gen = fun();
  9. gen.next(); // A
  10. gen.next(); // B
  11. gen.next(); // C

【多协程函数】

  1. function* fun1() {
  2. yield console.log("A");
  3. // 暂停
  4. yield console.log("B");
  5. // 暂停
  6. yield console.log("C");
  7. }
  8. function* fun2() {
  9. yield console.log("X");
  10. // 暂停
  11. yield console.log("Y");
  12. // 暂停
  13. yield console.log("Z");
  14. }
  15. var gen1 = fun1();
  16. var gen2 = fun2();
  17. // 两个函数交替执行
  18. gen1.next(); // A
  19. gen2.next(); // X
  20. gen1.next(); // B
  21. gen2.next(); // Y
  22. gen1.next(); // C
  23. gen2.next(); // Z

java并发(进程、线程、协程) - 图7

协程会在函数被暂停运行时保存函数的运行状态,并可以从保存的状态中恢复并继续运行。

3.3. 原理分析

  • 理论基础:每一个方法调用就是方法栈中的一个栈帧,如果使栈顶的栈帧暂停运行并弹出至堆中保存,等需要继续运行时,再从堆压入到栈中继续运行。
  • 原理:在堆中维护一个协程栈区,协程函数不再在方法栈中运行,而是在协程栈中运行,这样就可以随时中断或者恢复协程的执行了。
  • 优点:只要堆区空间足够大,理论上可以使用协程来开启无数并发执行流,同时还没有创建线程的开销,在操作系统看来依然只有一个线程。