一、线程模型基本介绍

  1. 不同的线程模式,对程序的性能有很大影响,为了搞清 Netty 线程模式,我们来系统的讲解下各个线程模式,最后看看 Netty 线程模型有什么优越性。
  2. 目前存在的线程模型有:传统阻塞 I/O 服务模型 和Reactor 模式
  3. 根据 Reactor 的数量和处理资源池线程的数量不同,有 3 种典型的实现
    • 单 Reactor 单线程;
    • 单 Reactor多线程;
    • 主从 Reactor多线程
  4. Netty 线程模式(Netty 主要基于主从 Reactor 多线程模型做了一定的改进,其中主从 Reactor 多线程模型有多个 Reactor)

    二、传统阻塞 I/O 服务模型

    image.png

    1、工作原理

  5. 黄色的框表示对象,蓝色的框表示线程。

  6. 白色的框表示方法(API)。

    2、模型特点

  7. 采用阻塞 IO 模式获取输入的数据。

  8. 每个连接都需要独立的线程完成数据的输入,业务处理,数据返回。

    3、问题分析

  9. 当并发数很大,就会创建大量的线程,占用很大系统资源。

  10. 连接创建后,如果当前线程暂时没有数据可读,该线程会阻塞在 Handler对象中的read 操作,导致上面的处理线程资源浪费。

    三、Reactor 模式

    Reactor 在不同书中的叫法:

    1. 反应器模式
    2. 分发者模式(Dispatcher)
    3. 通知者模式(notifier)

1、 针对传统阻塞 I/O 服务模型的 2 个缺点,解决方案

  1. 基于 I/O 复用模型:多个连接共用一个阻塞对象ServiceHandler,应用程序只需要在一个阻塞对象等待,无需阻塞等待所有连接。当某个连接有新的数据可以处理时,操作系统通知应用程序,线程从阻塞状态返回,开始进行业务处理。
  2. 基于线程池复用线程资源:不必再为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务。(解决了当并发数很大时,会创建大量线程,占用很大系统资源)。
  3. 基于 I/O 复用模型:多个客户端进行连接,先把连接请求给ServiceHandler。多个连接共用一个阻塞对象ServiceHandler。假设,当C1连接没有数据要处理时,C1客户端只需要阻塞于ServiceHandler,C1之前的处理线程便可以处理其他有数据的连接,不会造成线程资源的浪费。当C1连接再次有数据时,ServiceHandler根据线程池的空闲状态,将请求分发给空闲的线程来处理C1连接的任务。(解决了线程资源浪费的那个问题)

image.png

2、I/O 复用结合线程池,就是 Reactor 模式基本设计思想,如图

image.png

  1. Reactor 模式,通过一个或多个输入同时传递给服务处理器(ServiceHandler)的模式(基于事件驱动)。
  2. 服务器端程序处理传入的多个请求,并将它们同步分派到相应的处理线程,因此 Reactor 模式也叫 Dispatcher 模式。
  3. Reactor 模式使用 IO 复用监听事件,收到事件后,分发给某个线程(进程),这点就是网络服务器高并发处理关键。

    和传统阻塞IO对比可以发现,这里只有一个 serviceHandler 。。。。。以及其他差异请再次回顾 针对传统阻塞 I/O 服务模型的 2 个缺点,解决方案

3、Reactor 模式中核心组成

  1. Reactor(也就是那个ServiceHandler):Reactor 在一个单独的线程中运行,负责监听和分发事件,分发给适当的处理线程来对 IO 事件做出反应。它就像公司的电话接线员,它接听来自客户的电话并将线路转移到适当的联系人;
  2. Handlers(处理线程EventHandler):处理线程执行 I/O 事件要完成的实际事件,类似于客户想要与之交谈的公司中的实际官员。Reactor 通过调度适当的处理线程来响应 I/O 事件,处理程序执行非阻塞操作。

    四、单 Reactor 单线程模式

    image.png

    1、方案说明

  3. Select 是前面 I/O 复用模型介绍的标准网络编程 API,可以实现应用程序通过一个阻塞对象监听多路连接请求。

  4. Reactor 对象通过 Select 监控客户端请求事件,收到事件后通过 Dispatch 进行分发。
  5. 如果是建立连接请求事件,则由 Acceptor 通过 Accept 处理连接请求,然后创建一个 Handler 对象处理连接完成后的后续业务处理。
  6. 如果不是建立连接事件,则 Reactor 会分发调用连接对应的 Handler 来响应。
  7. Handler 会完成 Read → 业务处理 → Send 的完整业务流程。

结合实例:服务器端用一个线程通过多路复用搞定所有的 IO 操作(包括连接,读、写等),编码简单,清晰明了,但是如果客户端连接数量较多,将无法支撑,前面的 NIO 案例就属于这种模型。

2、方案优缺点说明

  1. 优点:模型简单,没有多线程、进程通信、竞争的问题,全部都在一个线程中完成。
  2. 缺点:性能问题,只有一个线程,无法完全发挥多核 CPU 的性能。Handler在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈。
  3. 缺点:可靠性问题,线程意外终止,或者进入死循环,会导致整个系统通信模块不可用,不能接收和处理外部消息,造成节点故障。
  4. 使用场景:客户端的数量有限,业务处理非常快速,比如 Redis 在业务处理的时间复杂度 O(1) 的情况。

    五、单 Reactor 多线程

    image.png

    1、方案说明

  5. Reactor 对象通过 Select 监控客户端请求事件,收到事件后,通过 Dispatch 进行分发。

  6. 如果是建立连接请求,则由 Acceptor 通过 accept 处理连接请求,然后创建一个 Handler 对象处理完成连接后的各种事件。
  7. 如果不是连接请求,则由 Reactor 分发调用连接对应的 handler 来处理(也就是说连接已经建立,后续客户端再来请求,那基本就是数据请求了,直接调用之前为这个连接创建好的handler来处理)。
  8. handler 只负责响应事件,不做具体的业务处理(这样不会使handler阻塞太久),通过 read 读取数据后,会分发给后面的 worker 线程池的某个线程处理业务。【业务处理是最费时的,所以将业务处理交给线程池去执行】。
  9. worker 线程池会分配独立线程完成真正的业务,并将结果返回给 handler。
  10. handler 收到响应后,通过 send 将结果返回给 client。

    2、方案优缺点说明

  11. 优点:可以充分的利用多核 cpu 的处理能力

  12. 缺点:多线程数据共享和访问比较复杂。Reactor 承担所有的事件的监听和响应,它是单线程运行,在高并发场景容易出现性能瓶颈。也就是说Reactor主线程承担了过多的事。

    六、主从 Reactor 多线程

    image.png
    针对单 Reactor 多线程模型中,Reactor 在单线程中运行,高并发场景下容易成为性能瓶颈,可以让 Reactor 在多线程中运行。

    SubReactor是可以有多个的,如果只有一个SubReactor的话那和单 Reactor 多线程就没什么区别了。 如下图

2-Reactor 模型 - 图7

1、方案说明

  1. Reactor 主线程 MainReactor 对象通过 select 监听连接事件,收到事件后,通过 Acceptor 处理连接事件
  2. 当 Acceptor 处理连接事件后,MainReactor 将连接分配给 SubReactor
  3. subreactor 将连接加入到连接队列进行监听,并创建 handler 进行各种事件处理
  4. 当有新事件发生时,subreactor 就会调用对应的 handler 处理
  5. handler 通过 read 读取数据,分发给后面的 worker 线程处理
  6. worker 线程池分配独立的 worker 线程进行业务处理,并返回结果
  7. handler 收到响应的结果后,再通过 send 将结果返回给 client
  8. Reactor 主线程可以对应多个 Reactor 子线程,即 MainRecator 可以关联多个 SubReactor

Scalable IO in Java 对 Multiple Reactors 的原理图解
image.png

image.png

2、方案优点和缺点

  1. 优点:父线程与子线程的数据交互简单职责明确,父线程只需要接收新连接,子线程完成后续的业务处理。
  2. 优点:父线程与子线程的数据交互简单,Reactor 主线程只需要把新连接传给子线程,子线程无需返回数据。
  3. 缺点:编程复杂度较高

结合实例:这种模型在许多项目中广泛使用,包括 Nginx 主从 Reactor 多进程模型,Memcached 主从多线程,Netty 主从多线程模型的支持

七、Reactor 模式小结

1、3 种模式用生活案例来理解

  1. 单 Reactor 单线程,前台接待员和服务员是同一个人,全程为顾客服
  2. 单 Reactor 多线程,1 个前台接待员,多个服务员,接待员只负责接待
  3. 主从 Reactor 多线程,多个前台接待员,多个服务生

    2、Reactor 模式具有如下的优点

  4. 响应快,不必为单个同步时间所阻塞,虽然 Reactor 本身依然是同步的(比如你第一个SubReactor阻塞了,我可以调下一个 SubReactor为客户端服务)

  5. 可以最大程度的避免复杂的多线程及同步问题,并且避免了多线程/进程的切换开销
  6. 扩展性好,可以方便的通过增加 Reactor 实例个数来充分利用 CPU 资源(即subReactor可以增加 主从reactor多线程
  7. 复用性好,Reactor 模型本身与具体事件处理逻辑无关,具有很高的复用性