7.多路复用器 - 《Nginx 文档》

1、多进程/多线程链接处理模型

在该模型下，一个用户连接请求会由一个内核进程处理，而一个内核进程会创建一个应用程序进程，即 app 进程来处理该连接请求。应用程序进程在调用 IO 时，采用的是 BIO 通讯方式，即应用程序进程在未获取到 IO 响应之前是处于阻塞态的。
优点：内核进程不存在对app进程的竞争
弊端：请求多的时候，需要创建很多app进程，创建进程的过程是十分消耗资源的，所以该模型不能处理高并发。app进程中使用的用于链接请求数据是从内核进程复制过来的，没有使用零拷贝，因此效率低，消耗资源。

2、多路复用处理模型

在该模型下，只有一个 app 进程来处理内核进程事务，且 app 进程一次只能处理一个内核进程事务。故这种模型对于内核进程来说，存在对 app 进程的竞争。
在前面的“多进程/多线程连接处理模型”中我们说过，app 进程只要被创建了就会执行内核进程事务。那么在该模型下，应用程序进程应该执行哪个内核进程事务呢？谁的准备就绪了，app 进程就执行哪个。但 app 进程怎么知道哪个内核进程就绪了呢？需要通过“多路复用器”来获取各个内核进程的状态信息。那么多路复用器又是怎么获取到内核进程的状态信息的呢？不同的多路复用器，其算法不同。常见的有三种：select、poll 与 epoll。
1）select多路复用器
select 多路复用器是采用轮询的方式，一直在轮询所有的相关内核进程，查看它们的进程状态。若已经就绪，则马上将该内进程放入到就绪队列。否则，继续查看下一个内核进程状态。在处理内核进程事务之前，app 进程首先会从内核空间中将用户连接请求相关数据复制到用户空间。在处理内核进程事务之前，app 进程首先会从内核空间中将用户连接请求相关数据复制到用户空间。
该多路复用器的缺陷有以下几点：
A、对所有内核进程采用轮询的方式效率会很低，因为大部分时间，内核进程都不属于就绪状态，只有少部分是就绪状态，所以这种轮询结果大多数都是无意义的。
B、由于就绪队列底层由数组实现，所以其能处理的内核进程数量是有限制的，即其能处理的最大并发数量是有限制的。
C、从内核空间复制到用户空间，会有一定的系统开销。
2）poll多路复用器
poll 多路复用器的工作原理与 select 几乎相同，不同的是，由于其就绪队列由链表实现，所以，其对于要处理的内核进程数量理论上是没有限制的，即其能够处理的最大并发连接数量是没有限制的（当然，要受限于当前系统中进程可以打开的最大文件描述符数 ulimit，后面会讲到）。
3）epoll多路复用器
epoll 多路复用是对 select 与 poll 的增强与改进。其不再采用轮询方式了，而是采用回调方式实现对内核进程状态的获取：一旦内核进程就绪，其就会回调 epoll 多路复用器，进入到多路复用器的就绪队列（由链表实现）。所以 epoll 多路复用模型也称为 epoll 事件驱动模型。
另外，应用程序所使用的数据，也不再从内核空间复制到用户空间了，而是使用 mmap零拷贝机制，大大降低了系统开销。
当内核进程就绪信息通知了 epoll 多路复用器后，多路复用器就会马上对其进行处理，将其马上存放到就绪队列吗？不是的。根据处理方式的不同，可以分为两种处理模式：LT模式与 ET 模式。
A、LT模式，LT，Level Triggered，水平触发模式。即内核进程会不断的通知多路复用器已经处于就绪状态，直到多路复用器将其放入就绪队列，或是用户请求链接取消。这种方式相对相率低，但是不会丢失请求。
B、ET模式，ET，Edge Triggered，边缘出发模式。即内核进程仅会通知多路复用器一次，如果多路复用器没有将其加入就绪队列，这该次请求会被丢弃。这种方式效率高，但是请求会丢失。