1. I/O介绍

网络IO：本质是socket读取

磁盘IO

每次I/O，都要经历两个阶段：
- 第一步：将数据从磁盘文件先加载到内核内存空间（缓冲区），等待数据准备完成，时间较长
- 第二部：将数据从内核缓冲区复制到用户空间得进程的内存中，时间较短

2. I/O模型

同步/异步：关注的是消息通信机制
- 同步: synchronous ,调用者等待被调用者返回消息,才能继续执行
- 异步: asynchronous ,被调用者通过状态、通知或回调机制主动通知调用者被调用者的运行状态
阻塞/非阻塞：关注调用者在等待结果返回之前所处的状态
- 阻塞: blocking ,指IO操作需要彻底完成后才返回到用户空间,调用结果返回之前,调用者被挂起
- 非阻塞: nonblocking ,指IO操作被调用后立即返回给用户一个状态值,无需等到IO操作彻底完成,最终的调用结果返回之前,调用者不会被挂起
I/O模型:
阻塞型、非阻塞型、复用型、信号驱动型、异步

同步阻塞IO模型是最简单的IO模型,用户线程在内核进行IO操作时被阻塞
用户线程通过系统调用read发起IO读操作,由用户空间转到内核空间。内核等
到数据包到达后,然后将接收的数据拷贝到用户空间，完成read操作
用户需要等待read将数据读取到buffer后,才继续处理接收的数据。整个IO请
求的过程中，用户线程是被阻塞的，这导致用户在发起IO请求时,不能做任何
事情,对CPU的资源利用率不够

多个连接共用一个等待机制,本模型会阻塞进程,但是进程是阻塞在select或者poll这两
个系统调用上,而不是阻塞在真正的IO操作上
用户首先将需要进行IO操作添加到select中,继续执行做其他的工作(异步) , 同时等
待select系统调用返回。当数据到达时, IO被激活, select函数返回。用户线程正式发起
read请求,读取数据并继续执行。
从流程上来看,使用select函数进行IO请求和同步阻塞模型没有太大的区别，甚至还多
了添加监视IO ,以及调用select函数的额外操作,效率更差。并且阻塞了两次,但是第.
一次阻塞在select 上时，select可以监控多个IO上是否已有IO操作准备就绪,即可达到在
同一个线程内同时处理多个IO请求的目的。而不像阻塞IO那种，一次只能监控一个IO
虽然上述方式允许单线程内处理多个IO请求,但是每个IO请求的过程还是阻塞的(在
select函数上阻塞) , 平均时间甚至比同步阻塞IO模型还要长。如果用户线程只是注册
自己需要的IO请求,然后去做自己的事情,等到数据到来时再进行处理,则可以提高
CPU的利用率
IO多路复用是最常使用的IO模型,但是其异步程度还不够“彻底”, 因它使用了会阻塞
线程的select系统调用。因此IO多路复用只能称为异步阻塞IO模型，而非真正的异步IO

select，poll，epoll都是IO多路复用的机制。
I/O多路复用就是通过一种机制，一个进程可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。
但select，poll，epoll本质上都是同步I/O，因为他们都需要在读写事件就绪后自己负责进行读写，也就是说这个读写过程是阻塞的，而异步I/O则无需自己负责进行读写，异步I/O的实现会负责把数据从内核拷贝到用户空间。 | / | select | poll | epoll | | —- | —- | —- | :—-: | | 操作方式 | 遍历 | 遍历 | 回调 | | 底层实现 | 数组 | 链表 | 哈希表 | | IO效率 | 每次调用都是线性遍历，时间复杂度O(n) | 每次调用都是线性遍历，时间复杂度O(n) | 事件通知方式,每当fd就绪,系统注册的回调函数就会被调用,将就绪rdlist里面。时间复杂度O(1) | | 最大连接数 | 1024 (x86)或2048 (x64) | 无上限 | 无上限 | | FD拷贝 | 每次调用select ,都需要把fd集合从用户态拷贝到内核态 | 每次调用poll,都需要把fd集合从用户态拷贝到内核态 | 调用epoll _ct时拷贝进内核并保存,之后每次epoll_wait坏拷贝 |

可跨平台
本质上是通过设置或者检查存放fd标志位的数据结构（数组）来进行下一步处理
缺点：
- 监听端口数量有限（cat/proc/sys/fs/file-max）
- 对socket是轮询的方法，效率较低
- select采取了内存拷贝方法来实现内核将FD消息通知给用户空间,这样一个用来存放大量fd的数据结构,这样会使得用户空间和内核空间在传递该结构时复制开销大

支持水平触发LT和边缘触发ET ，最大的特点在于边缘触发，它只告诉进程哪
些fd刚刚变为就需态，并且只会通知一次
使用”事件”的就绪通知方式，通过epoll_ ctl注册fd , 一旦该fd就绪，内核
就会采用类似callback的回调机制来激活该fd ， epoll _wait便可以收到通知
点:
没有最大并发连接的限制：能打开的FD的上限远大于1024(1G的内存能监听
约10万个端口)
效率提升：非轮询的方式,不会随着FD数目的增加而效率下降;只有活跃可
用的FD才会调用callback函数，即epoll最大的优点就在于它只管理“活跃”
的连接,而跟连接总数无关
内存拷贝，利用mmap(Memory Mapping)加速与内核空间的消息传递；即
epoll使用mmap减少复制开销