操作系统 - 设备管理 - 《编程学习》

1、常见的几种磁盘调度算法？
2、常⻅的IO模型，五种？异步IO应⽤场景？有什么缺点？
3、IO复⽤的原理？零拷⻉？三个函数？epoll 的 LT 和 ET 模式的理解。

1、常见的几种磁盘调度算法？

读写一个磁盘块的时间的影响因素有：

旋转时间（主轴转动盘面，使得磁头移动到适当的扇区上）
寻道时间（制动手臂移动，使得磁头移动到适当的磁道上）
实际的数据传输时间

其中，寻道时间最长，因此磁盘调度的主要目标是使磁盘的平均寻道时间最短。
1. 先来先服务
按照磁盘请求的顺序进行调度。
优点是公平和简单。缺点也很明显，因为未对寻道做任何优化，使平均寻道时间可能较长。
2. 最短寻道时间优先
优先调度与当前磁头所在磁道距离最近的磁道。
虽然平均寻道时间比较低，但是不够公平。如果新到达的磁道请求总是比一个在等待的磁道请求近，那
么在等待的磁道请求会一直等待下去，也就是出现饥饿现象。具体来说，两端的磁道请求更容易出现饥
饿现象。
3. 电梯扫描算法
电梯总是保持一个方向运行，直到该方向没有请求为止，然后改变运行方向。
电梯算法（扫描算法）和电梯的运行过程类似，总是按一个方向来进行磁盘调度，直到该方向上没有未
完成的磁盘请求，然后改变方向。
因为考虑了移动方向，因此所有的磁盘请求都会被满足，解决了 SSTF 的饥饿问题。

2、常⻅的IO模型，五种？异步IO应⽤场景？有什么缺点？

1) 同步
就是在发出⼀个功能调⽤时，在没有得到结果之前，该调⽤就不返回。*也就是必须⼀件⼀件事做*,等前⼀件做完了才能做下⼀件事。就是我调⽤⼀个功能，该功能没有结束前，我死等结果。
2) 异步
当⼀个异步过程调⽤发出后，调⽤者不能⽴刻得到结果。实际处理这个调⽤的部件在完成后，通过状态、通知和回调来通知调⽤者。就是我调⽤⼀个功能，不需要知道该功能结果，该功能有结果后通知我（回调通知）
3) 阻塞
阻塞调⽤是指调⽤结果返回之前，当前线程会被挂起（线程进⼊⾮可执⾏状态，在这个状态下，cpu不会给线程分配时间⽚，即线程暂停运⾏）。函数只有在得到结果之后才会返回。对于同步调⽤来说，很多时候当前线程还是激活的，只是从逻辑上当前函数没有返回⽽已。就是调⽤我（函数），我（函数）没有接收完数据或者没有得到结果之前，我不会返回。
4) ⾮阻塞
指在不能⽴刻得到结果之前，该函数不会阻塞当前线程，⽽会⽴刻返回。就是调⽤我（函数），我（函数）⽴即返回，通过select通知调⽤者。
IO模型
1) 阻塞I/O
应⽤程序调⽤⼀个IO函数，导致应⽤程序阻塞，等待数据准备好。如果数据没有准备好，⼀直等待….数据准备好了，从内核拷⻉到⽤户空间,IO函数返回成功指示。
2) ⾮阻塞I/O
我们把⼀个SOCKET接⼝设置为⾮阻塞就是告诉内核，当所请求的I/O操作⽆法完成时，不要将进程睡眠，⽽是返回⼀个错误。这样我们的I/O操作函数将不断的测试数据是否已经准备好，如果没有准备好，继续测试，直到数据准备好为⽌。在这个不断测试的过程中，会⼤ᰁ的占⽤CPU的时间。
3) I/O复⽤
I/O复⽤模型会⽤到select、poll、epoll函数，这⼏个函数也会使进程阻塞，但是和阻塞I/O所不同的的，这三个函数可以同时阻塞多个I/O操作。⽽且可以同时对多个读操作，多个写操作的I/O函数进⾏检测，直到有数据可读或可写时，才真正调⽤I/O操作函数。
4) 信号驱动I/O
⾸先我们允许套接⼝进⾏信号驱动I/O,并安装⼀个信号处理函数，进程继续运⾏并不阻塞。当数据准备好时，进程会收到⼀个SIGIO信号，可以在信号处理函数中调⽤I/O操作函数处理数据。
5) 异步I/O
当⼀个异步过程调⽤发出后，调⽤者不能⽴刻得到结果。实际处理这个调⽤的部件在完成后，通过状态、通知和回调来通知调⽤者的输⼊输出操作

3、IO复⽤的原理？零拷⻉？三个函数？epoll 的 LT 和 ET 模式的理解。

1) IO复⽤是Linux中的IO模型之⼀，IO复⽤就是进程预先告诉内核需要监视的IO条件，使得内核⼀旦发现进程指定的⼀个或多个IO条件就绪，就通过进程进程处理，从⽽不会在单个IO上阻塞了。Linux中，提供了select、poll、 epoll三种接⼝函数来实现IO复⽤。
2) Select
select的缺点：
① 单个进程能够监视的⽂件描述符的数ᰁ存在最⼤限制，通常是1024。由于select采⽤轮询的⽅式扫描⽂件描述符，⽂件描述符数量越多，性能越差；
② 内核/⽤户空间内存拷⻉问题，select需要⼤量句柄数据结构，产⽣巨⼤开销；
③ Select返回的是含有整个句柄的数组，应⽤程序需要遍历整个数组才能发现哪些句柄发⽣事件；
④ Select的触发⽅式是⽔平触发，应⽤程序如果没有完成对⼀个已经就绪的⽂件描述符进⾏IO操作，那么每次select调⽤还会将这些⽂件描述符通知进程。
3) Poll
与select相⽐，poll使⽤链表保存⽂件描述符，没有了监视⽂件数量的限制，但其他三个缺点依然存在
4) Epoll
上⾯所说的select缺点在epoll上不复存在，epoll使⽤⼀个⽂件描述符管理多个描述符，将⽤户关系的⽂件描述符的事件存放到内核的⼀个事件表中，这样在⽤户空间和内核空间的copy只需⼀次。Epoll是事件触发的，不是轮询查询的。没有最⼤的并发连接限制，内存拷⻉，利⽤mmap（）⽂件映射内存加速与内核空间的消息传递。
区别总结：
1) ⽀持⼀个进程所能打开的最⼤连接数
① Select最⼤1024个连接，最⼤连接数有FD_SETSIZE宏定义，其⼤⼩是32位整数表示，可以改变宏定义进⾏修改，可以重新编译内核，性能可能会影响；
② Poll没有最⼤连接限制，原因是它是基于链表来存储的；
③ 连接数限数有上限，但是很⼤；
2) FD剧增后带来的IO效率问题
① 因为每次进⾏线性遍历，所以随着FD的增加会造成遍历速度下降，效率降低；
② Poll同上；
③ 因为epool内核中实现是根据每个fd上的callback函数来实现的，只有活跃的socket才会主动调⽤callback，所以在活跃socket较少的情况下，使⽤epoll没有前⾯两者的现象下降的性能问题。
3) 消息传递⽅式
① Select内核需要将消息传递到⽤户空间，都需要内核拷⻉；
② Poll同上；
③ Epoll通过内核和⽤户空间共享来实现的。
epoll 的 LT 和 ET 模式的理解：
epoll对⽂件描述符的操作有两种模式：LT(level trigger)和ET(edge trigger)，LT是默认模式。
区别：
LT模式：当epoll_wait检测到描述符事件发⽣并将此事件通知应⽤程序，应⽤程序可以不⽴即处理该事件。下次调⽤epoll_wait时，会再次响应应⽤程序并通知此事件。
ET模式：当epoll_wait检测到描述符事件发⽣并将此事件通知应⽤程序，应⽤程序必须⽴即处理该事件。如果不处理，下次调⽤epoll_wait时，不会再次响应应⽤程序并通知此事件。
在 select/poll中，进程只有在调⽤⼀定⽅法后，内核才对所有监视的⽂件描述符进⾏扫描，⽽epoll事先通过epoll_ctl()来注册⼀个⽂件描述符，⼀旦某个⽂件描述符就绪时，内核会采⽤类似callback的回调机制，迅速激活这个⽂件描述符，当进程调⽤epoll_wait时便得到通知（此处去掉了遍历⽂件描述符，⽽是通过监听回调的机制，这也是epoll的魅⼒所在）。
Epoll 的优点主要体现咋如下⼏个⽅⾯：
1. 监视的描述符不受限制，它所⽀持的FD上限是最⼤可以打开⽂件的数⽬，这个数字⼀般远⼤于2048，举个例子，具体数⽬可以在cat/proc/sys/fs/file-max 查看，⼀般来说，这个数⽬和内存关系很⼤。
2. Select最⼤的缺点是进程打开的fd数⽬是有限制的，这对于连接数⽬较⼤的服务器来说根本不能满⾜，虽然也可以选择多进程的解决⽅案（Apache就是如此）；不过虽然linux上⾯创建进程的代价较⼩，但仍旧不可忽视，加上进程间数据同步远⽐不上线程间同步⾼效，所以并不是⼀种完美的解决⽅案。
3. IO的效率不会随着监视fd的数量的增⻓⽽下降，epoll不同于select和poll的轮询⽅式，⽽是通过每个fd定义的回调函数来实现，只有就绪的fd才会执⾏回调函数。
4. 如果没有⼤量的idle -connection或者dead-connection，epoll的效率并不会⽐select/poll⾼很多，但是当遇到⼤量的idle- connection，就会发现epoll的效率⼤⼤⾼于select/poll。