17.1 epoll 理解及应用

select 复用方法由来已久,因此,利用该技术后,无论如何优化程序性能也无法同时介入上百个客户端。这种 select 方式并不适合以 web 服务器端开发为主流的现代开发环境,所以需要学习 Linux 环境下的 epoll。

17.1.1 基于 select 的 I/O 复用技术速度慢的原因

第 12 章实现了基于 select 的 I/O 复用技术服务端,其中有不合理的设计如下:

  • 调用 select 函数后针对所有文件描述符的轮询;
  • 每次调用 select 函数时都需要向该函数传递监视对象信息

调用 select 函数后,并不是直接返回发生变化的文件描述符集合,而是通过作为监视对象的 fd_set 变量的变化,找出发生变化的文件描述符,因此无法避免针对所有监视对象的循环语句。而且,要知道监视对象的 fd_set 会发生哪些变化,就要比较调用 select 函数前后fd_set的变化,所以在调用select之前还应该复制并保存原有信息,并在每次调用 select 函数时传递新的监视对象信息。

select 性能上最大的弱点是:每次传递监视对象信息,准确的说,select 是监视套接字变化的函数。而套接字是操作系统管理的,所以 select 函数要借助操作系统才能完成功能。而应用程序频繁访问操作系统需要频繁在内核态和用户态之间切换,开销很大。select 函数的这一缺点可以通过如下方式弥补:

仅向操作系统传递一次监视对象,监视范围或内容发生变化时只通知发生变化的事项

这样就无需每次调用 select 函数时都向操作系统传递监视对象信息,但是前提操作系统支持这种处理方式。Linux 的支持方式是 epoll ,Windows 的支持方式是 IOCP。

17.1.2 select 也有优点

select 的兼容性比较高,这样就可以支持很多的操作系统,不受平台的限制,满足以下两个条件即可使用select:

  • 服务器接入者少
  • 程序应该具有兼容性

17.1.3 实现 epoll 的函数和结构体

epoll 函数具有以下优点,这些优点正好与之前的 select 函数缺点相反:

  • 无需遍历所有监听的文件描述符;
  • 调用对应于 select 函数的 epoll_wait 函数时无需每次传递监视对象信息;

下面是 epoll 各函数的功能:

  • epoll_create(int size):创建保存 epoll 文件描述符的空间
  • epoll_ctl:注册新文件描述符并注销原文件描述符
  • epoll_wait:与 select 函数类似,等待文件描述符发生变化

select 函数中为了保存监视对象的文件描述符,直接声明了 fd_set 变量,但 epoll 方式下由操作系统负责保存监视对象文件描述符,因此需要向操作系统请求创建保存文件描述符的空间,此时用的函数就是 epoll_create 。

为了添加和删除监视对象文件描述符,select 方式中需要 FD_SET、FD_CLR 函数。但在 epoll 方式中,都可以通过 epoll_ctl 函数完成。
select 方式中通过 fd_set 变量查看监视对象的状态变化,而 epoll 方式通过如下结构体 epoll_event 将发生变化的文件描述符单独集中在一起。

  1. struct epoll_event{
  2. __uint32_t events;
  3. epoll_data_t data;
  4. };
  5. typedef union epoll_data {
  6. void *ptr;
  7. int fd;
  8. __uint32_t u32;
  9. __uint64_t u64;
  10. } epoll_data_t;

声明足够大的 epoll_event 结构体数组后,传递给 epoll_wait 函数时,只需将发生变化的文件描述符填入数组。无需像 select 函数那样针对所有文件描述符进行循环。

17.1.4 epoll_create

下面是 epoll_create 函数的原型:

  1. #include <sys/epoll.h>
  2. int epoll_create(int size);
  3. /*
  4. 成功时返回 epoll 的文件描述符,失败时返回 -1
  5. size:epoll 实例的大小
  6. */

调用 epoll_create 函数时创建的文件描述符保存空间称为「epoll 例程」。通过参数 size 传递的值决定 epoll 例程的大小,但该值只是向操作系统提出的建议。换言之,size 并不用来决定 epoll 的大小,而仅供操作系统参考。

Linux 2.6.8 之后的内核将完全忽略传入 epoll_create 函数的 size 函数,因此内核会根据情况调整 epoll 例程大小。但是本书程序并没有忽略 size

epoll_create 函数创建的资源与套接字相同,也由操作系统管理。因此,该函数和创建套接字的情况相同,也会返回文件描述符,也就是说返回的文件描述符主要用于区分 epoll 例程。需要终止时,与其他文件描述符相同,也要调用 close 函数。

17.1.5 epoll_ctl

生成例程后,应在其内部注册监视对象文件描述符,此时使用 epoll_ctl 函数:

  1. #include <sys/epoll.h>
  2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
  3. /*
  4. 成功时返回 0 ,失败时返回 -1
  5. epfd:用于注册监视对象的 epoll 例程的文件描述符
  6. op:用于指定添加、删除或更改等操作
  7. fd:需要注册的监视对象文件描述符
  8. event:监视对象的事件类型
  9. */

举例:epoll_ctl(A,EPOLL_CTL_ADD,B,C);
该语句的意思是:epoll 例程 A 中注册文件描述符 B ,主要目的是为了监视参数 C 中的事件。

第二个参数的含义:

  • EPOLL_CTL_ADD:将文件描述符注册到 epoll 例程
  • EPOLL_CTL_DEL:从 epoll 例程中删除文件描述符
  • EPOLL_CTL_MOD:更改注册的文件描述符的关注事件发生情况

epoll_event 用于保存事件的文件描述符集合以及注册关注的事件
举例:

  1. struct epoll_event event;
  2. ...
  3. event.events=EPOLLIN;//发生需要读取数据的情况时
  4. event.data.fd=sockfd;
  5. epoll_ctl(epfd,EPOLL_CTL_ADD,sockfd,&event);
  6. ...

上述代码将 epfd 注册到 epoll 例程 epfd 中,并在需要读取数据的情况下产生相应事件。接下来给出 epoll_event 的成员 events 中可以保存的常量及所指的事件类型

  • EPOLLIN:需要读取数据的情况
  • EPOLLOUT:输出缓冲为空,可以立即发送数据的情况
  • EPOLLPRI:收到 OOB 数据的情况
  • EPOLLRDHUP:断开连接或半关闭的情况,这在边缘触发方式下非常有用
  • EPOLLERR:发生错误的情况
  • EPOLLET:以边缘触发的方式得到事件通知
  • EPOLLONESHOT:发生一次事件后,相应文件描述符不再收到事件通知。因此需要向 epoll_ctl 函数的第二个参数传递 EPOLL_CTL_MOD ,再次设置事件。

可通过位运算|同时传递多个上述参数。

17.1.6 epoll_wait

下面是函数原型:

  1. #include <sys/epoll.h>
  2. int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
  3. /*
  4. 成功时返回发生事件的文件描述符,失败时返回 -1
  5. epfd : 表示事件发生要监视的 epoll 例程的文件描述符
  6. events : 保存OS返回的发生事件的文件描述符集合的结构体地址值
  7. maxevents : 第二个参数中可以保存的最大事件数
  8. timeout : 以 1/1000 秒为单位的等待时间,传递 -1 时,一直等待直到发生事件
  9. */

该函数调用方式如下。需要注意的是,第二个参数所指缓冲需要动态分配。

  1. int event_cnt;
  2. struct epoll_event *ep_events;
  3. ...
  4. ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE); //EPOLL_SIZE是宏常量
  5. ...
  6. event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);
  7. ...

调用函数后,返回发生事件的文件描述符,同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合。因此,无需像 select 一样插入针对所有文件描述符的循环。

17.1.7 基于 epoll 的回声服务器端

下面是回声服务器端的代码(修改自第 12 章 echo_selectserv.c):

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #include <sys/epoll.h>
  8. #define BUF_SIZE 100
  9. #define EPOLL_SIZE 50
  10. void error_handling(char *message);
  11. int main(int argc, char *argv[]){
  12. int serv_sock, clnt_sock;
  13. struct sockaddr_in serv_adr, clnt_adr;
  14. socklen_t adr_sz;
  15. int str_len, i;
  16. char buf[BUF_SIZE];
  17. struct epoll_event *ep_events;
  18. struct epoll_event event;
  19. int epfd, event_cnt;
  20. if (argc != 2){
  21. printf("Usage : %s <port> \n", argv[0]);
  22. exit(1);
  23. }
  24. serv_sock = socket(PF_INET, SOCK_STREAM, 0);
  25. memset(&serv_adr, 0, sizeof(serv_adr));
  26. serv_adr.sin_family = AF_INET;
  27. serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
  28. serv_adr.sin_port = htons(atoi(argv[1]));
  29. if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
  30. error_handling("bind() error");
  31. if (listen(serv_sock, 5) == -1)
  32. error_handling("listen() error");
  33. epfd = epoll_create(EPOLL_SIZE); // 可以忽略这个参数,填入的参数为操作系统参考
  34. ep_events = malloc(sizeof(struct epoll_event) * EPOLL_SIZE);
  35. event.events = EPOLLIN; // 需要读取数据的情况
  36. event.data.fd = serv_sock;
  37. // 例程epfd 中添加文件描述符 serv_sock,目的是监听 enevt 中的事件
  38. epoll_ctl(epfd, EPOLL_CTL_ADD, serv_sock, &event);
  39. while (1){
  40. // 获取改变了的文件描述符到ep_events中,返回数量
  41. event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1);
  42. if (event_cnt == -1){
  43. puts("epoll_wait() error");
  44. break;
  45. }
  46. for (i = 0; i < event_cnt; i++){
  47. if (ep_events[i].data.fd == serv_sock){ // 客户端请求连接时
  48. adr_sz = sizeof(clnt_adr);
  49. clnt_sock = accept(serv_sock,
  50. (struct sockaddr *)&clnt_adr, &adr_sz);
  51. event.events = EPOLLIN;
  52. event.data.fd = clnt_sock; // 把客户端套接字添加进去
  53. epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event);
  54. printf("connected client : %d \n", clnt_sock);
  55. }
  56. else{ // 是客户端套接字时
  57. str_len = read(ep_events[i].data.fd, buf, BUF_SIZE);
  58. if (str_len == 0){
  59. // 从epoll中删除套接字
  60. epoll_ctl(epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL);
  61. close(ep_events[i].data.fd);
  62. printf("closed client : %d \n", ep_events[i].data.fd);
  63. }else{
  64. write(ep_events[i].data.fd, buf, str_len);
  65. }
  66. }
  67. }
  68. }
  69. close(serv_sock);
  70. close(epfd);
  71. return 0;
  72. }
  73. void error_handling(char *message){
  74. fputs(message, stderr);
  75. fputc('\n', stderr);
  76. exit(1);
  77. }

运行结果:

C17 优于 select 的 epoll - 图1
可以看出运行结果和以前 select 实现的和 fork 实现的结果一样,都可以支持多客户端同时运行。

select 和 epoll 的区别

epoll 的流程

  1. epoll_create 创建一个 epoll 例程(保存要监听的描述符集合的描述符);
  2. 利用 epoll_ctl 注册监听的文件描述符以及监听的类型;
  3. 利用 epoll_wait 来获取发生事件的文件描述符到epoll_event中;
  4. 处理epoll_enent集合中的描述符;

    select 的流程

  5. 创建fd_set来保存要监听的描述符集合;

  6. 使用FD_SET注册要监听的描述符集合;
  7. 使用 select 监听fd_set;
  8. 轮询所有描述符查看是否发送变化;

    主要区别

  • 每次调用 select 函数都会向操作系统传递所有需要监视对象信息,浪费大量时间,而epoll 仅向操作系统传递一次监视对象,监视范围或内容发生变化时只通知发生变化的事项;
  • 使用select监听发生事件的文件描述符需要遍历所有文件描述符,而epoll直接返回发生事件的fd集合。

17.2 条件触发和边缘触发

理解了条件触发和边缘触发才能说了解了epoll。

区别在于发生事件的时间点

条件触发的特性

条件触发方式中,只要输入缓冲有数据就会一直通知该事件

例如,服务器端输入缓冲收到 50 字节数据时,服务器端操作系统将通知该事件(注册到发生变化的文件描述符)。但是服务器端读取 20 字节后还剩下 30 字节的情况下,仍会注册事件。也就是说,条件触发方式中,只要输入缓冲中还剩有数据,就将以事件方式再次注册。

边缘触发特性
边缘触发中输入缓冲收到数据时仅注册 1 次该事件。即使输入缓冲中还留有数据,也不会再进行注册。

掌握条件触发的事件特性

下面代码修改自 echo_epollserv.c 。epoll 默认以条件触发的方式工作,因此可以通过该示例验证条件触发的特性。

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #include <sys/epoll.h>
  8. #define BUF_SIZE 2
  9. #define EPOLL_SIZE 50
  10. void error_handling(char *message);
  11. int main(int argc, char *argv[])
  12. {
  13. int serv_sock, clnt_sock;
  14. struct sockaddr_in serv_adr, clnt_adr;
  15. socklen_t adr_sz;
  16. int str_len, i;
  17. char buf[BUF_SIZE];
  18. struct epoll_event *ep_events;
  19. struct epoll_event event;
  20. int epfd, event_cnt;
  21. if (argc != 2)
  22. {
  23. printf("Usage : %s <port> \n", argv[0]);
  24. exit(1);
  25. }
  26. serv_sock = socket(PF_INET, SOCK_STREAM, 0);
  27. memset(&serv_adr, 0, sizeof(serv_adr));
  28. serv_adr.sin_family = AF_INET;
  29. serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
  30. serv_adr.sin_port = htons(atoi(argv[1]));
  31. if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
  32. error_handling("bind() error");
  33. if (listen(serv_sock, 5) == -1)
  34. error_handling("listen() error");
  35. epfd = epoll_create(EPOLL_SIZE); //可以忽略这个参数,填入的参数为操作系统参考
  36. ep_events = malloc(sizeof(struct epoll_event) * EPOLL_SIZE);
  37. event.events = EPOLLIN; //需要读取数据的情况
  38. event.data.fd = serv_sock;
  39. epoll_ctl(epfd, EPOLL_CTL_ADD, serv_sock, &event); //例程epfd 中添加文件描述符 serv_sock,目的是监听 enevt 中的事件
  40. while (1)
  41. {
  42. event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1); //获取改变了的文件描述符,返回数量
  43. if (event_cnt == -1)
  44. {
  45. puts("epoll_wait() error");
  46. break;
  47. }
  48. puts("return epoll_wait");
  49. for (i = 0; i < event_cnt; i++)
  50. {
  51. if (ep_events[i].data.fd == serv_sock) //客户端请求连接时
  52. {
  53. adr_sz = sizeof(clnt_adr);
  54. clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz);
  55. event.events = EPOLLIN;
  56. event.data.fd = clnt_sock; //把客户端套接字添加进去
  57. epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event);
  58. printf("connected client : %d \n", clnt_sock);
  59. }
  60. else //是客户端套接字时
  61. {
  62. str_len = read(ep_events[i].data.fd, buf, BUF_SIZE);
  63. if (str_len == 0)
  64. {
  65. epoll_ctl(epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL); //从epoll中删除套接字
  66. close(ep_events[i].data.fd);
  67. printf("closed client : %d \n", ep_events[i].data.fd);
  68. }
  69. else
  70. {
  71. write(ep_events[i].data.fd, buf, str_len);
  72. }
  73. }
  74. }
  75. }
  76. close(serv_sock);
  77. close(epfd);
  78. return 0;
  79. }
  80. void error_handling(char *message)
  81. {
  82. fputs(message, stderr);
  83. fputc('\n', stderr);
  84. exit(1);
  85. }

上面的代码把调用 read 函数时使用的缓冲大小缩小到了 4 个字节,插入了验证 epoll_wait 调用次数的验证函数。减少缓冲大小是为了阻止服务器端一次性读取接收的数据。换言之,调用 read 函数后,输入缓冲中仍有数据要读取,而且会因此注册新的事件并从 epoll_wait 函数返回时将循环输出「return epoll_wait」字符串。

运行结果:
C17 优于 select 的 epoll - 图2
从结果可以看出,每当收到客户端数据时,都会注册该事件,并因此调用 epoll_wait 函数。

修改后的边缘触发方式,仅仅是把上面的代码改为:

  1. event.events = EPOLLIN | EPOLLET;

结果:
C17 优于 select 的 epoll - 图3

从上面的例子看出,接收到客户端的消息时,只输出一次「return epoll_wait」字符串,这证明仅注册了一次事件。

select 模型是以条件触发的方式工作的

边缘触发的服务器端必知的两点

  • 通过 errno 变量验证错误原因
  • 为了完成非阻塞(Non-blocking)I/O ,更改了套接字特性。

Linux 套接字相关函数一般通过 -1 通知发生了错误。虽然知道发生了错误,但仅凭这些内容无法得知产生错误的原因。因此,为了在发生错误的时候提额外的信息,Linux 声明了如下全局变量:

  1. int errno;

为了访问该变量,需要引入 error.h 头文件,因此此头文件有上述变量的 extren 声明。另外,每种函数发生错误时,保存在 errno 变量中的值都不同。

read 函数发现输入缓冲中没有数据可读时返回 -1,同时在 errno 中保存 EAGAIN 常量

下面是 Linux 中提供的改变和更改文件属性的办法:

  1. #include <fcntl.h>
  2. int fcntl(int fields, int cmd, ...);
  3. /*
  4. 成功时返回 cmd 参数相关值,失败时返回 -1
  5. filedes : 属性更改目标的文件描述符
  6. cmd : 表示函数调用目的
  7. */

从上述声明可以看出 fcntl 有可变参数的形式。如果向第二个参数传递 F_GETFL ,可以获得第一个参数所指的文件描述符属性(int 型)。反之,如果传递 F_SETFL ,可以更改文件描述符属性。若希望将文件(套接字)改为非阻塞模式,需要如下 2 条语句。

  1. int flag = fcntl(fd,F_GETFL,0);
  2. fcntl(fd,F_SETFL | O_NONBLOCK)

通过第一条语句,获取之前设置的属性信息,通过第二条语句在此基础上添加非阻塞 O_NONBLOCK 标志。调用 read/write 函数时,无论是否存在数据,都会形成非阻塞文件(套接字)。fcntl 函数的适用范围很广。

17.2.4 实现边缘触发回声服务器端

通过 errno 确认错误的原因是:边缘触发方式中,接收数据仅注册一次该事件。

因为这种特点,一旦发生输入相关事件时,就应该读取输入缓冲中的全部数据。因此需要验证输入缓冲是否为空。

read 函数返回 -1,变量 errno 中的值变成 EAGAIN 时,说明没有数据可读。

既然如此,为什么要将套接字变成非阻塞模式?边缘触发条件下,以阻塞方式工作的 read & write 函数有可能引起服务端的长时间停顿。因此,边缘触发方式中一定要采用非阻塞 read & write 函数。

下面是以边缘触发方式工作的回声服务端代码:

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #include <sys/epoll.h>
  8. #include <fcntl.h>
  9. #include <errno.h>
  10. #define BUF_SIZE 4 //缓冲区设置为 4 字节
  11. #define EPOLL_SIZE 50
  12. void setnonblockingmode(int fd);
  13. void error_handling(char *message);
  14. int main(int argc, char *argv[])
  15. {
  16. int serv_sock, clnt_sock;
  17. struct sockaddr_in serv_adr, clnt_adr;
  18. socklen_t adr_sz;
  19. int str_len, i;
  20. char buf[BUF_SIZE];
  21. struct epoll_event *ep_events;
  22. struct epoll_event event;
  23. int epfd, event_cnt;
  24. if (argc != 2)
  25. {
  26. printf("Usage : %s <port> \n", argv[0]);
  27. exit(1);
  28. }
  29. serv_sock = socket(PF_INET, SOCK_STREAM, 0);
  30. memset(&serv_adr, 0, sizeof(serv_adr));
  31. serv_adr.sin_family = AF_INET;
  32. serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
  33. serv_adr.sin_port = htons(atoi(argv[1]));
  34. if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
  35. error_handling("bind() error");
  36. if (listen(serv_sock, 5) == -1)
  37. error_handling("listen() error");
  38. epfd = epoll_create(EPOLL_SIZE); //可以忽略这个参数,填入的参数为操作系统参考
  39. ep_events = malloc(sizeof(struct epoll_event) * EPOLL_SIZE);
  40. setnonblockingmode(serv_sock);
  41. event.events = EPOLLIN; //需要读取数据的情况
  42. event.data.fd = serv_sock;
  43. epoll_ctl(epfd, EPOLL_CTL_ADD, serv_sock, &event); //例程epfd 中添加文件描述符 serv_sock,目的是监听 enevt 中的事件
  44. while (1)
  45. {
  46. event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1); //获取改变了的文件描述符,返回数量
  47. if (event_cnt == -1)
  48. {
  49. puts("epoll_wait() error");
  50. break;
  51. }
  52. puts("return epoll_wait");
  53. for (i = 0; i < event_cnt; i++)
  54. {
  55. if (ep_events[i].data.fd == serv_sock) //客户端请求连接时
  56. {
  57. adr_sz = sizeof(clnt_adr);
  58. clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz);
  59. setnonblockingmode(clnt_sock); //将 accept 创建的套接字改为非阻塞模式
  60. event.events = EPOLLIN | EPOLLET; //改成边缘触发
  61. event.data.fd = clnt_sock; //把客户端套接字添加进去
  62. epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event);
  63. printf("connected client : %d \n", clnt_sock);
  64. }
  65. else //是客户端套接字时
  66. {
  67. while (1)
  68. {
  69. str_len = read(ep_events[i].data.fd, buf, BUF_SIZE);
  70. if (str_len == 0)
  71. {
  72. epoll_ctl(epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL); //从epoll中删除套接字
  73. close(ep_events[i].data.fd);
  74. printf("closed client : %d \n", ep_events[i].data.fd);
  75. break;
  76. }
  77. else if (str_len < 0)
  78. {
  79. if (errno == EAGAIN) //read 返回-1 且 errno 值为 EAGAIN ,意味读取了输入缓冲的全部数据
  80. break;
  81. }
  82. else
  83. {
  84. write(ep_events[i].data.fd, buf, str_len);
  85. }
  86. }
  87. }
  88. }
  89. }
  90. close(serv_sock);
  91. close(epfd);
  92. return 0;
  93. }
  94. void error_handling(char *message)
  95. {
  96. fputs(message, stderr);
  97. fputc('\n', stderr);
  98. exit(1);
  99. }
  100. void setnonblockingmode(int fd)
  101. {
  102. int flag = fcntl(fd, F_GETFL, 0);
  103. fcntl(fd, F_SETFL, flag | O_NONBLOCK);
  104. }

结果:
C17 优于 select 的 epoll - 图4

17.2.5 条件触发和边缘触发孰优孰劣

边缘触发方式可以做到这点:

分离接收数据和处理数据的时间点!

下面是边缘触发的图
C17 优于 select 的 epoll - 图5
运行流程如下:

  • 服务器端分别从 A B C 接收数据
  • 服务器端按照 A B C 的顺序重新组合接收到的数据
  • 组合的数据将发送给任意主机。

为了完成这个过程,如果可以按照如下流程运行,服务端的实现并不难:

  • 客户端按照 A B C 的顺序连接服务器,并且按照次序向服务器发送数据
  • 需要接收数据的客户端应在客户端 A B C 之前连接到服务器端并等待

但是实际情况中可能是下面这样:

  • 客户端 C 和 B 正在向服务器发送数据,但是 A 并没有连接到服务器
  • 客户端 A B C 乱序发送数据
  • 服务端已经接收到数据,但是要接收数据的目标客户端并没有连接到服务器端。

因此,即使输入缓冲收到数据,服务器端也能决定读取和处理这些数据的时间点,这样就给服务器端的实现带来很大灵活性。

条件触发也能实现分离接收和处理数据的时间点,但是每次调用epoll_wait时,所有缓冲区非空的套接字都会产生事件,开销过大。

17.3 习题

  1. 利用 select 函数实现服务器端时,代码层面存在的两个缺点是?
    答:①调用 select 函数后常见的针对所有文件描述符的循环语句②每次调用 select 函数时都要传递监视对象信息。
  2. 无论是 select 方式还是 epoll 方式,都需要将监视对象文件描述符信息通过函数调用传递给操作系统。请解释传递该信息的原因。
    答:文件描述符是由操作系统管理的,所以必须要借助操作系统才能完成。
  3. select 方式和 epoll 方式的最大差异在于监视对象文件描述符传递给操作系统的方式。请说明具体差异,并解释为何存在这种差异。
    答:select 函数每次调用都要传递所有的监视对象信息,而 epoll 函数仅向操作系统传递 1 次监视对象,监视范围或内容发生变化时只通知发生变化的事项。select 采用这种方法是为了保持兼容性。
  4. 虽然 epoll 是 select 的改进反感,但 select 也有自己的优点。在何种情况下使用 select 更加合理。
    答:①服务器端接入者少②程序应具有兼容性。
  5. epoll 是以条件触发和边缘触发方式工作。二者有何差别?从输入缓冲的角度说明这两种方式通知事件的时间点差异。
    答:在条件触发中,只要输入缓冲有数据,就会一直通知该事件。边缘触发中输入缓冲收到数据时仅注册 1 次该事件,即使输入缓冲中还留有数据,也不会再进行注册。
  6. 采用边缘触发时可以分离数据的接收和处理时间点。请说明其优点和原因。
    答:分离接收数据和处理数据的时间点,给服务端的实现带来很大灵活性。