本章介绍并发服务器实现的第二种方式:基于I/O复用的服务器。

12.1 基于 I/O 复用的服务器端

多进程服务端的缺点和解决方法

使用多进程的方式实现并发服务器要付出很大的代价,因为创建每个进程都需要分配地址空间,这需要大量的运算和内存空间,由于每个进程都具有独立的内存空间,所以相互间的数据交换也要采用相对复杂的方法(IPC 属于相对复杂的通信方法)。

I/O 复用可以解决这个问题。

理解复用

「复用」在电子及通信工程领域很常见,向这些领域的专家询问其概念,可能会得到如下答复:

在 1 个通信频道中传递多个数据(信号)的技术

「复用」的含义:

为了提高物理设备的效率,只用最少的物理要素传递最多数据时使用的技术

上述两种方法的内容完全一致。可以用纸电话模型做一个类比:

C12 I/O 复用 - 图1

上图是一个纸杯电话系统,为了使得三人同时通话,说话时要同事对着两个纸杯,接听时也需要耳朵同时对准两个纸杯。为了完成 3 人通话,可以进行如下图的改进:

C12 I/O 复用 - 图2
如图做出改进,就是引入了复用技术。

复用技术的优势:

  • 减少连线长度
  • 减少纸杯个数

即使减少了连线和纸杯的量仍然可以进行三人同时说话,但是如果碰到以下情况:

「好像不能同时说话?」

实际上,因为是在进行对话,所以很少发生同时说话的情况。也就是说,上述系统采用的是「时分复用」
因为说话人声频率不同,即使在同时说话也能进行一定程度上的区分(杂音也随之增多)。因此,也可以采用「频分复用」。

复用技术在服务器端的应用

纸杯电话系统引入复用技术之后可以减少纸杯数量和连线长度。服务器端引入复用技术可以减少所需进程数。下图是多进程服务端的模型:
C12 I/O 复用 - 图3

下图是引入复用技术之后的模型:
C12 I/O 复用 - 图4

从图上可以看出,引入复用技术之后,可以减少进程数。重要的是,无论连接多少客户端,提供服务的进程只有一个。

12.2 理解 select 函数并实现服务端

select 函数是最具代表性的实现复用服务器的方法。在 Windows 平台下也有同名函数,所以具有很好的移植性。

select 函数的功能和调用顺序

使用 select 函数时可以将多个文件描述符集中到一起统一监视,监视项目如下:

  • 是否存在套接字正在接收数据?
  • 可以无阻塞传输数据的套接字有哪些?
  • 哪些套接字发生了异常?

select 函数的使用方法与一般函数的区别并不大,更准确的说,他很难使用。但是为了实现 I/O 复用服务器端,我们应该掌握 select 函数,并运用于套接字编程当中。认为「select 函数是 I/O 复用的全部内容」也并不为过。select 函数的调用过程如下图所示:
C12 I/O 复用 - 图5

设置文件描述符

利用 select 函数可以同时监视多个文件描述符。当然,监视文件描述符可以视为监视套接字。此时首先需要将要监视的文件描述符集中在一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述 3 种监视项分成 3 类。(监听相同类型的描述符存放在相同的fd_set中)

利用 fd_set 数组变量执行此操作,如图所示,该数组是存有0和1的位数组。
C12 I/O 复用 - 图6
图中最左端的位表示文件描述符 0(所在位置)。如果该位设置为 1,则表示该文件描述符是监视对象。
可以看出图中描述符 1 和 3是监视对象。

在 fd_set 变量中注册或更改值的操作都由下列宏完成:

  • FD_ZERO(fd_set *fdset):将 fd_set 变量所指的位全部初始化成0
  • FD_SET(int fd,fd_set *fdset):在参数 fdset 指向的变量中注册文件描述符 fd 的信息
  • FD_SLR(int fd,fd_set *fdset):从参数 fdset 指向的变量中清除文件描述符 fd 的信息
  • FD_ISSET(int fd,fd_set *fdset):若参数 fdset 指向的变量中包含文件描述符 fd 的信息,则返回「真」

部分如下图:

C12 I/O 复用 - 图7

设置检查(监视)范围及超时

下面是 select 函数的定义:

  1. #include <sys/select.h>
  2. #include <sys/time.h>
  3. int select(int maxfd, fd_set *readset, fd_set *writeset,
  4. fd_set *exceptset, const struct timeval *timeout);
  5. /*
  6. 返回值:成功时返回大于 0 的值,该值是发生事件的文件描述符数;失败时返回 -1
  7. maxfd: 监视对象文件描述符数量
  8. readset: 将所有关注「是否存在待读取数据」的文件描述符注册到 fd_set,并传递其地址值。
  9. writeset: 将所有关注「是否可传输无阻塞数据」的文件描述符注册到 fd_set,并传递其地址值。
  10. exceptset: 将所有关注「是否发生异常」的文件描述符注册到 fd_set ,并传递其地址值。
  11. timeout: 防止陷入无限阻塞的状态,传递超时(time-out)信息
  12. */

术语:发生监视项对应的情况时,称为发生了事件。

如上所述,select 函数进行3中类型的监视,根据监视项声明 3 个 fd_set 型变量,分别向其注册文件描述符信息,并把变量的地址值传递到上述函数的第二到第四个参数

调用 select 函数之前,需要解决下面两件事:

  1. 文件描述符的监视(检查)范围是?
  2. 如何设定 select 函数的超时时间?

第一,文件描述符的监视范围和 select 的第一个参数有关。实际上,select 函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在 fd_set 变量中的文件描述符数。但每次新建文件描述符时,其值就会增加 1 ,故只需将最大的文件描述符值加 1 再传递给 select 函数即可。加 1 是因为文件描述符的值是从 0 开始的。

第二,select 函数的超时时间与 select 函数的最后一个参数有关,其中 timeval 结构体定义如下:

  1. struct timeval{
  2. long tv_sec;
  3. long tv_usec;
  4. };

将秒数填入 tv_sec 的成员,将微妙数填入 tv_usec 的成员,然后将结构体的地址值传递到 select 函数的最后一个参数。此时,即使文件描述符未发生变化,只要过了指定时间,也可以从函数中返回。不过这种情况下, select 函数返回 0 。因此,可以通过返回值了解原因。如果不向设置超时,则传递 NULL 参数。

注意:发生事件时,timeout将重置。意思就是两个事件之间的间隔大于timeout就会超时。

调用 select 函数查看结果

select 返回正整数时,怎样获知哪些文件描述符发生了变化?向 select 函数的第二到第四个参数传递的 fd_set 变量中将产生如图所示的变化:

C12 I/O 复用 - 图8
由图可知,select 函数调用完成候,向其传递的 fd_set 变量将发生变化。原来为 1 的所有位将变成 0,但是发生了变化的文件描述符除外。因此,可以认为值仍为 1 的位置上的文件描述符发生了变化。

select 函数调用示例

下面是一个 select 函数的例子:

  1. #include <stdio.h>
  2. #include <unistd.h>
  3. #include <sys/time.h>
  4. #include <sys/select.h>
  5. #define BUF_SIZE 30
  6. int main(int argc, char *argv[]){
  7. fd_set reads, temps;
  8. int result, str_len;
  9. char buf[BUF_SIZE];
  10. struct timeval timeout;
  11. FD_ZERO(&reads); // 初始化变量
  12. FD_SET(0, &reads); // 将文件描述符0对应的位设置为1
  13. while (1){
  14. temps = reads; // 为了防止调用了select 函数后,位的内容改变,先提前存一下
  15. timeout.tv_sec = 5;
  16. timeout.tv_usec = 0;
  17. // 如果控制台输入数据,则返回接收到数据的套接字号码,没有就会超时
  18. result = select(1, &temps, 0, 0, &timeout);
  19. if (result == -1){
  20. puts("select error!");
  21. break;
  22. }else if (result == 0){
  23. puts("Time-out!");
  24. }else{
  25. if (FD_ISSET(0, &temps)){ // 判断stdin是否有数据输入
  26. str_len = read(0, buf, BUF_SIZE);
  27. buf[str_len] = 0;
  28. printf("message from console: %s", buf);
  29. }
  30. }
  31. }
  32. return 0;
  33. }

结果:
C12 I/O 复用 - 图9

实现 I/O 复用服务器端

下面通过 select 函数实现 I/O 复用服务器端。下面是基于 I/O 复用的回声服务器端:

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #include <sys/time.h>
  8. #include <sys/select.h>
  9. #define BUF_SIZE 100
  10. void error_handling(char *message);
  11. int main(int argc, char *argv[]){
  12. if (argc != 2){
  13. printf("Usage : %s <port>\n", argv[0]);
  14. exit(1);
  15. }
  16. int serv_sock, clnt_sock;
  17. int fd_max, str_len, fd_num, i;
  18. socklen_t adr_sz;
  19. fd_set reads, cpy_reads;
  20. char buf[BUF_SIZE];
  21. struct sockaddr_in serv_adr, clnt_adr;
  22. struct timeval timeout;
  23. serv_sock = socket(PF_INET, SOCK_STREAM, 0);
  24. memset(&serv_adr, 0, sizeof(serv_adr));
  25. serv_adr.sin_family = AF_INET;
  26. serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
  27. serv_adr.sin_port = htons(atoi(argv[1]));
  28. if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
  29. error_handling("bind() error");
  30. if (listen(serv_sock, 5) == -1)
  31. error_handling("listen() error");
  32. FD_ZERO(&reads);
  33. FD_SET(serv_sock, &reads); // 将serv_sock注册在reads fd_set中
  34. fd_max = serv_sock;
  35. while (1){
  36. cpy_reads = reads;
  37. timeout.tv_sec = 5;
  38. timeout.tv_usec = 5000;
  39. // 监听reads fd_set中是否有数据可读取
  40. if ((fd_num = select(fd_max + 1, &cpy_reads, 0, 0, &timeout)) == -1)
  41. break;
  42. if (fd_num == 0)
  43. continue;
  44. for (i = 3; i < fd_max + 1; i++){ // 0, 1, 2为std fd,忽略
  45. // 查找发生事件的套接字文件描述符
  46. if (FD_ISSET(i, &cpy_reads)){
  47. // 如果是serv_sock有数据,说明要受理连接请求
  48. if (i == serv_sock){
  49. adr_sz = sizeof(clnt_adr);
  50. clnt_sock = accept(serv_sock,
  51. (struct sockaddr *)&clnt_adr, &adr_sz);
  52. FD_SET(clnt_sock, &reads); // 注册一个clnt_sock
  53. if (fd_max < clnt_sock)
  54. fd_max = clnt_sock;
  55. printf("Connected client: %d \n", clnt_sock);
  56. }
  57. // 否则说明是clnt_sock送来了数据
  58. else{
  59. str_len = read(i, buf, BUF_SIZE); //i指的是当前发起请求的客户端
  60. if (str_len == 0){
  61. FD_CLR(i, &reads);
  62. close(i);
  63. printf("closed client: %d \n", i);
  64. }else{
  65. write(i, buf, str_len);
  66. }
  67. }
  68. }
  69. }
  70. }
  71. close(serv_sock);
  72. return 0;
  73. }
  74. void error_handling(char *message){
  75. fputs(message, stderr);
  76. fputc('\n', stderr);
  77. exit(1);
  78. }

编译运行:
C12 I/O 复用 - 图10
从图上可以看出,虽然只用了一个进程,但是却实现了可以和多个客户端进行通信,这都是利用了 select 的特点。

12.4 习题

  1. 请解释复用技术的通用含义,并说明何为 I/O 复用。
    答:通用含义:在 1 个通信频道中传递多个数据(信号)的技术。IO复用就是进程预先告诉内核需要监视的IO条件,使得内核一旦发现进程指定的一个或多个IO条件就绪,就通过进程处理,从而不会在单个IO上阻塞,以提高单个进程的IO效率。
    参考文章:Linux网络编程-IO复用技术

  2. 多进程并发服务器的缺点有哪些?如何在 I/O 复用服务器中弥补?
    答:多进程需要进行大量的运算和大量的内存空间。在 I/O 复用服务器中通过 select 函数监视文件描述符,通过判断变化的文件描述符,来得知变化的套接字是哪个,从而实时应答来自多个客户端的请求。

  1. 复用服务器端需要 select 函数。下列关于 select 函数使用方法的描述错误的是?
    答:以下加粗的为正确的描述。

    1. 调用 select 函数前需要集中 I/O 监视对象的文件描述符。
    2. 若已通过 select 函数注册为监视对象,则后续调用 select 函数时无需重复注册
    3. 复用服务器端同一时间只能服务于 1 个客户端,因此,需要服务的客户端接入服务器端后只能等待
    4. 与多线程服务端不同,基于 select 的复用服务器只需要 1 个进程。因此,可以减少因创建多进程产生的服务器端的负担
  2. select 函数的观察对象中包含服务端套接字(监听套接字),那么应将其包含到哪一类监听对象集合?请说明原因
    答:应该包含到「是否存在待读取数据」,因为服务器端需要查看套接字中有没有可以读取的数据。