本章讨论如何优雅的断开套接字的连接,之前用的方法不够优雅是因为,我们是调用 close 函数或 closesocket 函数单方面断开连接的。

7.1 基于 TCP 的半关闭

TCP 的断开连接过程比建立连接更重要,因为连接过程中一般不会出现大问题,但是断开过程可能发生预想不到的情况。因此应该准确掌控。所以要掌握半关闭(Half-close),才能明确断开过程。

7.1.1 单方面断开连接带来的问题

Linux 的 closesocket 函数意味着完全断开连接。完全断开不仅指无法传输数据,而且也不能接收数据。因此在某些情况下,通信一方单方面的断开套接字连接,显得不太优雅。如图所示:

C07 优雅的断开套接字的连接 - 图1
图中描述的是 2 台主机正在进行双向通信,主机 A 发送完最后的数据后,调用 close 函数断开了最后的连接,之后主机 A 无法再接受主机 B 传输的数据。实际上,是完全无法调用与接受数据相关的函数。最终,由主机 B 传输的、主机 A 必须要接受的数据也销毁了。

为了解决这类问题,「只关闭一部分数据交换中使用的流」的方法应运而生。断开一部分连接是指,可以传输数据但是无法接收,或可以接受数据但无法传输。顾名思义就是只关闭流的一半。

7.1.2 套接字和流(Stream)

两台主机通过套接字建立连接后进入可交换数据的状态,又称「流形成的状态」。也就是把建立套接字后可交换数据的状态看作一种流。

此处的流可以比作水流。水朝着一个方向流动,同样,在套接字的流中,数据也止呕能向一个方向流动。因此,为了进行双向通信,需要如图所示的两个流:

C07 优雅的断开套接字的连接 - 图2
一旦两台主机之间建立了套接字连接,每个主机就会拥有单独的输入流和输出流。当然,其中一个主机的输入流与另一个主机的输出流相连,而输出流则与另一个主机的输入流相连。另外,本章讨论的「优雅的断开连接方式」只断开其中 1 个流,而非同时断开两个流。Linux 的 closesocket 函数将同时断开这两个流,因此与「优雅」二字还有一段距离。

7.1.3 针对优雅断开的 shutdown 函数

shutdown 用来关闭其中一个流:

  1. #include <sys/socket.h>
  2. int shutdown(int sock, int howto);
  3. /*
  4. 成功时返回 0 ,失败时返回 -1
  5. sock: 需要断开套接字文件描述符
  6. howto: 传递断开方式信息
  7. */

调用上述函数时,第二个参数决定断开连接的方式,其值如下所示:

  • SHUT_RD : 断开输入流,socket无法接收数据。即使输入缓冲收到数据也回抹去,而且无法调用相关函数;
  • SHUT_WR : 断开输出流,socket无法传输数据。如果输出缓冲中还有未传输的数据,则将传递给目标主机;
  • SHUT_RDWR : 同时断开 I/O 流,相当于分 2 次调用 shutdown ,其中一次以SHUT_RD为参数,另一次以SHUT_WR为参数;

    7.1.4 为何要半关闭

    考虑以下情况:

    一旦客户端连接到服务器,服务器将约定的文件传输给客户端,客户端收到后发送字符串「Thank you」给服务器端。

此处「Thank you」的传递是多余的,这只是用来模拟客户端断开连接前还有数据要传输的情况。此时程序的实现难度并不小,因为传输文件的服务器端只需连续传输文件数据即可,而客户端无法知道需要接收数据到何时。客户端也没办法无休止的调用输入函数,因为这有可能导致程序阻塞

是否可以让服务器和客户端约定一个代表文件尾的字符?

这种方式也有问题,因为这意味这文件中不能有与约定字符相同的内容。为了解决该问题,服务端应最后向客户端传递 EOF 表示文件传输结束。客户端通过函数返回值接受 EOF ,这样可以避免与文件内容冲突。那么问题来了,服务端如何传递 EOF ?

断开输出流时向主机传输 EOF。

当然,调用 close 函数的同时关闭 I/O 流,关闭的同时也会向对方发送 EOF 。但此时无法再接受对方传输的数据。换言之,若调用 close 函数关闭流,就无法接受客户端最后发送的字符串「Thank you」。这时需要调用 shutdown 函数,只关闭服务器的输出流。这样既可以发送 EOF ,同时又保留了输入流来接收字符串「Thank you」。下面实现收发文件的服务器端/客户端。

7.1.5 基于半关闭的文件传输程序

上述文件传输服务器端和客户端的数据流可以整理如图:

C07 优雅的断开套接字的连接 - 图3

下面的代码为编程简便,省略了大量错误处理代码。

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #define BUF_SIZE 30
  8. void error_handling(char *message);
  9. int main(int argc, char *argv[]){
  10. int sd;
  11. FILE *fp;
  12. char buf[BUF_SIZE];
  13. int read_cnt;
  14. struct sockaddr_in serv_adr;
  15. if (argc != 3){
  16. printf("Usage : %s <IP> <port>\n", argv[0]);
  17. exit(1);
  18. }
  19. fp = fopen("receive.cpp", "wb");
  20. sd = socket(PF_INET, SOCK_STREAM, 0);
  21. memset(&serv_adr, 0, sizeof(serv_adr));
  22. serv_adr.sin_family = AF_INET;
  23. serv_adr.sin_addr.s_addr = inet_addr(argv[1]);
  24. serv_adr.sin_port = htons(atoi(argv[2]));
  25. connect(sd, (struct sockaddr *)&serv_adr, sizeof(serv_adr));
  26. while ((read_cnt = read(sd, buf, BUF_SIZE)) != 0)
  27. fwrite((void *)buf, 1, read_cnt, fp);
  28. puts("Received file data");
  29. write(sd, "Thank you", 10);
  30. fclose(fp);
  31. close(sd);
  32. return 0;
  33. }
  34. void error_handling(char *message){
  35. fputs(message, stderr);
  36. fputc('\n', stderr);
  37. exit(1);
  38. }
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. #define BUF_SIZE 30
  8. void error_handling(char *message);
  9. int main(int argc, char *argv[]){
  10. int serv_sd, clnt_sd;
  11. FILE *fp;
  12. char buf[BUF_SIZE];
  13. int read_cnt;
  14. struct sockaddr_in serv_adr, clnt_adr;
  15. socklen_t clnt_adr_sz;
  16. if (argc != 2){
  17. printf("Usage : %s <port>\n", argv[0]);
  18. exit(1);
  19. }
  20. fp = fopen("file_server.c", "rb");
  21. serv_sd = socket(PF_INET, SOCK_STREAM, 0);
  22. memset(&serv_adr, 0, sizeof(serv_adr));
  23. serv_adr.sin_family = AF_INET;
  24. serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
  25. serv_adr.sin_port = htons(atoi(argv[1]));
  26. bind(serv_sd, (struct sockaddr *)&serv_adr, sizeof(serv_adr));
  27. listen(serv_sd, 5);
  28. clnt_adr_sz = sizeof(clnt_adr);
  29. clnt_sd = accept(serv_sd, (struct sockaddr *)&clnt_adr, &clnt_adr_sz);
  30. while (1){
  31. // 从文件流中读取数据到缓存
  32. read_cnt = fread((void *)buf, 1, BUF_SIZE, fp);
  33. // 将缓存写入socket
  34. if (read_cnt < BUF_SIZE){
  35. write(clnt_sd, buf, read_cnt);
  36. break;
  37. }
  38. write(clnt_sd, buf, BUF_SIZE);
  39. }
  40. shutdown(clnt_sd, SHUT_WR); // 仅关闭输出流
  41. read(clnt_sd, buf, BUF_SIZE); // 读取收到的字符串
  42. printf("Message from client: %s \n", buf);
  43. fclose(fp);
  44. close(clnt_sd);
  45. close(serv_sd);
  46. return 0;
  47. }
  48. void error_handling(char *message){
  49. fputs(message, stderr);
  50. fputc('\n', stderr);
  51. exit(1);
  52. }

编译运行:

  1. gcc file_server.c -o fserver
  2. gcc file_client.c -o fclient
  3. ./fserver 9190
  4. ./fclient 127.0.0.1 9190

结果:
image.png

7.3 习题

  1. 解释 TCP 中「流」的概念。UDP 中能否形成流?请说明原因。
    答:两台主机中通过套接字建立连接后进入可交换数据的状态,又称「流形成的状态」。也就是把建立套接字后可交换数据的状态看做一种流。UDP 没有建立连接的过程,所以不能形成流。


  1. Linux 中的 close 函数或 Windows 中的 closesocket 函数属于单方面断开连接的方法,有可能带来一些问题。什么是单方面断开连接?什么情形下会出现问题?
    答:单方面断开连接就是两台主机正在通信,其中一台主机关闭了所有连接,那么一台主机向另一台主机传输的数据可能会没有接收到而损毁。传输文件的服务器只需连续传输文件数据即可,而客户端不知道需要接收数据到何时。客户端也没有办法无休止的调用输入函数。现在需要一个 EOF 代表数据已经传输完毕,那么这时就需要半关闭,服务端把自己的输出流关了,这时客户端就知数据已经传输完毕,因为服务端的输入流还没关,客户端可以给服务器汇报,接收完毕。

  2. 什么是半关闭?针对输出流执行半关闭的主机处于何种状态?半关闭会导致对方主机接收什么消息?
    答:半关闭就是把输入流或者输出流关了。针对输出流执行半关闭的主机处于可以接收数据而不能发送数据。关闭输出流会导致对方主机接收一个 EOF 文件结束符。对方就知道你的数据已经传输完毕。