本章仅需了解创建套接字时调用的 socket 函数。

2.1 套接字协议及数据传输特性

2.1.1 创建套接字

  1. #include <sys/socket.h>
  2. int socket(int domain, int type, int protocol);
  3. /*
  4. 成功时返回文件描述符,失败时返回-1
  5. domain: 套接字中使用的协议族(Protocol Family)
  6. type: 套接字数据传输的类型信息
  7. protocol: 计算机间通信中使用的协议信息
  8. */

2.1.2 协议族(Protocol Family)

通过 socket 函数的第一个参数传递套接字中使用的协议分类信息。此协议分类信息称为协议族,可分成如下几类:

头文件 sys/socket.h 中声明的协议族

名称 协议族
PF_INET IPV4 互联网协议族
PF_INET6 IPV6 互联网协议族
PF_LOCAL 本地通信 Unix 协议族
PF_PACKET 底层套接字的协议族
PF_IPX IPX Novel 协议族

本书着重讲 PF_INET 对应的 IPV4 互联网协议族。其他协议并不常用,或并未普及。另外,套接字中采用的最终的协议信息是通过 socket 函数的第三个参数传递的。在指定的协议族范围内通过第一个参数决定第三个参数。

2.1.3 套接字类型(Type)

套接字类型指的是套接字的数据传输方式。已经通过第一个参数传递了协议族信息,为什么还要决定数据传输方式?
比如: socket 函数的第一个参数 PF_INET 协议族中就存在多种数据传输方式。

2.1.4 面向连接的套接字(SOCK_STREAM)

如果 socket 函数的第二个参数传递SOCK_STREAM,将创建面向连接的套接字。

传输方式特征整理如下:

  • 传输过程中数据不会消失
  • 按序传输数据
  • 传输的数据不存在消息边界(Boundary)

什么是消息边界?
比如,客户与服务端都是256B的缓冲区,客户分别发出32B和64B的包,在服务端并不是96B的一个包,而是32B和64B的两个包,这就是边界消息,即消息是有边界的,如UDP就是基于消息的协议,而流式的如TCP发送时是将32B+64B=96B的一个包发出,另一边(peer)收到的也是96B的包,是一种无边界的。

这种情形适用于之前说过的 write 和 read 函数

传输数据的计算机通过调用3次 write 函数传递了 100 字节的数据,但是接受数据的计算机仅仅通过调用 1 次 read 函数调用就接受了全部 100 个字节。

收发数据的套接字内部有缓冲(buffer),简言之就是字节数组。只要不超过数组容量,那么数据填满缓冲后过 1 次 read 函数的调用就可以读取全部,也有可能调用多次来完成读取。

套接字缓冲已满是否意味着数据丢失?

答:缓冲并不总是满的。如果读取速度比数据传入过来的速度慢,则缓冲可能被填满,但是这时也不会丢失数据,因为传输套接字此时会停止数据传输,所以面向连接的套接字不会发生数据丢失。

套接字联机必须一一对应。面向连接的套接字可总结为:
可靠地、按序传递的、基于字节的面向连接的数据传输方式的套接字。

2.1.5 面向消息的套接字(SOCK_DGRAM)

如果 socket 函数的第二个参数传递SOCK_DGRAM,则将创建面向消息的套接字。面向消息的套接字可以比喻成高速移动的摩托车队。特点如下:

  • 强调快速传输而非传输有序
  • 传输的数据可能丢失也可能损毁
  • 传输的数据有边界
  • 限制每次传输数据的大小

面向消息的套接字比面向连接的套接字更具哟传输速度,但可能丢失。特点可总结为:
不可靠的、不按序传递的、以数据的高速传输为目的套接字。

2.1.6 协议的最终选择

socket 函数的第三个参数决定最终采用的协议。前面已经通过前两个参数传递了协议族信息和套接字数据传输方式,这些信息还不够吗?为什么要传输第三个参数呢?

可以应对同一协议族中存在的多个数据传输方式相同的协议,所以数据传输方式相同,但是协议不同,需要用第三个参数指定具体的协议信息。

本书用的是 Ipv4 的协议族,和面向连接的数据传输,满足这两个条件的协议只有 TPPROTO_TCP ,因此可以如下调用 socket 函数创建套接字,这种套接字称为 TCP 套接字。

  1. int tcp_socket = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);

SOCK_DGRAM 指的是面向消息的数据传输方式,满足上述条件的协议只有 TPPROTO_UDP 。这种套接字称为 UDP 套接字:

  1. int udp_socket = socket(PF_INET, SOCK_DGRAM, IPPROTO_UDP);

2.1.7 面向连接的套接字:TCP 套接字示例

需要对第一章的代码做出修改,修改好的代码如下:
server

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. void error_handling(char *message);
  8. int main(int argc, char *argv[])
  9. {
  10. int serv_sock;
  11. int clnt_sock;
  12. struct sockaddr_in serv_addr;
  13. struct sockaddr_in clnt_addr;
  14. socklen_t clnt_addr_size;
  15. char message[] = "Hello World!";
  16. if (argc != 2)
  17. {
  18. printf("Usage : %s <port>\n", argv[0]);
  19. exit(1);
  20. }
  21. //调用 socket 函数创建套接字
  22. serv_sock = socket(PF_INET, SOCK_STREAM, 0);
  23. if (serv_sock == -1)
  24. error_handling("socket() error");
  25. memset(&serv_addr, 0, sizeof(serv_addr));
  26. serv_addr.sin_family = AF_INET;
  27. serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
  28. serv_addr.sin_port = htons(atoi(argv[1]));
  29. //调用 bind 函数分配ip地址和端口号
  30. if (bind(serv_sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1)
  31. error_handling("bind() error");
  32. //调用 listen 函数将套接字转为可接受连接状态
  33. if (listen(serv_sock, 5) == -1)
  34. error_handling("listen() error");
  35. clnt_addr_size = sizeof(clnt_addr);
  36. //调用 accept 函数受理连接请求。
  37. //如果在没有连接请求的情况下调用该函数,则不会返回,直到有连接请求为止
  38. clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_addr, &clnt_addr_size);
  39. if (clnt_sock == -1)
  40. error_handling("accept() error");
  41. //稍后要将介绍的 write 函数用于传输数据
  42. //若程序经过 accept 这一行执行到本行,则说明已经有了连接请求
  43. write(clnt_sock, message, sizeof(message));
  44. close(clnt_sock);
  45. close(serv_sock);
  46. return 0;
  47. }
  48. void error_handling(char *message)
  49. {
  50. fputs(message, stderr);
  51. fputc('\n', stderr);
  52. exit(1);
  53. }

client

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <arpa/inet.h>
  6. #include <sys/socket.h>
  7. void error_handling(char *message);
  8. int main(int argc, char *argv[])
  9. {
  10. int sock;
  11. struct sockaddr_in serv_addr;
  12. char message[30];
  13. int str_len = 0;
  14. int idx = 0, read_len = 0;
  15. if (argc != 3)
  16. {
  17. printf("Usage : %s <IP> <port>\n", argv[0]);
  18. exit(1);
  19. }
  20. //若前两个参数使用PF_INET 和 SOCK_STREAM,则可以省略第三个参数 IPPROTO_TCP
  21. sock = socket(PF_INET, SOCK_STREAM, 0);
  22. if (sock == -1)
  23. error_handling("socket() error");
  24. memset(&serv_addr, 0, sizeof(serv_addr));
  25. serv_addr.sin_family = AF_INET;
  26. serv_addr.sin_addr.s_addr = inet_addr(argv[1]);
  27. serv_addr.sin_port = htons(atoi(argv[2]));
  28. //调用 connect 函数向服务器发送连接请求
  29. if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1)
  30. error_handling("connect() error!");
  31. //当read函数返回0的时候条件为假,跳出循环。
  32. while (read_len = read(sock, &message[idx++], 1))
  33. {
  34. if (read_len == -1)
  35. error_handling("read() error!");
  36. str_len += read_len;
  37. }
  38. printf("Message from server : %s \n", message);
  39. printf("Function read call count: %d \n", str_len);
  40. close(sock);
  41. return 0;
  42. }
  43. void error_handling(char *message)
  44. {
  45. fputs(message, stderr);
  46. fputc('\n', stderr);
  47. exit(1);
  48. }

2.3 习题

  1. 什么是协议?在收发数据中定义协议有何意义?

    答:协议是对话中使用的通信规则,简言之,协议就是为了完成数据交换而定好的约定。在收发数据中定义协议,能够让计算机之间进行正确无误的对话,以此来交换数据。

  2. 面向连接的套接字 TCP 套接字传输特性有 3 点,请分别说明。

    答:①传输过程中数据不会消失②按序传输数据③传输的数据不存在数据边界(Boundary)

  3. 下面那些是面向消息的套接字的特性?

    • 传输数据可能丢失
    • 没有数据边界(Boundary)
    • 以快速传递为目标
    • 不限制每次传输数据大小
    • 与面向连接的套接字不同,不存在连接概念
  4. 下列数据适合用哪类套接字进行传输?
    • 演唱会现场直播的多媒体数据(UDP)
    • 某人压缩过的文本文件(TCP)
    • 网上银行用户与银行之间的数据传递(TCP)
  5. 何种类型的套接字不存在数据边界?这类套接字接收数据时应该注意什么?

    答:TCP 不存在数据边界。在接收数据时,需要保证在接收套接字的缓冲区填充满之时就从buffer里读取数据。也就是,在接收套接字内部,写入buffer的速度要小于读出buffer的速度。