一、连接是什么意思
话说,网线都是一直连接的状态,我们并不需要来回插拔网线,那么这里的“连接”到底是什么意思呢?连接实际上是通信双方交换控制信息。
- 套接字刚刚创建完成的时候,里面并没有存放任何数据,也不知道通信的对象是谁,但浏览知道啊,
所以,浏览器把服务器的 IP 地址和端口号等信息告知协议栈是连接操作的目的之一
- 服务器上也会创建套接字
客户端想服务器传达开始通信的请求,也是连接操作的目的之一
连接操作中所交换的控制信息是根据通信规则来确定的,只要根据规则执行连接操作,上方就可以得到必要的信息从而完成数据收发的准备
当执行数据收发操作时,我们还需要一块用来临时存放要收发的数据的内存空间,这块内存空间成为缓冲区,它也是在连接操作的过程中分配的
二、负责保存控制信息的头部
控制信息可以大体分为两类:
- 第一类是客户端和服务器相互联络时交换的控制信息
这些信息不仅在连接时需要,包括数据收发和断开连接操作在内,整个通信过程中都需要,这些内容在 TCP 协议的规格中进行了定义,这些字段是固定的。
这些控制信息位于网络包的开头,因此被称为头部。此外,以太网和 IP 协议也有自己的控制信息,这些信息也叫头部,为了避免各种不同的头部发生混淆,我们一般会记作 TCP 头部、以太网头部、IP 头部
- 第二类包存仔套接字中,用来控制协议栈操作的信息
应用程序传递来的信息以及从通信对象接收到的信息都会保存在这里,还有收发数据操作的执行状态等信息也会保存在这里,协议栈根据这些信息来执行每一步的操作。
可以说,套接字的控制信息和协议栈的程序其实是一体的,因此,“协议栈具体需要哪些信息”会根据协议栈本身的实现方式不同而不同,只要在通信时按照规则将必要的信息写入头部,客户端和服务器之间的通信就能够得以成立。例如,Windows 和 Linux 操作系统内部协议栈的实现不同,它们依然能互相通信,同样地,计算机和手机之间也能够互相通信
通信操作中使用的控制信息分为两类
- 头部中记录的信息
- 套接字(协议栈中的内存空间)中记录的信息
三、连接操作的实际过程
连接操作的具体过程是从应用程序调用 Socket 库的 connect 开始的
connect(<描述符>,<服务器IP地址和端口号>)
上面调用提供了服务器服务器的 IP 地址和端口号,这些信息会传递给协议栈中的 TCP 模块。然后,TCP 模块会与服务器的 TCP 模块交换控制信息。这一交互过程包括下面几个步骤:
- 客户端先创建一个包含表示开始数据收发操作的控制信息的头部,重点关注是发送方和接收方的端口号
- 然后,将头部中的控制为的 SYN 比特设置为1,可以认为它表示连接
- 此外,还需要设置适当的序号和窗口大小
连接操作的第一步是在 TCP 模块处创建表示连接控制信息的头部
通过 TCP 头部中的发送方和接收方端口号可以找到要连接的套接字
**
- 当 TCP 头部创建好之后,接下来 TCP 模块会将信息传递给 IP 模块并委托它进行发送
- 服务器的 IP 模块会收到数据,它把数据传递给 TCP 模块
- 服务器的 TCP 模块根据 TCP 头部中的信息找到端口号对应的套接字
- 找到对应套接字后,套接字中会写入响应信息,并将状态改为正在连接
- 如果某些原因不接受链接,那么将不设置 SYN,而是将 RST 比特设置为 1
- 上述操作完成后,服务器的 TCP 模块会返回响应,这个过程和客户端一样,需要在 TCP 头部中设置发送方和接收方端口号以及 SYN 比特
- 此外,在返回响应时还需要将 ACK 控制位设为 1,表示已经接收到响应的网络包
- 网络中经常会发生错误,网络包也会发生丢失,所以双方必须相互确认网络包是否已经送达
- 接下来,服务器 TCP 模块会将 TCP 头部信息传递给 IP 模块,并委托 IP 模块想客户端返回响应
- 然后,网络包就会返回到客户端,到达其中 TCP 模块,通过 TCP 头部信息确认连接操作是否成功
- 如果 SYN 为 1 则表示连接成功
- 这时会向套接字中三写入服务器的 IP 地址、端口号等信息
- 同时,还会将状态改为连接完毕
- 最后一个步骤,盖菜服务器返回响应时将 ACK 比特设置为 1,响应地,客户端也需要将 ACK 比特设置为 1 并返回服务器,告诉服务器刚才的响应包已经收到。
- 当这个服务器收到这个返回包之后,连接操作才算全部完成
只要数据传输过程在持续,也就是在调用 close 断开之前,连接是一直存在的
建立连接之后,协议栈的连接操作就结束了,也就是 connect 已经执行完毕,控制流程被交回给应用程序
「@浪里淘沙的小法师」
**