网络层只把分组发送到目的主机,但是真正通信的并不是主机而是主机中的进程。运输层提供了进程间的逻辑通信,运输层向高层用户屏蔽了下面网络层的核心细节,使应用程序看起来像是在两个运输层实体之间有一条端到端的逻辑通信信道。

UDP 和 TCP 的特点

  • 用户数据报协议 UDP(User Datagram Protocol)是无连接的,尽最大可能交付,没有拥塞控制,面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部),支持一对一、一对多、多对一和多对多的交互通信。
  • 传输控制协议 TCP(Transmission Control Protocol)是面向连接的,提供可靠交付,有流量控制,拥塞控制,提供全双工通信,面向字节流(把应用层传下来的报文看成字节流,把字节流组织成大小不等的数据块),每一条 TCP 连接只能是点对点的(一对一)。

UDP 首部格式

image.png

首部字段只有 8 个字节,包括源端口、目的端口、长度、检验和。12 字节的伪首部是为了计算检验和临时添加的。

TCP 首部格式

image.png

  • 序号 :用于对字节流进行编号,例如序号为 301,表示第一个字节的编号为 301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401。
  • 确认号 :期望收到的下一个报文段的序号。例如 B 正确收到 A 发送来的一个报文段,序号为 501,携带的数据长度为 200 字节,因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 701。
  • 数据偏移 :指的是数据部分距离报文段起始处的偏移量,实际上指的是首部的长度。
  • 确认 ACK :当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传送的报文段都必须把 ACK 置 1。
  • 同步 SYN :在连接建立时用来同步序号。当 SYN=1,ACK=0 时表示这是一个连接请求报文段。若对方同意建立连接,则响应报文中 SYN=1,ACK=1。
  • 终止 FIN :用来释放一个连接,当 FIN=1 时,表示此报文段的发送方的数据已发送完毕,并要求释放连接。
  • 窗口 :窗口值作为接收方让发送方设置其发送窗口的依据。之所以要有这个限制,是因为接收方的数据缓存空间是有限的。

TCP 的三次握手

image.png

假设 A 为客户端,B 为服务器端。

  • 第 1 次握手:建立连接时,客户端发送 SYN 包(seq=x)到服务端,此时客户端进入SYN-SENT状态,等待服务端确认。
  • 第 2 次握手:客户端收到 SYN 包,必须确认客户的 SYN 包(ack=x+1),同时自己发送一个 SYN 包(seq=y),即 SYN+ACK 包,此时服务端进入 SYN-RCVD状态。
  • 第 3 次握手:客户端收到服务端的 SYN + ACK 包,向服务端发确认包 ACK (seq=y+1),此包发送完毕,双方进入ESTABLISHED状态。完成了 3 次握手。

三次握手的原因

原因 1:为了初始化序号的初始值。通信双方需要通知对方建立连接以后的序列号的初始值(即上图的 x 和 y ),作为以后数据传输的序号,保证应用层接收到的数据不会因为网络上的传输问题而乱序。进行第 3 次握手,就是告知服务端,客户端已收到服务端发送的初始化的序号了。

原因 2:

  • A 向 B 发出连接请求,第一个请求在某个节点滞留一段时间
  • A 发送超时,认为报文丢失,再重传。这一次 B 马上收到,然后与 A 建立连接。数据传输完毕后,断开连接。
  • 此时,滞留的请求到达了 B,B 又认为 A 发来请求。
    “两次握手”:B 认为传输连接又建立,并一直等待 A 传输数据,而此时 A 并无连接请求,因此不予理睬,这造成了 B 资源的浪费。
    “三次握手”:B 向 A 发送确认报文,由于是一个失效请求,A 不予理睬,建立连接失败。

首次握手的隐患——SYN 超时

SYN 超时:当 Serve r完成第一次握手以后,再次向 Client 发送 SYN 的时候,Client 出现了掉线现象。

  • Server 收到的 Client 的 SYN,回复 SYN-ACK 的时候未收到 ACK 确认;
  • Server 在一定时间内未收到回复,则会不断重试直到超时,Linux 默认等待 63 秒(32+16+8+4+2+1)才最终断开连接。
  • 这样服务器可能会受到 SYN Flood 攻击的风险

防护措施:

  1. SYN 队列满了以后,通过 tcp_syncookies 参数回发 SYN Cookie (源地址端口、目标地址端口和时间戳);
  2. 若为攻击者则不会有响应;
  3. 若为正常连接则 Client 会回发 SYN Cookie,直接建立连接。

建立连接后,Client 出现故障该怎么办?

保活机制(Keep-alive Time)

开启保活机制的一方,将向对方发送保活探测报文,如果未收到响应经过一个提前配置好的保活时间间隔(Keep-alive Time Interval )将继续发送保活探测报文,直到探测报文的尝试次数达到了保活探测数仍未收到响应则中断连接。

TCP 的四次挥手

image.png

假设 A 为客户端,B 为服务端。

  • 第 1 次挥手:客户端发送一个 FIN,用来关闭客户端和服务端之间的数据传输,此时客户端进入 FIN-WAIT-1状态。
  • 第 2 次挥手:服务端收到一个 FIN 后,发送一个 ACK 给客户端,确认号为接收到的序号 +1 (与 ACK 相同 FIN 占用一个序号),客户端进入CLOSE_WAIT状态。
  • 第 3 次挥手:服务端发送 FIN,用来关闭服务端到客户端的数据传输,服务端进入LAST-ACK状态。
  • 第 4 次挥手:客户端接收到 FIN 后,客户端进入 TIME-WAIT状态,接着发送一个 ACK 给服务端,确认序号为收到的序号 +1,客户端进入 CLOSED状态。完成 4 次挥手。

四次挥手的原因

原因1:因为 TCP 连接是全双工通信,发送方和接收方都需要 FIN 报文和 ACK 报文,其中一方关闭是被动的。

原因2:客户端发送了 FIN 连接释放报文之后,服务器收到了这个报文,就进入了 CLOSE-WAIT 状态。这个状态是为了让服务器端发送还未传送完毕的数据,传送完毕之后,服务器会发送 FIN 连接释放报文。

TIME_WAIT

客户端接收到服务器端的 FIN 报文后进入此状态,此时并不是直接进入 CLOSED 状态,还需要等待一个时间计时器设置的时间 2MSL。这么做有两个理由:

  • 确保有足够的时间让对方收到ACK包:即最后一个确认报文能够顺利到达。如果 B 没收到 A 发送来的确认报文,那么就会重新发送连接释放请求报文,A 等待一段时间就是为了处理这种情况的发生。
  • 避免新旧连接混淆:等待一段时间是为了让本连接持续时间内所产生的所有报文都从网络中消失,使得下一个新的连接不会出现旧的连接请求报文。

TCP 可靠传输

TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。

一个报文段从发送再到接收到确认所经过的时间称为往返时间 RTT,加权平均往返时间 RTTs 计算如下:
运输层 - 图5
image.png

超时时间 RTO (重传时间间隔)应该略大于 RTTs,TCP 使用的超时时间计算如下:
运输层 - 图7
image.png

其中 RTT 为偏差。

TCP 滑动窗口

TCP使用滑动窗口做流量控制和乱序重排。

窗口是缓存的一部分,用来暂时存放字节流。发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小。

发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态;接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口。

接收窗口只会对窗口内最后一个按序到达的字节进行确认,例如接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收。

image.png

TCP 流量控制

流量控制是为了控制发送方发送速率,保证接收方来得及接收。

接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率。将窗口字段设置为 0,则发送方不能发送数据。

TCP 拥塞控制

如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度。

image.png

TCP 主要通过四个算法来进行拥塞控制:慢开始、拥塞避免、快重传、快恢复。

发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口。

为了便于讨论,做如下假设:

  • 接收方有足够大的接收缓存,因此不会发生流量控制;
  • 虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段。

image.pngimage.png

1. 慢开始与拥塞避免

发送的最初执行慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2、4、8 …

注意到慢开始每个轮次都将 cwnd 加倍,这样会让 cwnd 增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。设置一个慢开始门限 ssthresh,当 cwnd >= ssthresh 时,进入拥塞避免,每个轮次只将 cwnd 加 1。

如果出现了超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始。

2. 快重传与快恢复

在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 M 和 M,此时收到 M,应当发送对 M 的确认。

在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 M,则 M 丢失,立即重传 M。

在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免。

慢开始和快恢复的快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh。
运输层 - 图13