分层结构

OSI七层模型

应用层

解决通过应用进程的交互来实现特定的网络应用问题
报文
常用协议
- 基于UDP:
  - RIP 520
  - DNS 53
  - TFTP 69
  - SNMP 161
  - DHCP 67/68
- 基于TCP:
  - SMTP（电子邮件）: 25
  - FTP 21/20（文件传输）
  - BGP 179
  - HTTP 80
  - HTTPS 443
  - pop3 110
    表示层
解决通信双方交换信息的表示问题
- 字符集的转换
- 加密压缩等
  会话层
会话层的主要功能是在两个节点间建立、维护和释放面向用户的连接，并对会话进行管理和控制，保证会话数据可靠传送

传输层（运输层）
运行在不同主机上的应用进程提供直接的通信服务
包括
- 对数据分组组装
- 提供传输协议的选择
- 端口封装
- 差错校验
tcp或udp报文
使用端口号区分不同的应用进程
- 用16bit表示取值为0~65535
- 熟知端口号：0~1023，IANA把这些端口号指派给了TCP/IP体系中的一些重要的协议，例如FTP：20/21
端口号只具有本地意义，即端口号只是为了表示本计算机中应用层中的各进程，在因特网中，不同计算机的相同端口号是没有联系的

常见协议

TCP
UDP

网络层
作用
- IP地址编制（确定源IP和目的ip）
- 路由选择（选择路径）
  - 静态路由（由管理员指定的，对路由器消耗小，配置复杂）
  - 动态路由（根据路由协议判断，配置简单，路由器压力较大）
常见协议： IP、ARP（地址解析协议，通过解析IP地址得到Mac地址）
ip数据包，分组
路由器

数据链路层
在单个链路上传输数据
- 如何标识网络中各主机的问题（主机编制问题，例如mac地址）
- 如何从信号表示的一连串比特流中区分出地址和数据（需要解决分组的封装格式问题）
- 如何协调各主机争用总线
- 分组在一个网络（或一段链路上）传输的问题
- mac地址编制
- mac地址寻址
- 差错校验
网卡有独一无二的mac地址
帧
交换机、网卡

物理层
数据比特流的实际传输
需要解决的问题（传输比特流）
- 使用何种信号传输比特的问题
- 采用怎样的传输媒体（介质）比如双绞线网线
- 采用怎样的物理接口来连接传输媒体（例如RJ45以太网接口）
- 用怎样的信号来表示比特0和1（例如低电平0高电平1
电气特性定义（比如觉得网线中哪些线可以传输数据）
网线
比特流

tcp/ip四层模型
应用层
传输层
网络层（网际层）
网络接口层

五层模型
应用层
传输层（运输层）
网络层
数据链路层
物理层

TCP （传输控制协议Transmission Control Protocols）

特点
面向字节流，这是tcp实现可靠传输、流量控制、拥塞控制的基础.在tcp发送数据时，从发送缓存取出一部分或全部字节并给其添加一个首部使之成为TCP报文段之后发送
- 发送方的tcp把应用层交付下来的数据块仅仅看作是一连串的、无结构的字节流，tcp并不知道这些待传送的字节流的含义仅将他们编号，并存储在自己的发送缓存中tcp根据发送策略，从缓存中提取一定数量的字节，构建tcp报文段并发送接收方的tcp，一方面从所接收到的tcp报文段中取出数据载荷部分，并存储在接收缓存中，一方面将接收缓存中的一些字节交付给应用进程，TCP不保证接收方应用进程所收到的数据块与发送方应用进程所发送的数据块具有对应大小关系
可靠传输、保证数据准确性、保证数据顺序
全双工通信. 在任何时候，单个TCP连接都允许同时双向传输数据，因此客户端和服务器端可以同时向对方发送数据
面向连接, TCP的连接是端到端的, 这意味着一个TCP连接只支持两方通信, 通常客户端为一方, 服务器端为一方
开销更大（相比udp）
必须先通过三次握手建立连接，然后数据传输，最后四次挥手释放连接
有拥塞控制机制
适用于要求可靠的传输应用
- 例如：文件传输
  拥塞控制
  在某段时间内，若对网络中某一资源的需求超过了该资源所能提供的可用部分，网络性能就要变坏
  这种情况叫做拥塞

发送方维护一个拥塞窗口的cwnd的状态变量，其值取决于网络的拥塞程度，并且动态变化
拥塞窗口cwnd维护原则：
只要网络没有拥塞，拥塞窗口就再增大一些，但只要网络出现拥塞，拥塞窗口就减少一些
判断出现网络拥塞的依据：没有按时收到应当到达的确认报文（即发生超时重传）
发送方将拥塞窗口作为发送窗口swnd，即swnd = cwnd
维护一个慢开始门限ssthresh状态变量：
当cwnd < ssthresh 使用慢开始算法
> 拥塞避免算法
= 既可以使用慢开始算法，也可以使用拥塞避免算法

重传计时器超时时，判断网络可能进入拥塞，进行以下操作

将ssthresh值更新为发生拥塞时，cwnd的一半
将cwnd减少为1并重新执行慢开始算法

慢开始一般是指数增长 * 2到ssthresh, 慢开始是指一开始向网络注入的报文段少，而不是拥塞窗口cwnd增长慢
拥塞避免一般是线性增长+1 ，并非指完全能够避免拥塞，而是指在拥塞避免阶段将拥塞窗口控制为按线性规律增长，使网络比较不容易出现拥塞

有时候，个别报文段丢失，但实际上网络并没有拥塞，
这将导致发送方超时重传，并误以为网络发生了拥塞
发送方把拥塞窗口cwnd又设置为最小值1，并错误的启动慢开始算法，因而降低了传输效率

快重传算法，可以让发送方尽早知道发生了个别报文段的丢失
所谓快重传，就是使发送方尽快进行重传，而不是等超时计时器超时再重传
要求接收方不要等待自己发送数据时捎带确认，而是要立即发送确认
即使收到了失序的报文段，也要立即发出对已收到的报文段的全部确认
发送方一旦收到三个重复确认，就将相应的报文段立即重传，而不是等该报文段的超时计数器超时再重传

快恢复

三次握手

第一次握手：Client将SYN置1，随机产生一个初始序列号seq发送给Server，进入SYN_SENT状态，等待Ser确认
第二次握手：Server收到Client得SYN=1之后，知道客户端请求建立连接，将自己的SYN置1，ACK置1，产生一个acknowledge number = sequence number + 1，并随机产生一个自己的初始序列号，发送给客户端；进入SYN_RECV状态；
第三次握手 : 客户端检查acknowledge number 是否为序列号 + 1，ACK是否为1，检查正确后将自己的ACK置1，产生一个acknowledge number = 服务器发的序列号 + 1，发送给服务器；进入ESTABLISHED状态；服务器检查ACK为1和acknowledge number为序列号+1之后，也进入ESTABLISHED状态；完成三次握手，连接建立，Client、Server之间可以开始传输数据了

四次挥手

第一次挥手：Client 将FIN置1，发送一个序列号seq给Server；进入FIN_WAIT_1状态；
第二次挥手：Server收到FIN之后，发送一个ACK=1，acknowledge number = 收到的序列号+1；进入CLOSE_WAIT状态。此时客户端已经没有要发送的数据了，客户端变成FIN_WAIT_2状态，但仍可以接收服务器发来的数据
第三次挥手：Server将FIN置1，ACK置1，确认号为第一次seq+1，发送一个序列号给Client，用来关闭Server到Client的数据传输；进入LAST_ACK状态
第四次挥手：Client收到服务器的FIN后，进入TIME_WAIT状态；接着将ACK置1，发送一个acknowledge number = 序列号+1给服务器；服务器收到后，确认acknowledge number 后，变为CLOSED状态，不再向客户端发送数据。客户端等待2*MSL（报文段最长寿命）时间后，也进入CLOSED状态。完成四次挥手。

TCP报文段

序号：Seq序号，32位，用来标识从TCP源端口向目的端口发送的字节流，发送方发送数据时对此进行标记
确认号：Ack序号，32位，只有ACK标志位为1时，确认号字段才有效，Ack = Seq + 1
标志位：共六个，即URG、ACK、PSH、RST、SYN、FIN等
- URG：紧急指针（urgent pointer）有效
- ACK：确认序号有效
- PSH：接收方应该尽快将这个报文交给应用层
- RST：重置连接
  - 在TCP协议中，rst段标识复位，用来异常的关闭连接。在TCP的设计中它是不可或缺的，发送rst段关闭连接时，不必等缓冲区的数据都发送出去，直接丢弃缓冲区中的数据。而接收端收到rst段后，也不必发送ack来确认
- SYN：发起一个新连接
- FIN：释放一个连接

流量控制

就是让发送方不要发送的快，要让接收方来得及接收
滑动窗口

tcp接收方利用自己接受端口的大小来限制发送方发送窗口的大小
tcp发送方收到接收方的零窗口通知时，应启动持续计时器，持续计时器超时后，向接收方发送零窗口探测报文

状态码

2开头表示成功, 200 请求被正常处理并返回
3开头表示需要进行附加操作以完成请求, 301 永久重定向 302暂时重定向
4客户端请求出错 400 Bad Request 401 Unauthorized 403Forbidden 404 Not Found
5服务器处理请求出错 500 服务器内部错误 501 服务不可用

其他
http怎么判断接收完整
- HTTP协议的服务端响应报文里有Content-Length字段，明确了报文的长度。客户端应该是通过这个来判断的
- HTTP中，不管是请求还是响应，消息头是必须存在的，消息体是可选的，每个消息头末尾都有1个换行符(\r\n).特别地，不管是请求头还是响应头，最后一个消息头末尾有2个换行符(\r\n\r\n)
- 一个状态代码，一般状态代码等于200表示接收完成
  Cookie/Session
  cookie
客户端，一般用来保存用户信息的，比如之前登录了就不需要登录了，有大小限制（虽然HTTP本身对这个字段没有多少限制，但是Cookie最终要存储在浏览器上，所以不同的浏览器对Cookie的存储会有一些大小和个数上的限制）
客户端请求服务器时会将Cookie一起提交
服务器压力小
缺点：
- 安全性差、占用带宽、大小数量有限
- 只能保存值为字符串的数据
- 在每次客户端的访问都必须回传这些Cookie
  session
服务器端，一般是通过服务端记录用户状态，比如购物车
优点
- 一般更安全
- 无大小限制
- 保存的值无类型限制
缺点
- 占用服务器性能
  URI/URL
uri uniform resource identifier统一资源标识符
url uniform resource locator 统一资源定位符
都可以唯一标识互联网上的资源,url是uri的一个子集,url以路径方式提供了定位资源的信息,

从输入网址到获得页面的过程 (越详细越好)？
浏览器查询 DNS，获取域名对应的IP地址
- 具体包括浏览器搜索自己的DNS缓存
- 搜索操作系统缓存
- 读取本地的Host文件
- 向本地DNS服务器进行查询等
浏览器获得域名对应的IP地址以后，向服务器请求建立链接，发起三次握手
TCP/IP连接建立起来后，浏览器向服务器发送HTTP请求
服务器接收到这个请求，并根据路径参数映射到特定的请求处理器进行处理，并将处理结果及相应的视图返回给浏览器
浏览器解析并渲染视图，若遇到对js文件、css文件及图片等静态资源的引用，则重复上述步骤并向服务器请求这些资源
浏览器根据其请求到的资源、数据渲染页面，最终向用户呈现一个完整的页面

Socket通信
Socket套接字：对网络中不同主机上的应用进程直接进行双向通信的端点的抽象
FD：file descriptor，文件描述符，非负整数，“一切皆文件”，Linux中一切资源都可以通过文件的方式进行管理和访问。而fd就类似于文件的索引（符号），指向某个资源，内核（kernel）利用FD来访问和管理资源
分为同步阻塞，异步方式等

select/poll：学生写完了作业会举手，但是你不知道是谁举手，需要一个个去询问
epoll：学生写完了作业会举手，你知道是谁举手，你直接去收作业

I/O多路复用

select

将socket是否就绪检查逻辑下沉到操作系统层次，避免大量的系统调用。告诉你事件就绪，但是没告诉你具体是哪个FD
优点：
- 不需要每个FD都进行一次系统调用，解决了频繁调用的用户态内核态切换的问题
缺点
- 单进程监听的FD存在限制，默认是1024
- 每次调用都需要将FD从用户态拷贝到内核态
- 不知到具体是哪个FD就绪，需要遍历全部的FD（只会返回fd的个数，并不能直接确定哪个fd就绪）
- 入参的3个fd_set集合每次调用都需要重置
  poll
和select基本类似，主要优化了监听1024的限制，入参的3个fd_set集合也不需要每次重置

epoll
高效处理并发下的大量连接，同时有非常优异的性能
维护了就绪列表，可以直接知道哪些文件描述符是就绪的
直接在内核态，维护了一个fd的红黑树
还维护了等待队列
缺点
- 跨平台性不够好，只支持linux，macos等操作系统不支持
- select相较于epoll更轻量，可移植性更强
- 在监听连接和事件比较少的情况下，select可能更优
水平（条件）触发LT（level-triggered）：默认，epoll_wait检测到事件后，如果该事件没被处理完毕，后续每次epoll_wait调用都会返回该事件
边缘触发（ET：Edge-triggered）：epoll_wait检测到事件后，只会在当次返回该事件，不管该事件是否处理完毕

网络

分层结构

OSI七层模型

应用层

表示层

会话层

传输层（运输层）

网络层

数据链路层

物理层

tcp/ip四层模型

五层模型

TCP （传输控制协议Transmission Control Protocols）

特点

拥塞控制

三次握手

四次挥手

TCP报文段

流量控制

相关问题

为什么TCP是随机初始序列号

为什么不能是二次握手

为什么不能是三次挥手

TCP粘包

粘包原因

什么时候需要处理粘包现象？

如何处理粘包现象？

5.Q：UDP会不会产生粘包问题呢？

四次挥手中客户端为什么等待2MSL再关闭

UDP（用户数据报协议User Datagram Protocols）

特点

http/https

特点

区别

长连接,短链接

版本

3.0

2.0

1.1

1.0

请求方法（PUT、POST、GET、DELETE）

get

post

put

delete

状态码

其他

Cookie/Session

cookie

session

URI/URL

从输入网址到获得页面的过程 (越详细越好)？

Socket通信

I/O多路复用

select

poll

epoll