网络为什么要分层?

因为,是个复杂的程序都要分层。理解计算机网络中的概念,一个很好的角度就是把每个网络包看做一段 Buffer 或一段内存,并且是有格式的。同时,想象自己是个处理网络包的程序,并且这个程序可以跑在 PC 上,可以跑在服务器上,也可以跑在路由器或交换机上;这个程序有很多的网口,从某个口拿进一个网络包,用自己的程序处理一下,然后又从另一个网口发出去。
当然,网络包的格式很复杂,这个程序也很复杂。在这里我们以一个 HTTP 请求为例,看看这个程序是怎么工作的。

当一个网络包从一个网口经过的时候,你看到了,首先看看要不要拿进来处理,也有一些网口开启了混杂模式,凡是经过的,通通拿进来。
拿进来以后,要交给一段程序来处理。于是,你调用 process_layer2(buffer),当然这里只是一个假函数,其中的过程是摘掉 buffer 属于二层的头,看一看头部的位置包含了什么操作。
如果你发现头部的 MAC 地址和你的相符,那就说明这个包是给你的,你就要调用 process_layer3(buffer)。这个时候,Buffer 属于三层的头也被摘掉,看看是要给自己的,还是要转发出去的。
至于如何判断,要看 IP 头部中的 IP 地址是不是属于自己的,如果是,转发出去;如果不是,那就转发到相应的 IP 地址。接下来的处理到底是调用 process_tcp(buffer) 还是调用 process_udp(buffer) ,这由四层的头来确定。
假设这个地址是 TCP 的,则会调用 process_tcp(buffer)。这时候,Buffer 还需要查看四层的头,看这是一个发起,还是一个应答,又或者是一个正常的数据包,然后分别由不同的逻辑进行处理。如果是发起或者应答,接下来可能要发送一个回复包;如果是一个正常的数据包,就需要交给上层了。交给谁呢?是不是有 process_http(buffer) 函数呢?
没有的,如果你是一个网络包处理程序,你不需要有 process_http(buffer),而是应该交给应用去处理。交给哪个应用呢?在四层的头里面有端口号,不同的应用监听不同的端口号。如果发现浏览器应用在监听这个端口,那你发给浏览器就行了。至于浏览器怎么处理,和你没有关系。浏览器自然是解析 HTML,显示出页面来。电脑的主人看到页面很开心,就点了鼠标。点击鼠标的动作被浏览器捕获。浏览器知道,又要发起另一个 HTTP 请求了,于是使用端口号,将请求发给了你。
你应该调用 send_tcp(buffer)。不用说,Buffer 里面就是 HTTP 请求的内容。这个函数里面加一个 TCP 的头,记录下源端口号。浏览器会给你目的端口号,一般为 80 端口。
然后调用 send_layer3(buffer)。Buffer 里面已经有了 HTTP 的头和内容,以及 TCP 的头。在这个函数里面加一个 IP 的头,记录下源 IP 的地址和目标 IP 的地址。
然后调用 send_layer2(buffer)。Buffer 里面已经有了 HTTP 的头和内容、TCP 的头,以及 IP 的头。这个函数里面要加一下 MAC 的头,记录下源 MAC 地址,得到的就是本机器的 MAC 地址和目标的 MAC 地址。不过,这个还要看当前知道不知道,知道就直接加上;不知道的话,就要通过一定的协议处理过程,找到 MAC 地址。反正要填一个,不能空着。
万事俱备,只要 Buffer 里面的内容完整,就可以从网口发出去了,你作为一个程序的任务就算告一段落了。
image.png

层与层之间的关系

那 TCP 在三次握手的时候,IP 层和 MAC 层在做什么呢?当然是 TCP 发送每一个消息,都会带着 IP 层和 MAC 层了。因为,TCP 每发送一个消息,IP 层和 MAC 层的所有机制都要运行一遍。而你只看到 TCP 三次握手了,其实,IP 层和 MAC 层为此也忙活好久了。
这里要记住一点: 只要是在网络上跑的包,都是完整的。可以有下层没上层,绝对不可能有上层没下层。 所以,对 TCP 协议来说,三次握手也好,重试也好,只要想发出去包,就要有 IP 层和 MAC 层,不然是发不出去的。
经常有人会问这样一个问题,我都知道那台机器的 IP 地址了,直接发给他消息呗,要 MAC 地址干啥?这里的关键就是,没有 MAC 地址消息是发不出去的。所以如果一个 HTTP 协议的包跑在网络上,它一定是完整的。无论这个包经过哪些设备,它都是完整的。
所谓的二层设备、三层设备,都是这些设备上跑的程序不同而已。一个 HTTP 协议的包经过一个二层设备,二层设备收进去的是整个网络包。这里面 HTTP、TCP、 IP、 MAC 都有。什么叫二层设备呀,就是只把 MAC 头摘下来,看看到底是丢弃、转发,还是自己留着。那什么叫三层设备呢?就是把 MAC 头摘下来之后,再把 IP 头摘下来,看看到底是丢弃、转发,还是自己留着。