第五章 与HTTP协作的Web服务器
一台Web服务器可搭建多个独立域名的Web网站,也可作为通信路径上的中转服务器提升传输效率。
HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,提供Web托管服务的供应商,可以用一台服务器为多位客户服务,也可以以每位客户持有的域名运行各自不同的网站。这是因为利用了虚拟主机的功能。
即使物理层面只有一台服务器,但只要使用虚拟主机的功能,则可以假想已具有多台服务器。
在相同的 IP 地址下,由于虚拟主机可以寄存多个不同主机名和域名 的 Web 网站,因此在发送 HTTP 请求时,必须在 Host 首部内完整指 定主机名或域名的 URI。
HTTP 通信时,除客户端和服务器以外,还有一些用于通信数据转发 的应用程序,例如代理、网关和隧道。它们可以配合服务器工作。
这些应用程序和服务器可以将请求转发给通信线路上的下一站服务 器,并且能接收从那台服务器发送的响应再转发给客户端。
代理:
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户 端“中间人”的角色,接收由客户端发送的请求并转发给服务器,同时 也接收服务器返回的响应并转发给客户端。
网关:
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请 求时,它就像自己拥有资源的源服务器一样对请求进行处理。有时客 户端可能都不会察觉,自己的通信目标是一个网关。
隧道:
隧道是在相隔甚远的客户端和服务器两者之间进行中转,并保持双方 通信连接的应用程序。
代理服务器的基本行为就是接收客户端发送的请求后转发给其他服务器。代理不改变请求URI,会直接发送给前方持有资源的目标服务器。
源服务器:
持有资源实体的服务器。从源服务器返回的响应经过代理服务器后再传给客户端。
在 HTTP 通信过程中,可级联多台代理服务器。请求和响应的转发会 经过数台类似锁链一样连接起来的代理服务器。转发时,需要附加 Via 首部字段以标记出经过的主机信息。
使用代理服务器的理由有:利用缓存技术减少网络带宽的流量,组织内部针对特定网站的访问控制,以获取访问日志为主要目的。
代理有多种使用方法,按两种基准分类。一种是是否使用缓存,另一种是是否会修改报文。
缓存代理:
代理转发响应时,缓存代理会预先将资源的副本缓存保存在代理服务器上。
当代理再次接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。
透明代理:
转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理。反之,对报文内容进行加工的代理被称为非透明代理。
网关:
网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务。
利用网关能提高通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全。
隧道:
隧道可按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。隧道的目的是确保客户端能与服务器进行安全的通信。
隧道本身不会去解析HTTP请求。也就是说,请求保持原样中转给之后的服务器。隧道会在通信双方断开连接时结束。
缓存是指代理服务器或客户端本地磁盘内保存的资源副本。
利用缓存可减少对源服务器的访问,因此节省了通信流量和通信时间。
缓存服务器是代理服务器的一种,并归类在缓存代理类型中。换句话说,当代理转发从服务器返回的响应时,代理服务器将会保存一份资源的副本。
缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。因此客户端可就近从缓存服务器上获取资源,而源服务器也不必多次代理相同的请求了。
即便缓存服务器内有缓存,也不能保证每次都会返回对同资源的请求。
当遇上源服务器上的资源更新时,如果还是使用不变的缓存,那就会演变成返回更新前的旧资源了。
即使存在缓存,也会因为客户端的要求,缓存的有效期等因素,向源服务器确认资源的有效性。若判断缓存失效,缓存服务器会再次从源服务器上获取新资源。
缓存不仅可以存在于缓存服务器内,还可以存在客户端浏览器中。
浏览器缓存如果有效,就不必再向服务器请求相同的资源了,可以直接从本地磁盘中读取。
另外,和缓存服务器相同的一点是,当判定缓存过期后,会向源服务器确认资源的有效性。若判断失效,浏览器会再次请求新资源。
科普:
在 HTTP 出现之前的协议 在 HTTP 普及之前,也就是从互联网的诞生期至今,曾出现过各式 各样的协议。在 HTTP 规范确立之际,制定者们参考了那些协议的 功能。也有某些协议现在已经彻底退出了人们的视线。接下来,我 们会简单介绍一下这些协议。
FTP(File Transfer Protocol)
传输文件时使用的协议。该协议历史久远,可追溯到 1973 年前 后,比 TCP/IP 协议族的出现还要早。虽然它在 1995 年被 HTTP 的 流量(Traffic)超越,但时至今日,仍被广泛沿用。
NNTP(Network News Transfer Protocol)
用于 NetNews 电子会议室内传送消息的协议。在 1986 年前后出 现,属于比较古老的一类协议。现在,利用 Web 交换信息已成主 流,所以该协议已经不怎么使用了。
Archie
搜索 anonymous FTP 公开的文件信息的协议。1990 年前后出现,现 在已经不常使用。
WAIS(Wide Area Information Servers)**
以关键词检索多个数据库使用的协议。1991 年前后出现。由于现 在已经被 HTTP 协议替代,也已经不怎么使用了。 Gopher 查找与互联网连接的计算机内信息的协议。1991 年前后出现,由 于现在已经被 HTTP 协议替代,也已经不怎么使用了。