一、统一资源定位符URL
    1、为了方便访问在世界范围的文档,万维网使用统一资源定位符URL来指明因特网上任何种类“资源”的位置
    2、URL的一般形式由以下四个部分组成:
    <协议>://<主机>:<端口>/<路径>

    二、万维网的文档
    1、HTML:超文本标记语言。使用多种“标签”来描述网页的结构和内容
    2、CSS:层叠样式表CSS。从审美的角度来描述网页样式
    3、JavaScript:一种脚本语言。控制网页的行为

    三、超文本传输协议HTTP
    1、HTTP定义了浏览器(即万维网客户端进程)怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器
    2、HTTP/1.0采用非持续连接的方式。在该方式下,每次浏览器请求一个文件都要与服务器建立TCP连接,当收到响应后流立即关闭连接
    (1)每请求一个文档就要有两倍的RTT的开销。
    (2)为减小时延,浏览器通常会建立多个并行的TCP连接同时请求多个对象,但是这会大量占用万维网服务器的资源。
    image.png
    3、HTTP/1.1采用持续连接方式。在该方式下,万维网服务器在发送响应后仍然保持这条连接,使同一个客户端(浏览器)和该服务器可以继续在这条连接上传送后续的HTTP请求报文和响应报文。
    (1)为了进一步提高效率,HTTP/1.1的持续连接还可以使用流水线方式工作,即浏览器在收到HTTP的响应报文之前就能够连续发送多个请求报文。

    四、HTTP的报文格式
    (一)HTTP请求报文
    1、HTTP是面向文本的,其报文中的每一个字段都是一些ASCII串码,并且每个字段的长度都是不确定的
    image.pngimage.png
    2、HTTP请求报文支持的方法
    (1)GET:请求URL标志的文档
    (2)HEAD:请求URL标志的文档首部
    (3)POST:向服务器发送数据
    (4)PUT:在指明的URL下存储一个文档
    (5)DELETE:删除URL标志的文档
    (6)CONNECT:用于代理服务器
    (7)OPTIONS:请求一些选项信息
    (8)TRACE:用来进行回环测试
    (9)PATCH:对PUT方法的补充,用来对已知资源进行局部更新
    image.png
    (二)HTTP响应报文
    1、HTTP响应报文的格式
    image.png
    2、HTTP响应报文的状态码(5大类33种)
    (1)1XX:表示通知信息,如请求收到了或正在处理
    (2)2XX:表示成功,如接收或知道了
    (3)3XX:表示重定向,即要完成请求还必须采取进一步的行动
    (4)4XX:表示客户的差错,如请求中有错误的语法或不能完成。
    (5)5XX:表示服务器的差错,如服务器失效无法完成

    五、cookie
    1、早期的万维网应用非常简单,仅仅是用户查看存放在不同服务器上的各种静态的文档。因此HTTP被设计为一种无状态的协议。这样可以简化服务器的设计
    2、cookie提供了一种机制使得万维网服务器能够“记住”用户,而无需用户主动提供用户标志信息。也就是说,cookie是一种对无状态的HTTP进行状态化的技术
    image.png

    六、万维网缓存与代理服务器
    1、在万维网中还可以使用缓存机制以提供万维网的效率
    2、万维网缓存又称为web缓存,可以位于客户机,也可以用于中间系统上,位于中间系统的web缓存又称为代理服务器
    3、web缓存把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时,若发现这个请求与暂时存放的请求相同,就返回暂存的响应,而不需要按URL的地址再次去因特网访问该资源。