一、统一资源定位符URL
1、为了方便访问在世界范围的文档,万维网使用统一资源定位符URL来指明因特网上任何种类“资源”的位置
2、URL的一般形式由以下四个部分组成:
<协议>://<主机>:<端口>/<路径>
二、万维网的文档
1、HTML:超文本标记语言。使用多种“标签”来描述网页的结构和内容
2、CSS:层叠样式表CSS。从审美的角度来描述网页样式
3、JavaScript:一种脚本语言。控制网页的行为
三、超文本传输协议HTTP
1、HTTP定义了浏览器(即万维网客户端进程)怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器
2、HTTP/1.0采用非持续连接的方式。在该方式下,每次浏览器请求一个文件都要与服务器建立TCP连接,当收到响应后流立即关闭连接
(1)每请求一个文档就要有两倍的RTT的开销。
(2)为减小时延,浏览器通常会建立多个并行的TCP连接同时请求多个对象,但是这会大量占用万维网服务器的资源。
3、HTTP/1.1采用持续连接方式。在该方式下,万维网服务器在发送响应后仍然保持这条连接,使同一个客户端(浏览器)和该服务器可以继续在这条连接上传送后续的HTTP请求报文和响应报文。
(1)为了进一步提高效率,HTTP/1.1的持续连接还可以使用流水线方式工作,即浏览器在收到HTTP的响应报文之前就能够连续发送多个请求报文。
四、HTTP的报文格式
(一)HTTP请求报文
1、HTTP是面向文本的,其报文中的每一个字段都是一些ASCII串码,并且每个字段的长度都是不确定的
2、HTTP请求报文支持的方法
(1)GET:请求URL标志的文档
(2)HEAD:请求URL标志的文档首部
(3)POST:向服务器发送数据
(4)PUT:在指明的URL下存储一个文档
(5)DELETE:删除URL标志的文档
(6)CONNECT:用于代理服务器
(7)OPTIONS:请求一些选项信息
(8)TRACE:用来进行回环测试
(9)PATCH:对PUT方法的补充,用来对已知资源进行局部更新
(二)HTTP响应报文
1、HTTP响应报文的格式
2、HTTP响应报文的状态码(5大类33种)
(1)1XX:表示通知信息,如请求收到了或正在处理
(2)2XX:表示成功,如接收或知道了
(3)3XX:表示重定向,即要完成请求还必须采取进一步的行动
(4)4XX:表示客户的差错,如请求中有错误的语法或不能完成。
(5)5XX:表示服务器的差错,如服务器失效无法完成
五、cookie
1、早期的万维网应用非常简单,仅仅是用户查看存放在不同服务器上的各种静态的文档。因此HTTP被设计为一种无状态的协议。这样可以简化服务器的设计
2、cookie提供了一种机制使得万维网服务器能够“记住”用户,而无需用户主动提供用户标志信息。也就是说,cookie是一种对无状态的HTTP进行状态化的技术
六、万维网缓存与代理服务器
1、在万维网中还可以使用缓存机制以提供万维网的效率
2、万维网缓存又称为web缓存,可以位于客户机,也可以用于中间系统上,位于中间系统的web缓存又称为代理服务器
3、web缓存把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时,若发现这个请求与暂时存放的请求相同,就返回暂存的响应,而不需要按URL的地址再次去因特网访问该资源。