本文由 简悦 SimpRead 转码, 原文地址 www.cnblogs.com* 一:浏览器缓存的作用是什么?
一:浏览器缓存的作用是什么?
- 缓存可以减少冗余的数据传输。节省了网络带宽,从而更快的加载页面。
- 缓存降低了服务器的要求,从而服务器更快的响应。
那么我们使用缓存,缓存的资源文件到什么地方去了呢?
那么首先来看下 memory cache 和 disk cache 缓存
- memory cache: 它是将资源文件缓存到内存中。等下次请求访问的时候不需要重新下载资源,而是直接从内存中读取数据。
- disk cache: 它是将资源文件缓存到硬盘中。等下次请求的时候它是直接从硬盘中读取。
那么他们两则的区别是?
- memory cache(内存缓存) 退出进程时数据会被清除,而 disk cache(硬盘缓存) 退出进程时数据不会被清除。内存读取比硬盘中读取的速度更快。但是我们也不能把所有数据放在内存中缓存的,因为内存也是有限的。
- memory cache(内存缓存) 一般会将脚本、字体、图片会存储到内存缓存中。
- disk cache(硬盘缓存) 一般非脚本会存放在硬盘中,比如 css 这些。
缓存读取的原理:先从内存中查找对应的缓存,如果内存中能找到就读取对应的缓存,否则的话就从硬盘中查找对应的缓存,如果有就读取,否则的话,就重新网络请求。
那么浏览器缓存它又分为 2 种:强制缓存和协商缓存。
协商缓存原理:客户端向服务器端发出请求,服务端会检测是否有对应的标识,如果没有对应的标识,服务器端会返回一个对应的标识给客户端,客户端下次再次请求的时候,把该标识带过去,然后服务器端会验证该标识,如果验证通过了,则会响应 304,告诉浏览器读取缓存。如果标识没有通过,则返回请求的资源。
那么协商缓存的标识又有 2 种:ETag/if-None-Match 和 Last-Modified/if-Modify-Since
协商缓存 Last-Modified/if-Modify-Since
浏览器第一次发出请求一个资源的时候,服务器会返回一个 last-Modify 到 hearer 中. Last-Modify 含义是最后的修改时间。
当浏览器再次请求的时候,request 的请求头会加上 if-Modify-Since,该值为缓存之前返回的 Last-Modify. 服务器收到 if-Modify-Since 后,根据资源的最后修改时间 (last-Modify) 和该值 (if-Modify-Since) 进行比较,如果相等的话,则命中缓存,返回 304,否则, 如果 Last-Modify > if-Modify-Since, 则会给出 200 响应,并且更新 Last-Modify 为新的值。
下面我们使用 node 来模拟下该场景。基本的代码如下:
import Koa from 'koa';import path from 'path';//静态资源中间件import resource from 'koa-static';const app = new Koa();const host = 'localhost';const port = 7788;const url = require('url');const fs = require('fs');const mime = require('mime');app.use(async(ctx, next) => {// 获取文件名const { pathname } = url.parse(ctx.url, true);// 获取文件路径const filepath = path.join(__dirname, pathname);const req = ctx.req;const res = ctx.res;// 判断文件是否存在fs.stat(filepath, (err, stat) => {if (err) {res.end('not found');} else {// 获取 if-modified-since 这个请求头const ifModifiedSince = req.headers['if-modified-since'];// 获取最后修改的时间const lastModified = stat.ctime.toGMTString();// 判断两者是否相等,如果相等返回304读取浏览器缓存。否则的话,重新发请求if (ifModifiedSince === lastModified) {res.writeHead(304);res.end();} else {res.setHeader('Content-Type', mime.getType(filepath));res.setHeader('Last-Modified', stat.ctime.toGMTString());// fs.createReadStream(filepath).pipe(res);}}});await next();});app.use(resource(path.join(__dirname, './static')));app.listen(port, () => {console.log(`server is listen in ${host}:${port}`);});
当我们第一次访问的时候 (清除浏览器的缓存),如下图所示:

当我们继续刷新浏览器的时候,我们再看下如下数据:

如上可以看到,当我们第二次请求的时候,请求头部加上了 If-Modified-Since 该参数,并且该参数的值该响应头中的时间相同。因此返回 304 状态。
查看 demo,请看 github 上的源码
协商缓存 ETag/if-None-Match
ETag 的原理和上面的 last-modified 是类似的。ETag 则是对当前请求的资源做一个唯一的标识。该标识可以是一个字符串,文件的 size,hash 等。只要能够合理标识资源的唯一性并能验证是否修改过就可以了。ETag 在服务器响应请求的时候,返回当前资源的唯一标识 (它是由服务器生成的)。但是只要资源有变化,ETag 会重新生成的。浏览器再下一次加载的时候会向服务器发送请求,会将上一次返回的 ETag 值放到 request header 里的 if-None-Match 里面去,服务器端只要比较客户端传来的 if-None-Match 值是否和自己服务器上的 ETag 是否一致,如果一致说明资源未修改过,因此返回 304,如果不一致,说明修改过,因此返回 200。并且把新的 Etag 赋值给 if-None-Match 来更新该值。
last-modified 和 ETag 之间对比
- 在精度上,ETag 要优先于 last-modified。
- 在性能上,Etag 要逊于 Last-Modified,Last-Modified 需要记录时间,而 Etag 需要服务器通过算法来计算出一个 hash 值。
- 在优先级上,服务器校验优先考虑 Etag。
下面我们继续使用 node 来演示下:基本代码如下:
import path from 'path';import Koa from 'koa';//静态资源中间件import resource from 'koa-static';const app = new Koa();const host = 'localhost';const port = 7878;const url = require('url');const fs = require('fs');const mime = require('mime');/*const crypto = require('crypto');app.use(async(ctx, next) => {// 获取文件名const { pathname } = url.parse(ctx.url, true);// 获取文件路径const filepath = path.join(__dirname, pathname);const req = ctx.req;const res = ctx.res;// 判断文件是否存在fs.stat(filepath, (err, stat) => {if (err) {res.end('not found');} else {console.log(111);// 获取 if-none-match 这个请求头const ifNoneMatch = req.headers['if-none-match'];const readStream = fs.createReadStream(filepath);const md5 = crypto.createHash('md5');// 通过流的方式读取文件并且通过md5进行加密readStream.on('data', (d) => {console.log(333);console.log(d);md5.update(d);});readStream.on('end', () => {const eTag = md5.digest('hex');// 验证Etag 是否相同if (ifNoneMatch === eTag) {res.writeHead(304);res.end();} else {res.setHeader('Content-Type', mime.getType(filepath));// 第一次服务器返回的时候,会把文件的内容算出来一个标识,发给客户端fs.readFile(filepath, (err, content) => {// 客户端看到etag之后,也会把此标识保存在客户端,下次再访问服务器的时候,发给服务器res.setHeader('Etag', etag);// fs.createReadStream(filepath).pipe(res);});}});}});await next();});*/// 我们这边直接使用 现成的插件来简单的演示下。如果要比较的话,可以看上面的代码原理即可import conditional from 'koa-conditional-get';import etag from 'koa-etag';app.use(conditional());app.use(etag());app.use(resource(path.join(__dirname, './static')));app.listen(port, () => {console.log(`server is listen in ${host}:${port}`);});
如上基本代码,当我们第一次请求的时候 (先清除浏览器缓存),可以看到如下图所示:

如上我们可以看到返回值里面有 Etag 的值。
然后当我们再次刷新浏览器代码的时候,浏览器将会带上 if-None-Match 请求头,并赋值为上一次返回头的 Etag 的值。
然后和服务器端的 Etag 的值进行对比,如果相等的话,就会返回 304 Not Modified。如下图所示:

我们再来改下 html 的内容,我们再来刷新下看看,可以看到页面内容发生改变了,因此 Etag 值是不一样的。如下图所示

然后我们继续刷新,就会返回 304 了,因为它会把最新的 Etag 的值赋值给 if-None-Match 请求头,然后请求的时候,会把该最新值带过去,因此如下图所示可以看到。
如上就是协商缓存的基本原理了。下面我们来看下强制缓存。
三:理解强制缓存
基本原理:浏览器在加载资源的时候,会先根据本地缓存资源的 header 中的信息 (Expires 和 Cache-Control) 来判断是否需要强制缓存。如果命中的话,则会直接使用缓存中的资源。否则的话,会继续向服务器发送请求。
Expires
Expires 是 http1.0 的规范,它的值是一个绝对时间的 GMT 格式的时间字符串。这个时间代表的该资源的失效时间,如果在该时间之前请求的话,则都是从缓存里面读取的。但是使用该规范时,可能会有一个缺点就是当服务器的时间和客户端的时间不一样的情况下,会导致缓存失效。
Cache-Control
Cache-Control 是 http1.1 的规范,它是利用该字段 max-age 值进行判断的。该值是一个相对时间,比如 Cache-Control: max-age=3600, 代表该资源的有效期是 3600 秒。除了该字段外,我们还有如下字段可以设置:
no-cache: 需要进行协商缓存,发送请求到服务器确认是否使用缓存。
no-store:禁止使用缓存,每一次都要重新请求数据。
public:可以被所有的用户缓存,包括终端用户和 CDN 等中间代理服务器。
private:只能被终端用户的浏览器缓存,不允许 CDN 等中继缓存服务器对其缓存。
Cache-Control 与 Expires 可以在服务端配置同时启用,同时启用的时候 Cache-Control 优先级高。
下面我们来看下使用 max-age 设置多少秒后过期来验证下。最基本的代码如下:
import path from 'path';import Koa from 'koa';//静态资源中间件import resource from 'koa-static';const app = new Koa();const host = 'localhost';const port = 7878;app.use(async (ctx, next) => {// 设置响应头Cache-Control 设置资源有效期为300秒ctx.set({'Cache-Control': 'max-age=300'});await next();});app.use(resource(path.join(__dirname, './static')));app.listen(port, () => {console.log(`server is listen in ${host}:${port}`);});
如上我们设置了 300 秒后过期,也就是有效期为 5 分钟,当我们第一次请求页面的时候,我们可以查看下如下所示:

我们可以看到响应头中有 Cache-Control 字段 max-age=300 这样的,并且状态码是 200 的状态。
下面我们继续来刷新下页面,可以看到请求如下所示:

请求是 200,但是数据是从内存里面读取,如上截图可以看到。
我们现在再把该页面关掉,重新打开新的页面,打开控制台网络,再查看下可以看到如下所示:

因为内存是存在进程中的,当我们关闭页面的时候,内存中的资源就被释放掉了,但是磁盘中的数据是永久的,如上我们可以看到数据从硬盘中读取的。
如上设置的有效期为 5 分钟,5 分钟过后我们再来刷新下页面。如下所示:

如上可以看到 5 分钟过期后,就不会从内存或磁盘中读取了,而是重新请求下服务器的资源。如上就是使用 max-age 来演示强制缓存的了。
查看 github 源码


