缓存位置
- Memory Cache
- Service Woker Cache
  - public 和 private
  - no-store 和 no-cache
协商缓存
- Last-Modified
- ETag
用户行为对浏览器缓存的影响
参考文章

缓存位置

浏览器缓存并非是一个“总体”概念，其实它也是有先后顺序的。总的来说分为以下4个方面。

Memory Cache
Service Worker Cache
Disk Cache
Push Cache

从这张图中我们可以清楚地看到浏览器缓存的具体位置，其中的网络请求都会有不同位置的缓存。

Memory Cache

Memory Cacha 是指内存中的缓存。它是浏览器优先去命中的一种缓存，也是响应速度最快的一种缓存。但是它的缺点是缓存时间短，关闭tab页面缓存将不复存在，它与浏览器渲染进程紧密联系。

那么哪一些文件会被放到这一缓存里面呢？其实这没有官方的说明，由于浏览器的内存非常有限，浏览器并不会把所有文件都缓存在此处。一般来说会缓存一些体积不大的js或者css文件。

Service Woker Cache

Service Worker 是一种独立于主线程之外的 javascript 线程。它脱离于浏览器窗体，因此无法直接访问 DOM 元素。所以这一个独立的线程能够在不干扰主线程的情况下来提升性能。
Service Worker 的缓存与浏览器内建的其他缓存机制不一样，它可以让我们自由缓存哪一些文件、如何匹配缓存等，且缓存具有持续性。

实现该缓存一般分为3个步骤：首先注册 Service Worker ，然后监听 install 事件就可以缓存我们想要的文件。用户下次访问可以通过拦截请求的方式来获取缓存数据。若没有则会重新获取数据，然后再进行缓存。

Service Worker 可以用来实现离线缓存、消息推送以及网络代理等功能。那我们如何使用这种缓存呢？

注意 Server Worker 对协议是有要求的，必须以 https 协议为前提

window.navigator.serviceWorker.register('/test.js').then(
function () {
   console.log('注册成功')
}).catch(err => {
   console.error("注册失败")
})
})

监听事件 ```javascript // Service Worker会监听 install事件，我们在其对应的回调里可以实现初始化的逻辑
self.addEventListener(‘install’, event => { event.waitUntil( // 考虑到缓存也需要更新，open内传入的参数为缓存的版本号 caches.open(‘test-v1’).then(cache => { return cache.addAll([
```
 // 此处传入指定的需缓存的文件名
 '/test.html',
 '/test.css',
 '/test.js'
```
]) }) ) })

// Service Worker会监听所有的网络请求，网络请求的产生触发的是fetch事件，我们可以在其对应的监听函数中实现对请求的拦截，进而判断是否有对应到该请求的缓存，实现从Service Worker中取到缓存的目的 self.addEventListener(‘fetch’, event => { event.respondWith( // 尝试匹配该请求对应的缓存值 caches.match(event.request).then(res => { // 如果匹配到了，调用Server Worker缓存 if (res) { return res; } // 如果没匹配到，向服务端发起这个资源请求 return fetch(event.request).then(response => { if (!response || response.status !== 200) { return response; } // 请求成功的话，将请求缓存起来。 caches.open(‘test-v1’).then(function(cache) { cache.put(event.request, response); }); return response.clone(); }); }) ); });

<a name="eJ6Ch"></a>
## Disk Cache
Disk Cache 也就是硬盘缓存。这种缓存的缓存位置在电脑硬盘上，什么文件都可以缓存，就是读取速度慢。所有缓存中，它的覆盖面是最广的，会根据 HTTP Header 中的字段判断哪一些资源需要缓存，哪些可以不请求直接使用，哪一些已过期需要重新请求
浏览器通常会把哪些文件放进缓存呢?
- 大体积文件
- 系统内存使用率高
<a name="cOgBv"></a>
## Push Cache
Push Cache又名推送缓存，是HTTP/2中的内容，只有以上三种缓存未正确命中，它才会使用。仅存在于会话阶段（session），结束就会释放，缓存时间短。
由于国内用的比较少，网上查找后总结几个结论：
- Push Cache 是一种存在于会话阶段的缓存，当 session 终止时，缓存也随之释放。
- 不同的页面只要共享了同一个 HTTP2 连接，那么它们就可以共享同一个 Push Cache
- Push Cache 是缓存的最后一道防线。浏览器均未命中以上的情况下才会去询问 Push Cache。
- Push Cache中的缓存只能被使用一次。
<a name="QYfv1"></a>
# 缓存策略
浏览器缓存策略通常分为两种：**强缓存**和**协商缓存**。
一次HTTP请求示意图如下所示。浏览器第一次发起请求，事先询问浏览器是否有缓存。没有则向服务器进行请求，然后结果进行缓存。<br />![image.png](https://cdn.nlark.com/yuque/0/2022/png/1174243/1642407979841-0e952e4d-7e05-4023-9074-c424511cc8fc.png#clientId=u78f18adf-38a6-4&crop=0&crop=0&crop=1&crop=1&from=paste&id=udb943598&margin=%5Bobject%20Object%5D&name=image.png&originHeight=570&originWidth=761&originalType=url&ratio=1&rotation=0&showTitle=false&size=47467&status=done&style=none&taskId=ua64f7221-517e-4e85-ae27-6a8e8846394&title=)
<a name="Xw5fK"></a>
## 强缓存
强缓存是利用 http 头中的 Expires 和 Cache-Control 两个字段来控制的。强缓存中，当请求再次发出时，浏览器会根据其中的 expires 和 cache-control 判断目标资源是否“命中”强缓存，若命中则直接从缓存中获取资源，不会再与服务端发生通信。
<a name="tlynu"></a>
### expires
expires 是一个时间戳，二次请求我们试图向服务器请求资源，浏览器就会先对比本地时间和 expires 的时间戳，如果本地时间小于 expires 设定的过期时间，那么就直接去缓存中取这个资源。
它最大的问题在于对“本地时间”有很大的依赖。如果服务端和客户端的时间设置可能不同，或者我直接手动去把客户端的时间改掉，那么 expires 将无法达到我们的预期。所以我们有第二种方法 Cache-Control。
<a name="erBbP"></a>
### Cache-Control
Cache-Control 是一个时间长度，我们通过`max-age`来控制资源的有效期，它意味着该资源在时间长度以内都是有效的，完美地规避了时间戳带来的潜在问题。它的优先级更高，当两者同时出现的时候我们以 Cache-Control 为准。
Cache-Control 有如下常见字段
<a name="T29KU"></a>
#### max-age 和 s-maxage
```html
cache-control: max-age=3600, s-maxage=31536000

s-maxage 的优先级比 max-age 高。s-maxage 是代理服务器的缓存时间。客户端中我们以 max-age 为准。

public 和 private

public 与 private 是针对资源是否能够被代理服务缓存而存在的一组对立概念。如果我们为资源设置了 public，那么它既可以被浏览器缓存，也可以被代理服务器缓存；如果我们设置了 private，则该资源只能被浏览器缓存。private 为默认值。

no-store 和 no-cache

no-cache 绕开了浏览器：我们为资源设置了 no-cache 后，每一次发起请求都不会再去询问浏览器的缓存情况，而是直接向服务端去确认该资源是否过期（协商缓存）。

no-store 比较绝情，顾名思义就是不使用任何缓存策略。在 no-cache 的基础上，它连服务端的缓存确认也绕开了，只允许你直接向服务端发送请求、并下载完整的响应。

协商缓存

协商缓存依赖于服务端与浏览器之间的通信。 协商缓存有两个字段：Last-Modified 和 Etag

协商缓存机制下，浏览器需要向服务器去询问缓存的相关信息，进而判断是重新发起请求、下载完整的响应，还是从本地获取缓存的资源。

如果服务端提示缓存资源未改动（Not Modified），资源会被重定向到浏览器缓存，对应状态码是 304。

Last-Modified

Last-Modified 是一个时间戳，如果我们启用了协商缓存，它会在首次请求时随着 Response Headers 返回：

Last-Modified: Fri, 25 Oct 2018 06:35:57 GMT

随后我们每次请求时，会带上一个叫 If-Modified-Since 的时间戳字段，它的值正是上一次 response 返回给它的 last-modified 值：

Last-Modified: Fri, 25 Oct 2018 06:35:57 GMT

服务器接收到这个时间戳后，会比对该时间戳和资源在服务器上的最后修改时间是否一致，从而判断资源是否发生了变化。如果发生了变化，就会返回一个完整的响应内容，并在 Response Headers 中添加新的 Last-Modified 值；否则，返回如上图的 304 响应，Response Headers 不会再添加 Last-Modified 字段。

缺点与弊端：

手动改动服务器内容，即使没有修改内容，但服务器也认为是新的内容。进而引发一次完整的响应——不该重新请求的时候，也会重新请求。
修改文件速度过快（比如花了 100ms 完成了改动），由于 If-Modified-Since 只能检查到以秒为最小计量单位的时间差，所以它是感知不到这个改动的——该重新请求的时候，反而没有重新请求了。

为了解决问题，Etag出现了

ETag

Etag 是由服务器为每个资源生成的唯一的标识字符串，这个标识字符串是基于文件内容编码的，只要文件内容不同，它们对应的 Etag 就是不同的，反之亦然。因此 Etag 能够精准地感知文件的变化。

Etag 和 Last-Modified 类似，当首次请求时，我们会在响应头里获取到一个最初的标识符字符串，它可以是这样的：

ETag: W/"2a3b-1602480f459"

那么下一次请求时，请求头里就会带上一个值相同的、名为 if-None-Match 的字符串供服务端比对了：

If-None-Match: W/"2a3b-1602480f459"

Etag 的生成过程需要服务器额外付出开销，会影响服务端的性能，这是它的弊端。因此启用 Etag 需要我们审时度势。Etag 的优先级比 Last-Modified 高。

浏览器缓存 - 图3

用户行为对浏览器缓存的影响

打开网页，地址栏输入地址：查找 disk cache 中是否有匹配。如果有则使用，如果没有则发送网络请求
普通刷新（F5）：因为 TAB 没有关闭，因此 memory cache 是可用的，会被优先使用（如果匹配的的话），其次才是 disk cache
强制刷新（Ctrl + F5）：浏览器不适用缓存，因此发送的请求头部均带有 Cache-control: no-cache
- 为了兼容，还带了Pragma: no-cache，服务器直接返回 200 和最新内容。
  参考文章
  《系统总结浏览器缓存》

浏览器缓存