第九周 - 彻底掌握基于HTTP网络层的 “前端性能优化” - 《JS系列笔记》

彻底掌握基于HTTP网络层的 “前端性能优化”
- 从输入URL地址到看到页面，中间都经历了啥
第一步：URL解析
第二步：缓存检查
第三步：DNS解析
- DNS解析是有缓存的
第四步：TCP三次握手
第五步：数据传输
第六步：TCP四次挥手
第七步：页面渲染
- 性能优化汇总
- HTTP1.0 VS HTTP1.1 VS HTTP2.0

彻底掌握基于HTTP网络层的 “前端性能优化”

产品性能优化方案

HTTP网络层优化
代码编译层优化 webpack
代码运行层优化 html/css + javascript + vue + react
安全优化 xss + csrf
数据埋点及性能监控
……

CRP（Critical [ˈkrɪtɪkl] Rendering [ˈrendərɪŋ] Path）关键渲染路径

域名就是给服务器外网起个别名

从输入URL地址到看到页面，中间都经历了啥

第一步：URL解析

地址解析

编码
第二步：缓存检查
缓存位置：
- Memory Cache : 内存缓存
- Disk Cache：硬盘缓存

打开网页：查找 disk cache 中是否有匹配，如有则使用，如没有则发送网络请求
普通刷新 (F5)：因TAB没关闭，因此memory cache是可用的，会被优先使用，其次才是disk cache
强制刷新 (Ctrl + F5)：浏览器不使用缓存，因此发送的请求头部均带有 Cache-control: no-cache，服务器直接返回 200 和最新内容
强缓存 Expires / Cache-Control 状态码都是200

浏览器对于强缓存的处理：根据第一次请求资源时返回的响应头来确定的

Expires：缓存过期时间，用来指定资源到期的时间（HTTP/1.0）
Cache-Control：cache-control: max-age=2592000第一次拿到资源后的2592000秒内（30天），再次发送请求，读取缓存中的信息（HTTP/1.1）
两者同时存在的话，Cache-Control优先级高于Expires

协商缓存 Last-Modified[http:1.0] / ETag[http:1.1]

第一次请求：客户端本地无协商缓存对应的标识，则直接向服务器发送请求；而服务器端会把资源信息给客户端「同样也会在响应头中设置对应的字段：Last-Modified(存储当前文件在服务器最后修改的时间) & Etag(服务器把当前文件修改后，可以生成一个唯一的标识) 给客户端」；客户端获取到内容后，把资源文件和标识都缓存在本地…
第二次请求：我们需要把本地存储的Last-Modified/Etag，基于请求头中的If-Modified-Since/If-None-Match这两个字段，传递给服务器；服务器收到对应的标识后，会去检查现有服务器文件最后修改的时间，和你传递给我的时间是否一致；

如果是一致的，说明这个文件从上一次请求到现在没有修改过，服务器无需重新返回文件信息，只需要返回304状态码即可；客户端获取到304状态码后，会从本地缓存中读取信息进行渲染；
如果不一致，说明服务器这个文件已经修改过了，此时服务器返回200的状态码，并且把最新的资源及最新的Last-Modified/Etag都返回给客户端端；客户端从新存储到本地和渲染即可…

HTML资源不能做强缓存，但是可以做协商缓存；其它资源既可做强缓存，也可做协商缓存「很多项目中是两者都做的」

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识决定是否使用缓存的过程

数据缓存
本地存储的解决方案

cookie
webstorage H5新增的
- localStorage
- sessionStorage
IndexedDB 本地数据库存储
- WebSQL
- …

第三步：DNS解析

如果想找到服务器，则需要基于服务器的外网IP;但外网IP太难记，所以买个域名让他好记一些，所以我们需要根据域名找到服务器的外网IP【去DNS服务器上找】…这个操作就是DNS解析

DNS解析是有缓存的

当前如果我们解析过这个域名，则会把解析记录缓存到本地，所以每一次DNS解析一定要经历两个步骤：
- 本地DNS解析缓存查找「递归查询」
- 本地没有缓存记录，则再去公网DNS服务器上去查找「迭代查询」
DNS阶段优化
- 减少DNS解析次数「资源都放在一个服务器/一个域名下，这样解析一次就够了」
- 但是真实项目中我们确不这样做，我们会把资源分散到不同的服务器上，这样带来的问题是，需要解析很多域名
  - @1 服务器资源的合理利用
  - @2 提高HTTP同时并发的数量「同源下，同时允许最多的HTTP并发数是5~7个」
  - @3 提高服务器抗压能力
- 在DNS解析次数增加的情况下，我们可以基于 “DNS预获取（DNS Prefetch）” 进行优化

域名：万网买万网阿里云
项目流程-》买域名 -> 域名解析「域名备案」{把域名和对应的外网IP放在DNS服务器上}
dns服务器：不属于个人，属于万维网组织的

域名解析：把域名和外网IP登记到DNS服务器

DNS解析

递归查询
迭代查询

每一次DNS解析时间预计在20~120毫秒

减少DNS请求次数
DNS预获取（DNS Prefetch）

<meta http-equiv="x-dns-prefetch-control" content="on">
<link rel="dns-prefetch" href="//static.360buyimg.com"/>
<link rel="dns-prefetch" href="//misc.360buyimg.com"/>
<link rel="dns-prefetch" href="//img10.360buyimg.com"/>
<link rel="dns-prefetch" href="//d.3.cn"/>
<link rel="dns-prefetch" href="//d.jd.com"/>

服务器拆分的优势

资源的合理利用
抗压能力加强
提高HTTP并发、
……

第四步：TCP三次握手

当我们获取到服务器外网IP，通过外网IP找到服务器，让客户端和服务器之间建立连接通道，
而三次握手的目的：是建立一套稳定的传输通道

传输控制协议：TCP、UDP…

TCP：安全可靠的，但是消耗时间
UDP：不稳定的传输通道，但是比较快「不需要经过三次握手」

seq序号，用来标识从TCP源端向目的端发送的字节流，发起方发送数据时对此进行标记
ack确认序号，只有ACK标志位为1时，确认序号字段才有效，ack=seq+1
标志位

ACK：确认序号有效
RST：重置连接
SYN：发起一个新连接
FIN：释放一个连接
……

三次握手为什么不用两次，或者四次?
TCP作为一种可靠传输控制协议，其核心思想：既要保证数据可靠传输，又要提高传输的效率！

第五步：数据传输

客户端想把信息传递给服务器？

设置请求头[含cookie信息]
设置请求主体
设置URL地址的问号传参

服务器如果想把嘻嘻返回给客户端
设置响应头[含服务器时间Date]
设置响应主体

请求方式：

GET系列：GET、HEAD、DELETE、OPTIONS
POST系列：POST、PUT、PATCH

从服务器获取静态资源文件(HTML/CSS/JS/图片…)都是GET请求，一般只有在ajax/fetch数据请求中才会遇到其余的请求方式！
不论哪一种请求方式，客户端肯定可以把信息传递给服务器，服务器也可以把信息返回给客户端
GET:从服务器获取信息「一般是给服务器的少，从服务器拿的多」
POST:向服务器推送信息「一般是给服务器的多，服务器返回的少」
HEAD:只获取响应头信息，服务器不会返回任何响应主体信息
- xhr状态 xhr.readyState
  - 0 UNSENT 初始状态
  - 1 OPENED 已打开(执行了xhr.open)
    
    —-发送请求后
- 2 HEADERS_RECEIVED 响应头信息已经返回
- 3 LOADING 响应主体信息正在准备或者在返回的路上
- 4 DONE 响应主体信息返回
DELETE:删除服务器端的文件
PUT:向服务器端存放文件
OPTIONS:试探性请求，在CORS跨域资源共享中，发送真正的请求之前，先发送一个试探请求，验证客户端和服务器端是否可以实现通信，可以通信，再去发送真正的请求
GET系列请求 VS POST系列请求
- 约定规范：GET系利请求，需要基于URL问号传参，把信息传递给服务器「/api/list?xxx=xxx&xxx=xxx」；POST系列请求，是基于请求主体，把信息传递给服务器的「格式：application/json、application/x-www-form-urlencoded、multipart/form-data…」；
- GET系列传递给服务器的信息有大小限制「原因：浏览器对于URL长度有限制，IE下一般是2KB，谷歌一般是8KB」; POST系列理论上是没有的「现实开发中，为了保证传输效率，我们自己会限制大小」!
GET相对于POST来讲不安全「都不安全，互联网面前，人人都在裸奔；对于重要信息的传输，一定要加密」
GET会产生缓存「两次请求，地址&参数等信息都一样，则第二次请求，很可能拿到的是上一次缓存的结果」，解决办法：在每次请求的末尾加一个随机数或者时间戳，保证每次请求不完全一致!
/api/list?xxx=xxx&_=${Math.random()}
HTTP报文
- 请求报文
- 响应报文
响应状态码
- 200 OK
- 202 Accepted ：服务器已接受请求，但尚未处理（异步）
- 204 No Content：服务器成功处理了请求，但不需要返回任何实体内容
- 206 Partial Content：服务器已经成功处理了部分 GET 请求（断点续传 Range/If-Range/Content-Range/Content-Type:”multipart/byteranges”/Content-Length….）
- 301 Moved Permanently
- 302 Move Temporarily
- 304 Not Modified
- 305 Use Proxy
- 400 Bad Request : 请求参数有误
- 401 Unauthorized：权限（Authorization）
- 404 Not Found
- 405 Method Not Allowed
- 408 Request Timeout
- 500 Internal Server Error
- 503 Service Unavailable
- 505 HTTP Version Not Supported
- ……
  第六步：TCP四次挥手
断开客户端和服务器之间的连接通道
客户端把信息给服务器，告诉服务器，我把东西给你了，你注意查收，我要断开连接了
服务器收到信息后，立即告诉客户端，你的东西我收到了，你等会，我给你准备你想要的东西

——准备内容，返回内容
服务器把信息返回给客户端，告诉客户端，我把东西给你了，你准备接收吧，我要断开连接了
客户端拿到东西，告诉服务器，你的东西我收到了，咱们拜拜了

如果每次前后端通信，都需要握手和挥手，则性能消耗比较大；我们期望建立连接后，先别着急断开，后续再有请求，则还是基于这个通道传输即可 -> 机制：长链接 Connection: keep-alive 「如果是HTTP1.0版本，需要自己设置，但是如果是HTTP1.1版本{目前最常用的}，则默认就设置为长链接」

为什么连接的时候是三次握手，关闭的时候却是四次握手？

服务器端收到客户端的SYN连接请求报文后，可以直接发送SYN+ACK报文
但关闭连接时，当服务器端收到FIN报文时，很可能并不会立即关闭链接，所以只能先回复一个ACK报文，告诉客户端：”你发的FIN报文我收到了”，只有等到服务器端所有的报文都发送完了，我才能发送FIN报文，因此不能一起发送，故需要四步握手。

Connection: keep-alive

第七步：页面渲染

性能优化汇总

/*
 *     1.利用缓存
 *       + 对于静态资源文件实现强缓存和协商缓存（扩展：文件有更新，如何保证及时刷新？）  
 *       + 对于不经常更新的接口数据采用本地存储做数据缓存（扩展：cookie / localStorage / vuex|redux 区别？）
 *     2.DNS优化
 *       + 分服务器部署，增加HTTP并发性（导致DNS解析变慢）
 *       + DNS Prefetch
 *     3.TCP的三次握手和四次挥手
 *       + Connection:keep-alive
 *     4.数据传输
 *       + 减少数据传输的大小
 *         + 内容或者数据压缩（webpack等）
 *         + 服务器端一定要开启GZIP压缩（一般能压缩60%左右）
 *         + 大批量数据分批次请求（例如：下拉刷新或者分页，保证首次加载请求数据少）
 *       + 减少HTTP请求的次数
 *         + 资源文件合并处理
 *         + 字体图标
 *         + 雪碧图 CSS-Sprit
 *         + 图片的BASE64
 *       + ......
 *     5.CDN服务器“地域分布式”
 *     6.采用HTTP2.0
 * ==============
 * 网络优化是前端性能优化的中的重点内容，因为大部分的消耗都发生在网络层，尤其是第一次页面加载，如何减少等待时间很重要“减少白屏的效果和时间”
 *     + LOADDING 人性化体验
 *     + 骨架屏：客户端骨屏 + 服务器骨架屏
 *     + 图片延迟加载
 *     + ....
 */

HTTP1.0 VS HTTP1.1 VS HTTP2.0

HTTP1.0和HTTP1.1的一些区别

缓存处理，HTTP1.0中主要使用 Last-Modified，Expires 来做为缓存判断的标准，HTTP1.1则引入了更多的缓存控制策略：ETag，Cache-Control…
带宽优化及网络连接的使用，HTTP1.1支持断点续传，即返回码是206（Partial Content）
错误通知的管理，在HTTP1.1中新增了24个错误状态响应码，如409（Conflict）表示请求的资源与资源的当前状态发生冲突；410（Gone）表示服务器上的某个资源被永久性的删除…
Host头处理，在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址，因此，请求消息中的URL并没有传递主机名（hostname）。但随着虚拟主机技术的发展，在一台物理服务器上可以存在多个虚拟主机（Multi-homed Web Servers），并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域，且请求消息中如果没有Host头域会报告一个错误（400 Bad Request）
长连接，HTTP1.1中默认开启Connection： keep-alive，一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

HTTP2.0和HTTP1.X相比的新特性

新的二进制格式（Binary Format），HTTP1.x的解析是基于文本，基于文本协议的格式解析存在天然缺陷，文本的表现形式有多样性，要做到健壮性考虑的场景必然很多，二进制则不同，只认0和1的组合，基于这种考虑HTTP2.0的协议解析决定采用二进制格式，实现方便且健壮
header压缩，HTTP1.x的header带有大量信息，而且每次都要重复发送，HTTP2.0使用encoder来减少需要传输的header大小，通讯双方各自cache一份header fields表，既避免了重复header的传输，又减小了需要传输的大小
服务端推送（server push），例如我的网页有一个sytle.css的请求，在客户端收到sytle.css数据的同时，服务端会将sytle.js的文件推送给客户端，当客户端再次尝试获取sytle.js时就可以直接从缓存中获取到，不用再发请求了
```
// 通过在应用生成HTTP响应头信息中设置Link命令
Link: </styles.css>; rel=preload; as=style, </example.png>; rel=preload; as=image
```
多路复用（MultiPlexing） ```
HTTP/1.0 每次请求响应，建立一个TCP连接，用完关闭
HTTP/1.1 「长连接」若干个请求排队串行化单线程处理，后面的请求等待前面请求的返回才能获得执行机会，一旦有某请求超时等，后续请求只能被阻塞，毫无办法，也就是人们常说的线头阻塞；
HTTP/2.0 「多路复用」多个请求可同时在一个连接上并行执行，某个请求任务耗时严重，不会影响到其它连接的正常执行； ```

彻底掌握基于HTTP网络层的 “前端性能优化”

彻底掌握基于HTTP网络层的 “前端性能优化”

从输入URL地址到看到页面，中间都经历了啥

第一步：URL解析

第二步：缓存检查

第三步：DNS解析

DNS解析是有缓存的

第四步：TCP三次握手

第五步：数据传输

第六步：TCP四次挥手

第七步：页面渲染

性能优化汇总

HTTP1.0 VS HTTP1.1 VS HTTP2.0