网页的解析过程
◼ 一个网页URL从输入到浏览器中,到显示经历过怎么样的解析过程呢?
要想深入理解下载的过程,我们还要先理解,一个index.html被下载下来后是如何被解析和显示在浏览器上的.
浏览器内核
◼ 常见的浏览器内核有
- Trident ( 三叉戟):IE、360安全浏览器、搜狗高速浏览器、百度浏览器、UC浏览器;
- Gecko( 壁虎) :Mozilla Firefox;
- Presto(急板乐曲)-> Blink (眨眼):Opera
- Webkit :Safari、360极速浏览器、搜狗高速浏览器、移动端浏览器(Android、iOS)
- Webkit -> Blink :Google Chrome,Edge
◼ 我们经常说的浏览器内核指的是浏览器的排版引擎:
- 排版引擎(layout engine),也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine)或样版引擎。
◼ 也就是一个网页下载下来后,就是由我们的渲染引擎来帮助我们解析的。
浏览器渲染过程
◼ 渲染引擎在拿到一个页面后,如何解析整个页面并且最终呈现出我们的网页呢?
- 我们之前学习过下面的这幅图,现在让我们更加详细的学习它的过程;
更详细的解析过程如下:
图片出处
解析一:HTML解析过程
◼ 因为默认情况下服务器会给浏览器返回index.html文件,所以解析HTML是所有步骤的开始:
◼ 解析HTML,会构建DOM Tree:
解析二:生成CSS规则
◼ 在解析的过程中,如果遇到CSS的link元素,那么会由浏览器负责下载对应的CSS文件:
- 注意:下载CSS文件是不会影响DOM的解析的;
◼ 浏览器下载完CSS文件后,就会对CSS文件进行解析,解析出对应的规则树:
- 我们可以称之为 CSSOM(CSS Object Model,CSS对象模型);
解析三:构建Render Tree
◼ 当有了DOM Tree和 CSSOM Tree后,就可以两个结合来构建Render Tree了
◼ 注意一:link元素不会阻塞DOM Tree的构建过程,但是会阻塞Render Tree的构建过程
- 这是因为Render Tree在构建时,需要对应的CSSOM Tree;
◼ 注意二:Render Tree和DOM Tree并不是一一对应的关系,比如对于display为none的元素,压根不会出现在render tree中;
解析四:布局(layout)和绘制(paint)
◼ 第四步是在渲染树(Render Tree)上运行布局(Layout)以计算每个节点的几何体。
- 渲染树会表示显示哪些节点以及其他样式,但是不表示每个节点的尺寸、位置等信息;
- 布局是确定呈现树中所有节点的宽度、高度和位置信息;
◼ 第五步是将每个节点绘制(Paint)到屏幕上
- 在绘制阶段,浏览器将布局阶段计算的每个frame转为屏幕上实际的像素点;
- 包括将元素的可见部分进行绘制,比如文本、颜色、边框、阴影、替换元素(比如img)
回流和重绘解析
◼ 理解回流reflow:(也可以称之为重排)
- 第一次确定节点的大小和位置,称之为布局(layout)。
- 之后对节点的大小、位置修改重新计算称之为回流。
◼ 什么情况下引起回流呢?
- 比如DOM结构发生改变(添加新的节点或者移除节点);
- 比如改变了布局(修改了width、height、padding、font-size等值)
- 比如窗口resize(修改了窗口的尺寸等)
- 比如调用getComputedStyle方法获取尺寸、位置信息;
◼ 理解重绘repaint:
- 第一次渲染内容称之为绘制(paint)。
- 之后重新渲染称之为重绘。
◼ 什么情况下会引起重绘呢?
- 比如修改背景色、文字颜色、边框颜色、样式等;
◼ 回流一定会引起重绘,所以回流是一件很消耗性能的 事情。
◼ 所以在开发中要尽量避免发生回流:
◼ 1.修改样式时尽量一次性修改
- 比如通过cssText修改,比如通过添加class修改
◼ 2.尽量避免频繁的操作DOM
- 我们可以在一个DocumentFragment或者父元素中 将要操作的DOM操作完成,再一次性的操作;
◼ 3.尽量避免通过getComputedStyle获取尺寸、位置等信息;
◼ 4.对某些元素使用position的absolute或者fixed
◼ 默认情况下,标准流中的内容都是被绘制在同一个图层(Layer)中的;
◼ 而一些特殊的属性,会创建一个新的合成层( CompositingLayer ),并且新的图层可以利用GPU来加速绘制;
- 因为每个合成层都是单独渲染的;
◼ 那么哪些属性可以形成新的合成层呢?常见的一些属性:
- 3D transforms
- video、canvas、iframe
- opacity 动画转换时;
- position: fixed
- will-change:一个实验性的属性,提前告诉浏览器元素可能发生哪些变化;
- animation 或 transition 设置了opacity、transform;
◼ 分层确实可以提高性能,但是它以内存管理为代价,因此不应作为 web 性能优化策略的一部分过度使用。
script标签的defer和async属性
script元素和页面解析的关系
◼ 我们现在已经知道了页面的渲染过程,但是JavaScript在哪里呢?
- 事实上,浏览器在解析HTML的过程中,遇到了script元素是不能继续构建DOM树的;
- 它会停止继续构建,首先下载JavaScript代码,并且执行JavaScript的脚本;
- 只有等到JavaScript脚本执行结束后,才会继续解析HTML,构建DOM树;
◼ 为什么要这样做呢?
- 这是因为JavaScript的作用之一就是操作DOM,并且可以修改DOM;
- 如果我们等到DOM树构建完成并且渲染再执行JavaScript,会造成严重的回流和重绘,影响页面的性能;
- 所以会在遇到script元素时,优先下载和执行JavaScript代码,再继续构建DOM树;
◼ 但是这个也往往会带来新的问题,特别是现代页面开发中:
- 在目前的开发模式中(比如Vue、React),脚本往往比HTML页面更“重”,处理时间需要更长;
- 所以会造成页面的解析阻塞,在脚本下载、执行完成之前,用户在界面上什么都看不到;
◼ 为了解决这个问题,script元素给我们提供了两个属性(attribute):defer和async。
defer属性
◼ defer 属性告诉浏览器不要等待脚本下载,而继续解析HTML,构建DOM Tree。
- 脚本会由浏览器来进行下载,但是不会阻塞DOM Tree的构建过程;
- 如果脚本提前下载好了,它会等待DOM Tree构建完成,在DOMContentLoaded事件之前先执行defer中的代码;
◼ 所以DOMContentLoaded总是会等待defer中的代码先执行完成。
◼ 另外多个带defer的脚本是可以保持正确的顺序执行的。
◼ 从某种角度来说,defer可以提高页面的性能,并且推荐放到head元素中;
◼ 注意:defer仅适用于外部脚本,对于script默认内容会被忽略。
async属性
◼ async 特性与 defer 有些类似,它也能够让脚本不阻塞页面。
◼ async是让一个脚本完全独立的:
- 浏览器不会因 async 脚本而阻塞(与 defer 类似);
- async脚本不能保证顺序,它是独立下载、独立运行,不会等待其他脚本;
- async不会能保证在DOMContentLoaded之前或者之后执行;
◼ defer通常用于需要在文档解析后操作DOM的JavaScript代码,并且对多个script文件有顺序要求的;
◼ async通常用于独立的脚本,对其他脚本,甚至DOM没有依赖的;
作业与总结
一.说出浏览器输入一个URL到页面显示的过程
- 首先通过DNS服务器进行域名解析
- 解析出对应的IP地址 然后从ip地址对应的主机发送http请求 获取对应的静态资源
- 默认情况服务器会返回index.html文件
- 然后浏览器内核开始解析HTML
- 首先 会解析对应的html 生成DOM Tree
- 解析过程中 如果遇到css的link标签 则会下载对应的css文件
- 下载css文件和生成DOM树是同时进行
- 下载完对应的css文件后会进行css解析 生成CSSOM( CSS object model)
- 当DOM Tree和CSSTree都解析完成之后 会进行合并用来生成Render Tree(渲染树)
- 初步生成的渲染树会显示节点以及部分样式 但是并不表示每个节点的尺寸 位置信息 于是进行Layout(布局)来生成渲染树中节点的宽度 高度位置信息
- 经过Layout之后 浏览器内核将布局时的每个frame转屏幕上的每个像素点 将每个节点绘制到屏幕上
注意: 第一次确定节点的大小位置 称之为布局(Layout) 之后对节点大小位置改变后的重新计算称之为回流
引起回流的情况:
- DOM结构发生改变(节点的增删)
- 修改了节点的布局(宽度 高度 字体大小等)
- 修改窗口的尺寸
- 调用getComputedStyle获取位置信息
第一次绘制节点 渲染到页面上称之为绘制(paint) 之后重新绘制 称之为重绘
引起重绘情况:
- 修改背景色颜色 等
回流一定会引起重绘 所以回流非常消耗性能
如何避免回流
- 尽量一次性的修改样式
- 通过添加classList
- 避免频繁的操作DOM
- 避免通过getComputedStyle获取尺寸位置信息等
- 对于某些元素使用position:absolute/fixed
三. 写出v8引擎执行代码的大致流程(了解)
- Parse模块 将JavaScript代码转成AST Tree
- Ignition :解释器 将ASTTree 转换为字节码(byte Code)
- 同时收集TurboFan 优化需要的信息
- TurboFan :编译器 将字节码编译为CPU可以直接执行的机器码(machine code)
- 如果某一个函数呗被多次调用 则会被标记为热点函数 会经过TurBoFan转换的优化的机器码 让CPU执行 提高代码性能
- 如果后续执行代码过程中 改函数调用时的参数类型发生了改变 则会逆向的转成字节码 让CPU执行
执行流程:
- 首先会编译JavaScript 编译过程分为三步
- 1 词法分析(scanner)
- 会将对应的每一行的代码的字节流分解成有意义的代码块 代码块被称为词法单元(token 进行记号化)
- 2 语法分析(parser)
- 将对应的tokens分析成一个元素逐级嵌套的树 这个树称之为 抽象语法树(Abstract Syntax Tree AST)
- 这里也有对应的 pre-parser
- 3 将AST 通过Ignition解释器转换成对应的字节码(ByteCode) 交给CPU执行 同时收集信息
- 将可优化的信息 通过TurBoFan编译器 编译成更好使用的机器码交给CPU执行
- 如果后续代码的参数类型发生改变 则会逆优化(Deoptimization)为字节码