这篇文章是针对浏览器的 JavaScript 脚本,Node.js 大同小异,这里不涉及到 Node.js 的场景。当然 Node.js 作为服务端语言,必然更关注内存泄漏的问题。
用户一般不会在一个 Web 页面停留比较久,即使有一点内存泄漏,重载页面内存也会跟着释放。而且浏览器也有自动回收内存的机制,所以我们前端其实并没有像 C、C++ 这类语言一样,特别关注内存泄漏的问题。
但是如果我们对内存泄漏没有什么概念,有时候还是有可能因为内存泄漏,导致页面卡顿。了解内存泄漏,如何避免内存泄漏,也是我们提升前端技能的必经之路。
俗话说好记忆不如烂笔头,所以本人就总结了一些内存泄漏相关的知识,避免一些低级的内存泄漏问题。

什么是内存?

在硬件级别上,计算机内存由大量触发器组成。每个触发器包含几个晶体管,能够存储一个位。单个触发器可以通过唯一标识符寻址,因此我们可以读取和覆盖它们。因此,从概念上讲,我们可以把我们的整个计算机内存看作是一个巨大的位数组,我们可以读和写。
这么底层的概念,了解下就好,绝大多数数情况下,JavaScript 语言作为你们高级语言,无需我们使用二进制进直接进行读和写。

内存生命周期

内存也是有生命周期的,不管什么程序语言,一般可以按顺序分为三个周期:

  • 分配期分配所需要的内存
  • 使用期使用分配到的内存(读、写)
  • 释放期不需要时将其释放和归还

内存分配 -> 内存使用 -> 内存释放。

什么是内存泄漏?

计算机科学中,内存泄漏指由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失,而是应用程序分配某段内存后,由于设计错误,导致在释放该段内存之前就失去了对该段内存的控制,从而造成了内存的浪费。
如果内存不需要时,没有经过生命周期的释放期,那么就存在内存泄漏
内存泄漏简单理解:无用的内存还在占用,得不到释放和归还。比较严重时,无用的内存会持续递增,从而导致整个系统卡顿,甚至崩溃。

JavaScript 内存管理机制

像 C 语言这样的底层语言一般都有底层的内存管理接口,比如malloc()和free()。相反,JavaScript是在创建变量(对象,字符串等)时自动进行了分配内存,并且在不使用它们时“自动”释放。 释放的过程称为垃圾回收。这个“自动”是混乱的根源,并让JavaScript(和其他高级语言)开发者错误的感觉他们可以不关心内存管理。
JavaScript 内存管理机制和内存的生命周期是一一对应的。首先需要分配内存,然后使用内存,最后释放内存
其中 JavaScript 语言不需要程序员手动分配内存,绝大部分情况下也不需要手动释放内存,对 JavaScript 程序员来说通常就是使用内存(即使用变量、函数、对象等)。

内存分配

JavaScript 定义变量就会自动分配内存的。我们只需了解 JavaScript 的内存是自动分配的就足够了
看下内存自动分配的例子:

  1. // 给数值变量分配内存
  2. let number = 123;
  3. // 给字符串分配内存
  4. const string = "xianshannan";
  5. // 给对象及其包含的值分配内存
  6. const object = {
  7. a: 1,
  8. b: null
  9. };
  10. // 给数组及其包含的值分配内存(就像对象一样)
  11. const array = [1, null, "abra"];
  12. // 给函数(可调用的对象)分配内存
  13. function func(a){
  14. return a;
  15. }

内存使用

使用值的过程实际上是对分配内存进行读取与写入的操作。读取与写入可能是写入一个变量或者一个对象的属性值,甚至传递函数的参数。
根据上面的内存自动分配例子,我们继续内存使用的例子:

  1. // 写入内存
  2. number = 234;
  3. // 读取 number 和 func 的内存,写入 func 参数内存
  4. func(number);

内存回收

前端界一般称垃圾内存回收为GC(Garbage Collection,即垃圾回收)。
内存泄漏一般都是发生在这一步,JavaScript 的内存回收机制虽然能回收绝大部分的垃圾内存,但是还是存在回收不了的情况,如果存在这些情况,需要我们手动清理内存。
以前一些老版本的浏览器的 JavaScript 回收机制没那么完善,经常出现一些 bug 的内存泄漏,不过现在的浏览器基本都没这些问题了,已过时的知识这里就不做深究了。
这里了解下现在的 JavaScript 的垃圾内存的两种回收方式,熟悉下这两种算法可以帮助我们理解一些内存泄漏的场景。

引用计数垃圾收集

这是最初级的垃圾收集算法。此算法把“对象是否不再需要”简化定义为“对象有没有其他对象引用到它”。如果没有引用指向该对象(零引用),对象将被垃圾回收机制回收。
看下下面的例子,“这个对象”的内存被回收了吗?

  1. // “这个对象”分配给 a 变量
  2. var a = {
  3. a: 1,
  4. b: 2,
  5. }
  6. // b 引用“这个对象”
  7. var b = a;
  8. // 现在,“这个对象”的原始引用 a 被 b 替换了
  9. a = 1;

当前执行环境中,“这个对象”内存还没有被回收的,需要手动释放“这个对象”的内存(当然是还没离开执行环境的情况下),例如:

  1. b = null;
  2. // 或者 b = 1,反正替换“这个对象”就行了

这样引用的”这个对象”的内存就被回收了。
ES6 把引用有区分为强引用弱引用,这个目前只有再 Set 和 Map 中才有。
强引用才会有引用计数叠加,只有引用计数为 0 的对象的内存才会被回收,所以一般需要手动回收内存(手动回收的前提在于标记清除法还没执行,还处于当前执行环境)。
弱引用没有触发引用计数叠加,只要引用计数为 0,弱引用就会自动消失,无需手动回收内存。

标记清除法

当变量进入执行环境时标记为“进入环境”,当变量离开执行环境时则标记为“离开环境”,被标记为“进入环境”的变量是不能被回收的,因为它们正在被使用,而标记为“离开环境”的变量则可以被回收
环境可以理解为我们的作用域,但是全局作用域的变量只会在页面关闭才会销毁。

  1. // 假设这里是全局变量
  2. // b 被标记进入环境
  3. var b = 2;
  4. function test() {
  5. var a = 1;
  6. // 函数执行时,a 被标记进入环境
  7. return a + b;
  8. }
  9. // 函数执行结束,a 被标记离开环境,被回收
  10. // 但是 b 就没有被标记离开环境
  11. test();

JavaScript 内存泄漏的一些场景

JavaScript 的内存回收机制虽然能回收绝大部分的垃圾内存,但是还是存在回收不了的情况。程序员要让浏览器内存泄漏,浏览器也是管不了的。
下面有些例子是在执行环境中,没离开当前执行环境,还没触发标记清除法。所以你需要读懂上面 JavaScript 的内存回收机制,才能更好理解下面的场景。

意外的全局变量

  1. // 在全局作用域下定义
  2. function count(number) {
  3. // basicCount 相当于 window.basicCount = 2;
  4. basicCount = 2;
  5. return basicCount + number;
  6. }

不过在 eslint 帮助下,这种场景现在基本没人会犯了,eslint 会直接报错,了解下就好。

被遗忘的计时器

无用的计时器忘记清理是新手最容易犯的错误之一。
就拿一个 vue 组件来做例子。

  1. <template>
  2. <div></div>
  3. </template>
  4. <script>
  5. export default {
  6. methods: {
  7. refresh() {
  8. // 获取一些数据
  9. },
  10. },
  11. mounted() {
  12. setInterval(function() {
  13. // 轮询获取数据
  14. this.refresh()
  15. }, 2000)
  16. },
  17. }
  18. </script>

上面的组件销毁的时候,setInterval还是在运行的,里面涉及到的内存都是没法回收的(浏览器会认为这是必须的内存,不是垃圾内存),需要在组件销毁的时候清除计时器,如下:

  1. <template>
  2. <div></div>
  3. </template>
  4. <script>
  5. export default {
  6. methods: {
  7. refresh() {
  8. // 获取一些数据
  9. },
  10. },
  11. mounted() {
  12. this.refreshInterval = setInterval(function() {
  13. // 轮询获取数据
  14. this.refresh()
  15. }, 2000)
  16. },
  17. beforeDestroy() {
  18. clearInterval(this.refreshInterval)
  19. },
  20. }
  21. </script>

被遗忘的事件监听器

无用的事件监听器忘记清理是新手最容易犯的错误之一。
还是继续使用 vue 组件做例子。

  1. <template>
  2. <div></div>
  3. </template>
  4. <script>
  5. export default {
  6. mounted() {
  7. window.addEventListener('resize', () => {
  8. // 这里做一些操作
  9. })
  10. },
  11. }
  12. </script>

上面的组件销毁的时候,resize 事件还是在监听中,里面涉及到的内存都是没法回收的(浏览器会认为这是必须的内存,不是垃圾内存),需要在组件销毁的时候移除相关的事件,如下:

  1. <template>
  2. <div></div>
  3. </template>
  4. <script>
  5. export default {
  6. mounted() {
  7. this.resizeEventCallback = () => {
  8. // 这里做一些操作
  9. }
  10. window.addEventListener('resize', this.resizeEventCallback)
  11. },
  12. beforeDestroy() {
  13. window.removeEventListener('resize', this.resizeEventCallback)
  14. },
  15. }
  16. </script>

被遗忘的 ES6 Set 成员

如果对 Set 不熟悉,可以看这里
如下是有内存泄漏的(成员是引用类型的,即对象):

  1. let map = new Set();
  2. let value = { test: 22};
  3. map.add(value);
  4. value= null;

需要改成这样,才没内存泄漏:

  1. let map = new Set();
  2. let value = { test: 22};
  3. map.add(value);
  4. map.delete(value);
  5. value = null;

有个更便捷的方式,使用 WeakSet,WeakSet 的成员是弱引用,内存回收不会考虑到这个引用是否存在。

  1. let map = new WeakSet();
  2. let value = { test: 22};
  3. map.add(value);
  4. value = null;

被遗忘的 ES6 Map 键名

如果对 Map 不熟悉,可以看这里
如下是有内存泄漏的(键值是引用类型的,即对象):

  1. let map = new Map();
  2. let key = new Array(5 * 1024 * 1024);
  3. map.set(key, 1);
  4. key = null;

需要改成这样,才没内存泄漏:

  1. let map = new Map();
  2. let key = new Array(5 * 1024 * 1024);
  3. map.set(key, 1);
  4. map.delete(key);
  5. key = null;

有个更便捷的方式,使用 WeakMap,WeakMap 的键名是弱引用,内存回收不会考虑到这个引用是否存在。

  1. let map = new WeakMap();
  2. let key = new Array(5 * 1024 * 1024);
  3. map.set(key, 1);
  4. key = null;

被遗忘的订阅发布事件监听器

这个跟上面的被遗忘的事件监听器的道理是一样的。
假设订阅发布事件有三个方法emit、on、off三个方法。
还是继续使用 vue 组件做例子。

  1. <template>
  2. <div @click="onClick"></div>
  3. </template>
  4. <script>
  5. import customEvent from 'event'
  6. export default {
  7. methods: {
  8. onClick() {
  9. customEvent.emit('test', { type: 'click' })
  10. },
  11. },
  12. mounted() {
  13. customEvent.on('test', data => {
  14. // 一些逻辑
  15. console.log(data)
  16. })
  17. },
  18. }
  19. </script>

上面的组件销毁的时候,自定义 test 事件还是在监听中,里面涉及到的内存都是没法回收的(浏览器会认为这是必须的内存,不是垃圾内存),需要在组件销毁的时候移除相关的事件,如下:

  1. <template>
  2. <div @click="onClick"></div>
  3. </template>
  4. <script>
  5. import customEvent from 'event'
  6. export default {
  7. methods: {
  8. onClick() {
  9. customEvent.emit('test', { type: 'click' })
  10. },
  11. },
  12. mounted() {
  13. customEvent.on('test', data => {
  14. // 一些逻辑
  15. console.log(data)
  16. })
  17. },
  18. beforeDestroy() {
  19. customEvent.off('test')
  20. },
  21. }
  22. </script>

被遗忘的闭包

闭包是经常使用的,闭包能给我们带来很多便利。
首先看下这个代码:

  1. function closure() {
  2. const name = 'xianshannan'
  3. return () => {
  4. return name
  5. .split('')
  6. .reverse()
  7. .join('')
  8. }
  9. }
  10. const reverseName = closure()
  11. // 这里调用了 reverseName
  12. reverseName();

上面有没有内存泄漏?
上面是没有内存泄漏的,因为name变量是要用到的(非垃圾)。这也是从侧面反映了闭包的缺点,内存占用相对高,量多了会有性能影响。
但是改成这样就是有内存泄漏的:

  1. function closure() {
  2. const name = 'xianshannan'
  3. return () => {
  4. return name
  5. .split('')
  6. .reverse()
  7. .join('')
  8. }
  9. }
  10. const reverseName = closure()

在当前执行环境未结束的情况下,严格来说,这样是有内存泄漏的,name变量是被closure返回的函数调用了,但是返回的函数没被使用,这个场景下name就属于垃圾内存。name不是必须的,但是还是占用了内存,也不可被回收。
当然这种也是极端情况,很少人会犯这种低级错误。这个例子可以让我们更清楚的认识内存泄漏。

脱离 DOM 的引用

每个页面上的 DOM 都是占用内存的,假设有一个页面 A 元素,我们获取到了 A 元素 DOM 对象,然后赋值到了一个变量(内存指向是一样的),然后移除了页面的 A 元素,如果这个变量由于其他原因没有被回收,那么就存在内存泄漏,如下面的例子:

  1. class Test {
  2. constructor() {
  3. this.elements = {
  4. button: document.querySelector('#button'),
  5. div: document.querySelector('#div'),
  6. span: document.querySelector('#span'),
  7. }
  8. }
  9. removeButton() {
  10. document.body.removeChild(this.elements.button)
  11. // this.elements.button = null
  12. }
  13. }
  14. const a = new Test()
  15. a.removeButton()

上面的例子 button 元素 虽然在页面上移除了,但是内存指向换为了this.elements.button,内存占用还是存在的。所以上面的代码还需要这样写:this.elements.button = null,手动释放这个内存。

如何发现内存泄漏?

内存泄漏时,内存一般都是会周期性的增长,我们可以借助谷歌浏览器的开发者工具进行判别。
这里不进行详细的开发者工具使用说明,详细看谷歌开发者工具,不过谷歌浏览器是不断迭代更新的,有些文档落后了,界面长得不一样。
本人测试的谷歌版本为:版本 76.0.3809.100(正式版本) (64 位)
这里针对下面例子进行一步一步的排查和找到问题出现在哪里:

  1. <!DOCTYPE html>
  2. <html>
  3. <head>
  4. <meta charset="utf-8" />
  5. </head>
  6. <body>
  7. <div id="app">
  8. <button id="run">运行</button>
  9. <button id="stop">停止</button>
  10. </div>
  11. <script>
  12. const arr = []
  13. for (let i = 0; i < 200000; i++) {
  14. arr.push(i)
  15. }
  16. let newArr = []
  17. function run() {
  18. newArr = newArr.concat(arr)
  19. }
  20. let clearRun
  21. document.querySelector('#run').onclick = function() {
  22. clearRun = setInterval(() => {
  23. run()
  24. }, 1000)
  25. }
  26. document.querySelector('#stop').onclick = function() {
  27. clearInterval(clearRun)
  28. }
  29. </script>
  30. </body>
  31. </html>

上面例子的代码可以直接运行的,怎么运行我就不多说了。

第一步:确定是否是内存泄漏问题

访问上面的代码页面,打开谷歌开发者工具,切换至Performance选项,勾选Memory选项。
在页面上点击运行按钮,然后在开发者工具上面点击左上角的录制按钮,10 秒后在页面上点击停止按钮,5 秒后停止内存录制。得到的内存走势如下:
image.png
由上图可知,10 秒之前内存周期性增长,10 后点击了停止按钮,内存平稳,不再递增。
我们可以使用内存走势图判断当前页面是否有内存泄漏。经过测试上面的代码20000个数组项改为20个数组项,内存走势也一样能看出来。

第二步:查找内存泄漏出现的位置

上一步确认是内存泄漏问题后,我们继续利用谷歌开发者工具进行问题查找。
访问上面的代码页面,打开谷歌开发者工具,切换至Memory选项。页面上点击运行按钮,然后点击开发者工具左上角录制按钮,录制完成后继续点击录制,知道录制完三个为止。然后点击页面的停止按钮,再连续录制 3 次内存(不要清理之前的录制)。下图就是进行这些步骤后的截图:
image.png
从这里也可以看出,点击运行按钮后,内存在不断递增。点击停止按钮后,内存就平稳了。虽然我们也可以使用这样的方式来判别是否存在内存泄漏,但是不够第一步的方法便捷,走势图也更直观。
然后第二步的主要目的来了,记录 JavaScript 堆内存才是内存录制的主要目的,我们可以看到哪个堆占用的内存更高。
在刚才的录制中选择 Snapshot 3 ,然后按照Shallow Size进行逆序排序(不了解的可以看内存术语),如下:
image.png
从内存记录中,发现 array 对象占用最大,展开后发现,第一个object elements占用最大,选择这个object elements后可以在下面看到newArr变量,然后点击test:23,只要是高亮下划线的地方都可以进去看看 (测试页面是 test.html),可以跳转到newArr附近。

参考资料