5_内存管理和闭包 - 《JavaScript高级程序设计》

认识内存管理
- JS 的内存管理
JS 的垃圾回收
- 常见的垃圾回收算法
  - 1. 引用计数
  - 2. 标记清除
让人迷惑的闭包

title: 内存管理和闭包
categories: Javascript
tag:

垃圾回收
闭包
date: 2021-11-12 17:16:34

认识内存管理

不管什么样的编程语言，在代码的执行过程中都是需要给它分配内存的，不同的是某些编程语言需要我们自己手动的管理内存，某些编程语言会可以自动帮助我们管理内存：

不管以什么样的方式来管理内存，内存的管理都会有如下的生命周期：

第一步：分配申请你需要的内存（申请）；
第二步：使用分配的内存（存放一些东西，比如对象等）；
第三步：不需要使用时，对其进行释放；

不同的编程语言对于第一步和第三步会有不同的实现：

手动管理内存：比如 C、C++，包括早期的 OC，都是需要手动来管理内存的申请和释放的（malloc 和 free 函数）；
自动管理内存：比如 Java、JavaScript、Python、Swift、Dart 等，它们有自动帮助我们管理内存；

我们可以知道 JavaScript 通常情况下是不需要手动来管理的。

JS 的内存管理

JavaScript 会在定义变量时为我们分配内存。

但是内存分配方式是一样的吗？

JS 对于基本数据类型内存的分配会在执行时，直接在栈空间进行分配；
JS 对于复杂数据类型内存的分配会在堆内存中开辟一块空间，并且将这块空间的指针返回值变量引用；

5_内存管理和闭包 - 图1

JS 的垃圾回收

因为内存的大小是有限的，所以当内存不再需要的时候，我们需要对其进行释放，以便腾出更多的内存空间。

在手动管理内存的语言中，我们需要通过一些方式自己来释放不再需要的内存，比如 free 函数：

但是这种管理的方式其实非常的低效，影响我们编写逻辑的代码的效率；
并且这种方式对开发者的要求也很高，并且一不小心就会产生内存泄露；

所以大部分现代的编程语言都是有自己的垃圾回收机制：

垃圾回收的英文是 Garbage Collection，简称 GC；
对于那些不再使用的对象，我们都称之为是垃圾，它需要被回收，以释放更多的内存空间；
而我们的语言运行环境，比如 Java 的运行环境 JVM，JavaScript 的运行环境 js 引擎都会内存 垃圾回收器；
垃圾回收器我们也会简称为 GC，所以在很多地方你看到 GC 其实指的是垃圾回收器；

但是这里又出现了另外一个很关键的问题：GC 怎么知道哪些对象是不再使用的呢？

这里就要用到 GC 的算法了

常见的垃圾回收算法

1. 引用计数

引用计数：

p 当一个对象有一个引用指向它时，那么这个对象的引用就+1，当一个对象的引用为 0 时，这个对象就可以被销毁掉；

这个算法有一个很大的弊端就是会产生循环引用；

5_内存管理和闭包 - 图2

2. 标记清除

n 标记清除：

这个算法是设置一个根对象（root object），垃圾回收器会定期从这个根开始，找所有从根开始有引用到的对象，对于哪些没有引用到的对象，就认为是不可用的对象；
这个算法可以很好的解决循环引用的问题；

5_内存管理和闭包 - 图3

JS 引擎比较广泛的采用的就是标记清除算法，当然类似于 V8 引擎为了进行更好的优化，它在算法的实现细节上也会结合一些其他的算法

让人迷惑的闭包

首先，我们应该知道，函数是一等公民。意味着函数的使用非常灵活。函数可以作为另外一个函数的惨呼，也可以作为另外一个函数的返回值来使用。

比如，自己编写高阶函数，使用内置的高阶函数。

一般情况下，我们把以函数为参数或者函数为返回值就称为高阶函数

作为参数

function foo(aaa) {
  aaa()
}
function bar() {
  console.log(bar)
}
foo(bar) //以函数为参数

函数作为返回值

function foo() {
  function bar() {
    console.log('bar')
  }
  return bar
}
var fn = foo()
fn() //相当于bar()

柯里化

function makeAdder(count) {
  function add(num) {
    return count + num
  }
  return add
}
var add5 = makeAdder(5)
console.log(add5(3)) //8

数组中函数的使用

函数和方法的区别

当函数是独立的，独立的 function，那么称之为一个函数
当我们的函数属于某一个对象的时候，我们称这个函数是这个对象的方法

1. filter 函数(有返回值，返回为 true 的项)

var nums = [1, 2, 3, 4, 5, 6]
const res = nums.filter((item, index, arr) => {
  return item % 2 == 0
})
console.log(res)

2. map 函数(有返回值)

var res2 = nums.map((item) => {
  return item * 10
})
console.log(res2) // [10, 20, 30, 40, 50, 60]

3. forEach(没有返回值)

nums.forEach((item) => {
  console.log(item * 10) //处理一下
})

4. find(有返回值)，findIndex

var friends = [
  { name: 'why', age: 18 },
  { name: 'dh', age: 22 },
  { name: 'gk', age: 22 }
]
const findFriend = friends.find((item) => {
  return (item.name = 'why')
})
console.log(findFriend) //{name: 'why', age: 18}
const findFriendIndex = friends.findIndex((item) => {
  return (item.name = 'why')
})
console.log(findFriendIndex) //0

5. reduce

const sum = nums.reduce((preValue, currentValue) => {
  return preValue + currentValue
}, 10)
console.log(sum) //10+1+2+3+4+5+6=31

闭包的定义

这里先来看一下闭包的定义，分成两个：在计算机科学中和在 JavaScript 中。

在计算机科学中对闭包的定义（维基百科）：
1. 闭包（英语：Closure），又称词法闭包（Lexical Closure）或函数闭包（function closures）；
2. 是在支持 头等函数 的编程语言中，实现词法绑定的一种技术；
3. 闭包在实现上是一个结构体，它存储了一个函数和一个关联的环境（相当于一个符号查找表）；
4. 闭包跟函数最大的区别在于，当捕捉闭包的时候，它的自由变量会在捕捉时被确定，这样即使脱离了捕捉时的上下文，它也能照常运行；
闭包的概念出现于 60 年代，最早实现闭包的程序是 Scheme，那么我们就可以理解为什么 JavaScript 中有闭包：
1. 因为 JavaScript 中有大量的设计是来源于 Scheme 的；
我们再来看一下 MDN 对 JavaScript 闭包的解释：
1. 一个函数和对其周围状态（lexical environment，词法环境）的引用捆绑在一起（或者说函数被引用包围），这样的组合就是闭包（closure）；
2. 也就是说，闭包让你可以在一个内层函数中访问到其外层函数的作用域；
3. 在 JavaScript 中，每当创建一个函数，闭包就会在函数创建的同时被创建出来；

理解和总结：

一个普通的函数 function，如果它可以访问外层作用域的自由变量，那么这个函数就是一个闭包；
从广义的角度来说：JavaScript 中的函数都是闭包；
从狭义的角度来说：JavaScript 中一个函数，如果访问了外层作用于的变量，那么它是一个闭包；（必须访问了）
在红宝书中，闭包指的是那些引用了另一个函数作用域中变量的函数，通常是在嵌套函数中实现的。

闭包的访问过程

5_内存管理和闭包 - 图4

闭包的执行过程

那么函数继续执行呢？

这个时候 makeAdder 函数执行完毕，正常情况下我们的 AO 对象会被释放；
但是因为在 0xb00 的函数中有作用域引用指向了这个 AO 对象，所以它不会被释放掉；

5_内存管理和闭包 - 图5

闭包的内存泄露

关于内存泄露详细信息可以见链接

那么我们为什么经常会说闭包是有内存泄露的呢？

在上面的案例中，如果后续我们不再使用 add10 函数了，那么该函数对象应该要被销毁掉，并且其引用着的父作用域 AO 也应该被销毁掉；
但是目前因为在全局作用域下 add10 变量对 0xb00 的函数对象有引用，而 0xb00 的作用域中 AO（0x200）有引用，所以最终会造成这些内存都是无法被释放的；
所以我们经常说的闭包会造成内存泄露，其实就是刚才的引用链中的所有对象都是无法释放的；

那么，怎么解决这个问题呢？

因为当将 add10 设置为 null 时，就不再对函数对象 0xb00 有引用，那么对应的 AO 对象 0x200 也就不可达了；
在 GC 的下一次检测中，它们就会被销毁掉；

5_内存管理和闭包 - 图6

闭包内存泄露测试

5_内存管理和闭包 - 图7

AO 不使用的属性

我们来研究一个问题：AO 对象不会被销毁时，是否里面的所有属性都不会被释放？

下面这段代码中 name 属于闭包的父作用域里面的变量；
我们知道形成闭包之后 count 一定不会被销毁掉，那么 name 是否会被销毁掉呢？
这里我打上了断点，我们可以在浏览器上看看结果；

从 JS 引擎优化的角度。是会释放 name 的

5_内存管理和闭包 - 图8