数据在内存中的存放

  1. function foo(){
  2. var a = 1
  3. var b = a
  4. a = 2
  5. console.log(a) // 2
  6. console.log(b) // 1
  7. }
  8. foo()
  1. function foo(){
  2. var a = {name:"极客时间"}
  3. var b = a
  4. a.name = "极客邦"
  5. console.log(a) // {name:"极客邦"}
  6. console.log(b) // {name:"极客邦"}
  7. }
  8. foo()

JavaScript 是什么类型的语言

每种编程语言都具有内建的数据类型,但它们的数据类型常有不同之处,使用方式也很不一样,比如 C 语言在定义变量之前,就需要确定变量的类型。在声明变量之前需要先定义变量类型。这种在使用之前就需要确认其变量数据类型的称为静态语言相反地,运行过程中需要检查数据类型的语言称为动态语言。JavaScript 就是动态语言,因为在声明变量之前并不需要确认其数据类型。
C 语言是静态,但是在 C 语言中,我们可以把其他类型数据赋予给一个声明好的变量。这种偷偷转换的操作称为隐式类型转换。而支持隐式类型转换的语言称为弱类型语言,不支持隐式类型转换的语言称为强类型语言。在这点上,C 和 JavaScript 都是弱类型语言。
JavaScript 的内存机制 - 图1

JavaScript 的数据类型

JavaScript 是一种弱类型的、动态的语言。那这些特点意味着什么呢?

  • 弱类型,意味着你不需要告诉 JavaScript 引擎这个或那个变量是什么数据类型,JavaScript 引擎在运行代码的时候自己会计算出来。
  • 动态,意味着你可以使用同一个变量保存不同类型的数据。
    1. var bar
    2. bar = 12
    3. bar = "掌门一对一"
    4. bar = true
    5. bar = null
    6. bar = {name:"掌门教育}
    JavaScript 中的数据类型一种有 8 种,7 种原始类型,一个引用类型:
    JavaScript 的内存机制 - 图2
    问题1:这些数据类型是如何存储的?

    内存空间

    要理解 JavaScript 在运行过程中数据是如何存储的,你就得先搞清楚其存储空间的种类,在 JavaScript 的执行过程中, 主要有三种类型内存空间,分别是代码空间(存储可执行代码)、栈空间和堆空间。
    JavaScript 的内存机制 - 图3
    栈空间就是调用栈,是用来存储执行上下文的。为了搞清楚栈空间是如何存储数据的,我们还是先看下面这段代码:
    1. function foo(){
    2. var a = "极客时间"
    3. var b = a
    4. var c = {name:"极客时间"}
    5. var d = c
    6. }
    7. foo()
    当执行一段代码时,需要先编译,并创建执行上下文,然后再按照顺序执行代码。那么下面我们来看看,当执行到第 3 行代码时,其调用栈的状态,你可以参考下面这张调用栈状态图:
    JavaScript 的内存机制 - 图4
    执行到第 3 行时,变量 a 和变量 b 的值都被保存在执行上下文中,而执行上下文又被压入到栈中,所以你也可以认为变量 a 和变量 b 的值都是存放在栈中的。
    继续执行第 4 行代码,由于 JavaScript 引擎判断右边的值是一个引用类型,这时候处理的情况就不一样了,JavaScript 引擎并不是直接将该对象存放到变量环境中,而是将它分配到堆空间里面,分配后该对象会有一个在“堆”中的地址,然后再将该数据的地址写进 c 的变量值,最终分配好内存的示意图如下所示:
    JavaScript 的内存机制 - 图5
    现在应该知道了原始类型的数据值都是直接保存在“栈”中的,引用类型的值是存放在“堆”中的。不过为什么一定要分“堆”和“栈”两个存储空间呢?所有数据直接存放在“栈”中不就可以了吗?
    答案是不可以。这是因为 JavaScript 引擎需要用栈来维护程序执行期间上下文的状态,如果栈空间大了话,所有的数据都存放在栈空间里面,那么会影响到上下文切换的效率,进而又影响到整个程序的执行效率。比如foo 函数执行结束了,JavaScript 引擎需要离开当前的执行上下文,只需要将指针下移到上个执行上下文的地址就可以了,foo 函数执行上下文栈区空间全部回收,具体过程你可以参考下图:
    JavaScript 的内存机制 - 图6
    所以通常情况下,栈空间都不会设置太大,主要用来存放一些原始类型的小数据。而引用类型的数据占用的空间都比较大,所以这一类数据会被存放到堆中,堆空间很大,能存放很多大的数据,不过缺点是分配内存和回收内存都会占用一定的时间。
    最后一步将变量 c 赋值给变量 d 是怎么执行的?在 JavaScript 中,赋值操作和其他语言有很大的不同,原始类型的赋值会完整复制变量值,而引用类型的赋值是复制引用地址。变量c和变量d都指向同一个堆中的对象。
    JavaScript 的内存机制 - 图7

    闭包

    作用域内的原始类型数据会被存储到栈空间,引用类型会被存储到堆空间,基于这两点的认知,我们再深入一步,探讨下闭包的内存模型
    1. function foo() {
    2. var myName = "极客时间"
    3. let test1 = 1
    4. const test2 = 2
    5. var innerBar = {
    6. setName:function(newName){
    7. myName = newName
    8. },
    9. getName:function(){
    10. console.log(test1)
    11. return myName
    12. }
    13. }
    14. return innerBar
    15. }
    16. var bar = foo()
    17. bar.setName("极客邦")
    18. bar.getName()
    19. console.log(bar.getName())
    当执行这段代码的时候,由于变量 myName、test1、test2 都是原始类型数据,所以在执行 foo 函数的时候,它们会被压入到调用栈中;当 foo 函数执行结束之后,调用栈中 foo 函数的执行上下文会被销毁,其内部变量 myName、test1、test2 也应该一同被销毁。
    但是当 foo 函数的执行上下文销毁时,由于 foo 函数产生了闭包,所以变量 myName 和 test1 并没有被销毁,而是保存在内存中,那么应该如何解释这个现象呢?
  1. 当 JavaScript 引擎执行到 foo 函数时,首先会编译,并创建一个空执行上下文。
  2. 在编译过程中,遇到内部函数 setName,JavaScript 引擎还要对内部函数做一次快速的词法扫描,发现该内部函数引用了 foo 函数中的 myName 变量,由于是内部函数引用了外部函数的变量,所以 JavaScript 引擎判断这是一个闭包,于是在堆空间创建换一个“closure(foo)”的对象(这是一个内部对象,JavaScript 是无法访问的),用来保存 myName 变量。
  3. 接着继续扫描到 getName 方法时,发现该函数内部还引用变量 test1,于是 JavaScript 引擎又将 test1 添加到“closure(foo)”对象中。这时候堆中的“closure(foo)”对象中就包含了 myName 和 test1 两个变量了。
  4. 由于 test2 并没有被内部函数引用,所以 test2 依然保存在调用栈中。

通过上面的分析,我们可以画出执行到 foo 函数中“return innerBar”语句时的调用栈状态,如下图所示:
JavaScript 的内存机制 - 图8
从上图你可以清晰地看出,当执行到 foo 函数时,闭包就产生了;当 foo 函数执行结束之后,返回的 getName 和 setName 方法都引用“clourse(foo)”对象,所以即使 foo 函数退出了,“clourse(foo)”依然被其内部的 getName 和 setName 方法引用。所以在下次调用bar.setName或者bar.getName时,创建的执行上下文中就包含了“clourse(foo)”。
总的来说,产生闭包的核心有两步:第一步是需要预扫描内部函数;第二步是把内部函数引用的外部变量保存到堆中。

JavaScript 处理垃圾回收

V8 执行代码