JVM - 🎤 JVM 运行时内存结构 - 《知识体系图谱》

java 文件被 JVM 加载到内存的过程
模型
堆
方法区
虚拟机栈
本地方法栈
程序计数器（Program Counter Register）

本文摘自：Android 工程师进阶 34 讲：第01讲：程序运行时，内存到底是如何进行分配的？

java 文件被 JVM 加载到内存的过程

🎤 JVM 运行时内存结构 - 图1

HelloWorld.java 文件首先需要经过编译器编译，生成 HelloWorld.class 字节码文件。
Java 程序中访问 HelloWorld 这个类时，需要通过 ClassLoader (类加载器)将 HelloWorld.class 加载到 JVM 的内存中。
JVM 中的内存可以划分为若干个不同的数据区域，主要分为：程序计数器、虚拟机栈、本地方法栈、堆、方法区。

模型

🎤 JVM 运行时内存结构 - 图2

其中线程共享的数据区为 方法区 和堆；线程私有的数据区为 虚拟机栈，本地方法栈 和 程序计数器。
**

堆

Java 堆（Heap）是 JVM 所管理的内存中 最大的一块，该区域唯一目的就是 存放对象实例，几乎所有对象的实例都在堆里面分配，因此它也是 Java 垃圾收集器（GC）管理的主要区域，有时候也叫作「GC 堆」。同时它也是所有线程共享的内存区域，因此被分配在此区域的对象如果被多个线程访问的话，需要考虑线程安全问题。

按照对象存储时间的不同，堆中的内存可以划分为 新生代（Young）和 老年代（Old），其中新生代又被划分为 Eden 和 Survivor 区。具体如下图所示：

🎤 JVM 运行时内存结构 - 图3

图中不同的区域存放具有不同生命周期的对象。这样可以根据 不同的区域使用不同的垃圾回收算法，从而更具有针对性，进而提高垃圾回收效率。

方法区

方法区（Method Area）也是 JVM 规范里规定的一块运行时数据区。方法区主要是存储已经被 JVM 加载的类信息（版本、字段、方法、接口）、常量、静态变量、即时编译器编译后的代码和数据。该区域同堆一样，也是被各个线程共享的内存区域。
方法区是规范层面的东西，规定了这一个区域要存放哪些数据。
永久区 或 元空间（metaspace）是对方法区的不同实现，是实现层面的东西。

虚拟机栈

虚拟机栈也是线程私有的，与线程的生命周期同步。在 Java 虚拟机规范中，对这个区域规定了两种异常状况：

StackOverflowError：当线程请求栈深度超出虚拟机栈所允许的深度时抛出。
OutOfMemoryError：当 Java 虚拟机动态扩展到无法申请足够内存时抛出。

虚拟机栈的初衷是用来描述 Java 方法执行的内存模型，每个方法被执行的时候，JVM 都会在虚拟机栈中创建一个栈帧。

栈帧

栈帧（Stack Frame）是用于支持虚拟机进行方法调用和方法执行的数据结构，每一个线程在执行某个方法时，都会为这个方法创建一个栈帧。

我们可以这样理解：一个线程包含多个栈帧，而每个栈帧内部包含 局部变量表、操作数栈、动态连接、返回地址等。如下图所示：

🎤 JVM 运行时内存结构 - 图4

局部变量表

局部变量表是变量值的存储空间，我们调用方法时传递的参数，以及在方法内部创建的局部变量都保存在 局部变量表 中。在 Java 编译成 class 文件的时候，就会在方法的 Code 属性表中的 max_locals 数据项中，确定该方法需要分配的最大局部变量表的容量。如下代码所示：

public static int add(int k) {
    int i = 1;
    int j = 2;
    return i + j + k;
}

使用 javap -v 反编译之后，得到如下字节码指令：

public static int add(int);
  descriptor: (I)I
  flags: ACC_PUBLIC, ACC_STATIC
  Code:
    stack=2, locals=3, args_size=1
      0: iconst_1
      1: istore_1
      2: iconst_2
      3: istore_2
      4: iload_1
      5: iload_2
      6: iadd
      7: iload_0
      8: iadd
      9: ireturn

上面的 locals=3 就是代表局部变量表长度是 3，也就是说经过编译之后，局部变量表的长度已经确定为3，分别保存：参数 k 和局部变量 i、j。

注意：系统不会为局部变量赋予初始值（实例变量和类变量都会被赋予初始值），也就是说不存在类变量那样的准备阶段。

操作数栈

操作数栈（Operand Stack）也常称为操作栈，它是一个后入先出栈（LIFO）。

同局部变量表一样，操作数栈的最大深度也在编译的时候写入方法的 Code 属性表中的 max_stacks 数据项中。栈中的元素可以是任意 Java 数据类型，包括 long 和 double。

当一个方法刚刚开始执行的时候，这个方法的操作数栈是空的。在方法执行的过程中，会有各种字节码指令被压入和弹出操作数栈（比如：iadd 指令就是将操作数栈中栈顶的两个元素弹出，执行加法运算，并将结果重新压回到操作数栈中）。

动态链接

动态链接的主要目的是为了支持方法调用过程中的动态连接（Dynamic Linking）。

在一个 class 文件中，一个方法要调用其他方法，需要将这些方法的符号引用转化为其所在内存地址中的直接引用，而符号引用存在于 方法区 中。

Java 虚拟机栈中，每个栈帧都包含一个指向运行时常量池中该栈所属方法的符号引用，持有这个引用的目的就是为了支持方法调用过程中的动态连接（Dynamic Linking）。

返回地址

当一个方法开始执行后，只有两种方式可以退出这个方法：

正常退出：指方法中的代码正常完成，或者遇到任意一个方法返回的字节码指令（如 return）并退出，没有抛出任何异常。
异常退出：指方法执行过程中遇到异常，并且这个异常在方法体内部没有得到处理，导致方法退出。

无论当前方法采用何种方式退出，在方法退出后都需要返回到方法被调用的位置，程序才能继续执行。而虚拟机栈中的「返回地址」就是用来帮助当前方法恢复它的上层方法执行状态。

一般来说，方法正常退出时，调用者的 PC 计数值可以作为返回地址，栈帧中可能保存此计数值。而方法异常退出时，返回地址是通过异常处理器表确定的，栈帧中一般不会保存此部分信息。

本地方法栈

本地方法栈和上面介绍的虚拟栈基本相同，只不过是针对本地（native）方法。在开发中如果涉及 JNI 可能接触本地方法栈多一些，在有些虚拟机的实现中已经将两个合二为一了（比如 HotSpot）。

程序计数器（Program Counter Register）

Java 程序是多线程的，CPU 可以在多个线程中分配执行时间片段。当某一个线程被 CPU 挂起时，需要记录代码已经执行到的位置，方便 CPU 重新执行此线程时，知道从哪行指令开始执行。这就是 程序计数器 的作用。

程序计数器是虚拟机中一块较小的内存空间，主要用于记录当前线程执行的位置。

🎤 JVM 运行时内存结构 - 图5

实际上除了上图演示的恢复线程操作之外，其它一些我们熟悉的分支操作、循环操作、跳转、异常处理等也都需要依赖这个计数器来完成。

注意要点：

在 Java 虚拟机规范中，对程序计数器这一区域没有规定任何 OutOfMemoryError 情况
线程私有的，每条线程内部都有一个私有程序计数器。它的生命周期随着线程的创建而创建，随着线程的结束而死亡
当一个线程正在执行一个 Java 方法的时候，这个计数器记录的是正在执行的虚拟机字节码指令的地址。如果正在执行的是 Native 方法，这个计数器值则为空（Undefined）