Java 源代码文件(.java后缀)会被 Java 编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由 JVM 执行引擎执行。
那在整个程序执行过程中,JVM 中怎么存取数据和相关信息呢?事实上在 JVM 中是用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为 Runtime Data Area(运行时数据区),也就是我们常说的 JVM 内存。

1.运行时数据区域包括哪些

image.png
根据《Java 虚拟机规范》的规定,运行时数据区通常包括这几个部分:

  • 程序计数器(Program Counter Register):线程私有的,记录当前线程的行号指示器,为线程的切换提供保障;
  • Java 虚拟机栈(Java Vitual Machine Stack):线程私有的,主要存放局部变量表,操作数栈,动态链接和方法出口等;
  • 本地方法栈(Native Method Stack)
  • 方法区(Method Area):线程共享的,主要存储类信息、常量池、静态变量、JIT 编译后的代码等数据。方法区理论上来说是堆的逻辑组成部分;运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用;
  • (Heap):所有线程共享的,主要用来存储对象。其中,堆可分为:年轻代和老年代两块区域。使用 NewRatio 参数来设定比例。对于年轻代,一个 Eden 区和两个 Suvivor 区,使用参数 SuvivorRatio 来设定大小;

    2.各部分的存储信息和职能

    2.1 程序计数器

    多线程是通过线程轮流切换、分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存;当线程执行的是 Native 方法的时候这个计数器中的值为 undefined

这个内存区域是 Java 虚拟机规范中唯一一个没有规定任何 OOM(OutOfMemoryError)情况的区域,这是这个区域最大的特点之一,这是因为程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,因此,对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。

这个区域主要是负责记录正在执行的虚拟机字节码指令地址,即当前线程执行的字节码的行号指示器(注意: JVM 不是直接执行 Java 代码,而是执行 .class 文件,所以只要其他编程语言能翻译成 .class 文件一样能放入JVM中执行)。

2.2 Java虚拟机栈

和程序计数器一样的是 Java 虚拟机栈是线程私有,生命周期和线程相同。虚拟机栈描述的是 Java 方法执行的内存模型:每个方法在执行的时候都会创建栈帧,用来存储局部变量表,操作数栈,动态链接,方法出口等信息,每个方法从调用到执行完成的过程,就对应一个栈帧在虚拟机中入栈到出栈的过程,其中 64 位长度的 long 和 double 类型的数据会占用 2 个局部变量空间,其余的数据类型只占用 1 个。

这里需要理解一下的就是为什么要用栈这个结构呢,比如 A 方法中调用了 B 方法,虚拟机中是先让 A 方法的栈帧进入虚拟机栈执行,当执行到调用 B 方法的语句就让 B 栈帧进入,执行完之后 B 栈帧就出栈,A 栈就继续执行。这里注意的是如果递归的方法递归的太深很容易抛出下面两种异常,所以递归虽然写起来方便,但是性能会有所下降,并且容易抛出异常。

Java 虚拟机规范中,对这个区域规定了两种异常状况

  • 线程请求栈的深度大于虚拟机所允许栈的深度,将抛出 Stack Overflow Error
  • 如果虚拟机栈可以动态扩展且扩展时无法申请到足够的内存,会抛出 OutOfMemoryError

    2.3 本地方法栈

    与虚拟机栈作用相似,虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈为虚拟机使用到的 Native 方法服务,Native 方法多是用 C++ 写的。抛出的异常和虚拟机栈相同。

    2.4 Java 堆

    Java 堆是与前面的区域不同的是:这个区域是被所有线程共享的一块内存区域,用来存放对象实例,并为对象实例分配内存

Java 虚拟机规范中这样描述:所有对象实例以及数组都要在堆上分配。Java 堆也是垃圾收集器管理的主要区域,也叫“GC堆”。由于现在的垃圾回收算法多是分代收集,所以 Java 堆里面又可分为:新生代和老年代。并且根据 Java 虚拟机规范的规定:Java 堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。有实例没有被分配,且堆无法再扩展的时候会抛出 OutOfMemoryError 异常,虚拟机调优其实也主要关注的是这个区域。

2.5 方法区

与 Java 堆一样,线程共享,用来存储被虚拟机加载的类信息、常量、静态变量。这个区域 Java 虚拟机规范对其特别宽松,既可以像 Java 堆那样不需要连续内存,又可以选择固定大小和可扩展。还可以选择不实现垃圾收集,这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。当无法满足内存分配需求时,将抛出 OutOfMemoryError 异常。

永久代和元空间

方法区是 Java 虚拟机规范中的定义,是一种规范,而永久代是 HotSpot 对方法区的一种实现,一个是标准一个是实现,即使用永久代来实现方法区

  • 存储位置不同,永久代物理上是堆的一部分,和新生代,老年代地址是连续的,而元空间属于本地内存;
  • 存储内容不同,元空间(一块区域)存储类的元信息静态变量和常量池等并入堆中。相当于永久代的数据被分到了堆和元空间中。

对于 Java8, HotSpot 取消了永久代, 取代永久代的就是元空间。虚拟机 Hotspot 已经将这部分存储空间从使用 JVM 内存换成使用本地内存,即这部分不再叫永久代,而是元空间。这个元空间实际上是 JVM 动态规定内存大小。

这个替换有什么优势呢?因为字符串常量池是存在永久代中,很容易出现性能问题,并且类和方法信息大小难确定,给永久代的的大小指定带来困难,而且 GC 会对永久代特殊处理,这就增加了 GC 的复杂性。从 JDK1.7 开始,字符串常量池就划分进了堆中(规范),也使得元空间在内存划分的算法上更趋于合理。

Class 文件常量池

Class 文件常量池指的是编译生成的 class 字节码文件中的常量池(不在 JVM 内存中),其结构中有一项是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放
这里的字面量是指字符串字面量和声明为 final 的(基本数据类型)常量值

  • 字符串字面量:除了类中所有双引号括起来的字符串(包括方法体内的),还包括所有用到的类名、方法的名字和这些类与方法的字符串描述、字段(成员变量)的名称和描述符;
  • 声明为 final 的常量值:指的是类的成员变量,不包含本地变量,本地变量是属于方法的。这些都在常量池的 UTF-8 表中(逻辑上的划分);

字面量:

  • 整数、浮点数(类的成员变量-final常量值-不包含本地变量,本地变量是属于方法的)
  • 字符串字面量
    - 类中所有双引号括起来的字符串(包括方法体内的)
    - 类名
    - 方法的名字
    - 类与方法的字符串描述
    - 字段(成员变量)的名称和描述符

符号引用:

  • 类符号引用
  • 字段符号引用
  • 方法符号引用
  • 接口方法符号引用

    运行时常量池

    运行时常量池才是我们常说的常量池。
    运行时常量池是方法区的一部分,是一块内存区域。Class 文件常量池将在类加载后进入方法区的运行时常量池中存放。
    一个类加载到 JVM 中后对应一个运行时常量池,运行时常量池相对于 Class 文件常量池来说具备动态性,Class 文件常量只是一个静态存储结构,里面的引用都是符号引用。而运行时常量池可以在运行期间将符号引用解析为直接引用
    可以说运行时常量池就是用来索引和查找字段、方法名称和描述符的。给定任意一个方法或字段的索引,通过这个索引最终可得到该方法或字段所属的类型信息、名称及描述符信息,这涉及到方法的调用和字段获取。

    字符串常量池

    字符串常量池是全局的,JVM 中独此一份,因此也称为全局字符串常量池。
    StringTable : HashSet<String>
    StringTable 中保存的是字符串对象的引用,字符串对象的引用指向堆中的字符串对象。

运行时常量池中字符串字面量:

  • 若是成员的,则在类的加载初始化阶段就使用到了字符串常量池;
  • 若是本地的,则在使用到的时候(执行此代码时)才会使用到字符串常量池。

其实,“使用常量池”对应的字节码是一个 ldc 指令,在给 String 类型的引用赋值的时候会先执行这个指令,看常量池中是否存在这个字符串对象的引用,若有就直接返回这个引用,若没有,就在堆里创建这个字符串对象并在字符串常量池中记录下这个引用(jdk1.7)。

常量不一定只有编译期才能产生,运行期间也可以将新的常量放入池中。例如 String 的 Intern() 方法,同样抛出 OutOfMemoryError 异常。

缓冲池

JVM 中除了字符串常量池,8 种基本数据类型中除了两种浮点类型剩余的 6 种基本数据类型的包装类,都使用了缓冲池技术,但是 Byte、Short、Integer、Long、Character 这 5 种整型的包装类也只是在对应值在 [-128, 127] 时才会使用缓冲池,超出此范围仍然会去创建新的对象。
缓存对象:ByteCache、ShortCache、LongCache 等等

JDK8

[Core] Runtime Data Area - 图2

3.直接内存

这个区域并不是属于运行时数据区域,但是这个区域也会被频繁使用,并且抛出 OOM 异常。这个区域主要是由于在 JDK1.4 中新加入了 NIO(New Input/Output)类,引入了一种基于通道与缓冲区的 I/O 方式,它可以使用 Native 函数库直接分配堆外内存,通过一个储存在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作。

这样能避免在 Java 堆和 Native 堆中来回复制数据,从而在一些场景中显著提高性能。直接内存分配不会受到 Java 堆大小的限制,会受到本机总内存大小及处理器寻址空间的限制,抛出 OutOfMemoryError 异常。

4.总结

只有程序计数器不会报出任何相关 OOM 异常,而 Java 虚拟机栈有可能会报出 OOM 或 Stack Overflow 异常。Java 虚拟机栈主要是存储方法的一些信息,能让方法顺利的执行,而 Java 堆存储的是对象的信息。虚拟机的垃圾回收算法主要在这一块,并且平常调优的区域也是在这一块。

参考

https://www.cnblogs.com/xiaotian15/p/6971353.html
https://www.tuicool.com/articles/Av6RZnU