JVM

学习地址:解密 JVM

参考文档:https://nyimac.gitee.io/2020/06/08/JVM学习/

0.什么是JVM

Java Virtual Machine - Java 程序的运行环境(Java 二进制字节码的运行环境)

优点:

  • 一次编写,处处运行
  • 自动内存管理,垃圾回收机制
  • 数据下标越界检查
  • 多态

比较JVM JRE JDK

java-virtual-machine - 图1

学习路线

java-virtual-machine - 图2

1.内存模型

Java 内存区域:运行时数据区域

程序计数器

Program Counter Register 程序计数器(物理上是由寄存器来实现的)

java-virtual-machine - 图3

Program Counter Register 程序计数器(物理上是由寄存器来实现的)

作用

用于保存 JVM 中下一条所要执行的指令的地址

特点

  • 是线程私有的
    • CPU 会为每个线程分配时间片,当当前线程的时间片使用完以后,CPU 就会去执行另一个线程中的代码
    • 程序计数器是每个线程私有的,当另一个线程的时间片用完,又返回来执行当前线程的代码时,通过程序计数器可以知道应该执行哪一句指令
  • 不会存在内存溢出

虚拟机栈

java-virtual-machine - 图4

定义

  • 每个线程运行时所需要的内存,成为虚拟机栈;
  • 每个栈由多个栈帧(Frame)组成,对应着每次方法调用时所占用的内存;
  • 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法;

问题辨析

  1. 垃圾回收是否涉及栈内存?
    不需要。因为虚拟机栈中是由一个个栈帧组成的,在方法执行完毕后,对应的栈帧就会被弹出栈。所以无需通过垃圾回收机制去回收内存。
  2. 栈内存分配越大越好吗?
    不是。因为物理内存是一定的,栈内存越大,可以支持更多的递归调用,但是可执行的线程数就会越少。
  3. 方法内的局部变量是否线程安全?
    • 如果方法内局部变量没有逃离方法的作用范围,则是线程安全
    • 如果如果局部变量引用了对象,并逃离了方法的作用范围,则需要考虑线程安全问题

栈内存溢出

Java.lang.stackOverflowError 栈内存溢出

  • 虚拟机栈中,栈帧过多(无限递归)
  • 每个栈帧所占用过大

线程运行诊断

CPU 占用过高

  • Linux 环境下运行某些程序的时候,可能导致CPU的占用过高,这时需要定位占用CPU过高的线程
    • top 命令,查看是哪个进程占用CPU过高
    • ps H -eo pid, tid, %cpu | grep 刚才通过top查到的进程号 通过ps命令进一步查看是哪个线程占用CPU过高
    • jstack 进程id 通过查看进程中的线程的nid,刚才通过ps命令看到的tid来对比定位,注意jstack查找出的线程id是16进制的需要转换

本地方法栈

java-virtual-machine - 图5

一些带有 native 关键字的方法就是需要 JAVA 去调用本地的 C 或者 C++ 方法,因为JAVA有时候没法直接和操作系统底层交互,所以需要用到本地方法,这时使用的内存空间就是本地方法栈。

  • 程序计数器、虚拟机栈、本地方法栈 都是线程私有的;

java-virtual-machine - 图6

定义

Heap 堆

  • 通过 new 关键字创建的对象都会被放在堆内存;

特点

  • 它是线程共享的,堆中对象都需要考虑线程安全的问题;
  • 有垃圾回收机制;

堆内存溢出

java.lang.OutofMemoryError :java heap space. 堆内存溢出

堆内存诊断

  • jps:查看当前系统中有哪些 java 进程
  • jmap:查看堆内存占用情况 jmap - heap 进程id
  • jconsole:图形界面的,多功能的监测工具,可以连续监测
  • jvirsalvm

方法区

定义

JVM 规范-方法区定义

组成

java-virtual-machine - 图7

java-virtual-machine - 图8

方法区内存溢出

  • 1.8以前会导致永久代内存溢出:java.lang.OutOfMemoryError: PermGen space
  • 1.8以后会导致元空间内存溢出:java.lang.OutOfMemoryError: Metaspace

运行时常量池

二进制字节码的组成:类的基本信息、常量池、类的方法定义(包含了虚拟机指令)

  • 常量池,就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息;
  • Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,类加载后会被存放到方法区的运行时常量池;
  • 运行时常量池,**常量池是 .class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量
    池,并把里面的符号地址变为真实地址;

StringTable

串池 HashTable 结构

特性

  • 常量池中的字符串仅是符号,第一次用到时才变为对象;
  • 利用串池的机制,来避免重复创建字符串对象;
  • 字符串变量拼接的原理是 StringBuilder(1.8);
    • StringBuilder().append(String).append(String).toString();
    • toString 方法实际上用了 new String(char[], int, int) 创建了新的对象;
  • 字符串常量拼接的原理是编译期优化;
    • 在编译期间就已经对常量进行运算出结果;
  • 可以使用 intern 方法,主动将串池中还没有的字符串对象放入串池;
    • 1.8 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有则放入串池, 会把串
      池中的对象返回;
    • 1.6 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份,
      放入串池, 会把串池中的对象返回;

注意:无论是串池还是堆里面的字符串,都是对象

位置

由方法区的组成可以看出

  • 1.8 串池位于堆空间;
  • 1.6 串池位于永久代空间;

垃圾回收

StringTable在内存紧张时,会发生垃圾回收

性能调优

  • 因为 StringTable 是由 HashTable 实现的,所以可以 适当增加 HashTable 桶的个数 ,来减少字符串放入串池所需要的时间

    1. -XX:StringTableSize=xxxxCopy
  • 考虑是否需要将字符串对象入池

  • 可以通过 intern 方法减少重复入池

直接内存

  • 属于操作系统,常见于NIO操作时,用于数据缓冲区
  • 分配回收成本较高,但读写性能高
  • 不受JVM内存回收管理

文件读写流程

普通 IO

java-virtual-machine - 图9

使用 DirectBuffer 直接内存

java-virtual-machine - 图10

直接内存是操作系统和 Java 代码都可以访问的一块区域,无需将代码从系统内存复制到 Java 堆内存,从而提高了效率。

释放原理

  • 使用了 Unsafe 对象完成直接内存的分配回收,并且回收需要主动调用 freeMemory 方法;
  • ByteBuffer 的实现类内部,使用了 Cleaner (虚引用)来监测 ByteBuffer 对象,一旦 ByteBuffer 对象被垃圾回收,那么就会由 ReferenceHandler 线程通过 Cleaner 的 clean 方法调用 freeMemory 来释放直接内存;

2.垃圾回收

如何判断对象可以被回收?

引用计数法

对对象的引用进行计数,当引用计数为 0 时,对该对象进行回收。

弊端:对于循环引用的情况,导致无法回收。

java-virtual-machine - 图11

可达性分析算法

  • JVM 中的垃圾回收器通过可达性分析来探索所有存活的对象
  • 扫描堆中的对象,看能否沿着 GC Root 对象为起点的引用链找到该对象,如果找不到,则表示可以回收
  • 可以作为 GC Root 的对象
    • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
    • 方法区中类静态属性引用的对象
    • 方法区中常量引用的对象
    • 本地方法栈中 JNI(即一般说的 Native 方法)引用的对象

四种引用

  1. 强引用
  • 只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收;
  1. 软引用(SoftReference)
  • 仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收,回收软引用对象;
  • 可以配合引用队列来释放软引用自身内存;
  1. 弱引用(WeakReference)
  • 仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象;
  • 可以配合引用队列来释放弱引用自身内存;
  1. 虚引用(PhantomReference)
  • 必须配合引用队列使用,主要配合 ByteBuffer 使用,被引用对象回收时,会将虚引用入队,由Reference Handler 线程调用虚引用相关方法释放直接内存
  1. 终结器引用(FinalReference)
  • 无需手动编码,但其内部配合引用队列使用,在垃圾回收时,终结器引用入队(被引用对象暂时没有被回收),再由 Finalizer 线程通过终结器引用找到被引用对象并调用它的 finalize方法,第二次 GC 时才能回收被引用对象

java-virtual-machine - 图12

垃圾回收算法

标记-清除算法(Mark Sweep)

  • 速度较快
  • 会造成垃圾碎片

java-virtual-machine - 图13

定义:标记清除算法顾名思义,是指在虚拟机执行垃圾回收的过程中,先采用标记算法确定可回收对象,然后垃圾收集器根据标识清除相应的内容,给堆内存腾出相应的空间

  • 这里的腾出内存空间并不是将内存空间的字节清零,而是记录下这段内存的起始结束地址,下次分配内存的时候,会直接覆盖这段内存;

缺点:容易产生大量的内存碎片,可能无法满足大对象的内存分配,一旦导致无法分配对象,那就会导致 JVM 启动 GC,一旦启动 GC,我们的应用程序就会暂停,这就导致应用的响应速度变慢;

标记-整理算法(Mark Compact)

  • 速度慢
  • 没有垃圾碎片

java-virtual-machine - 图14

定义:标记-整理会将不被 GC Root 引用的对象回收,清除其占用的内存空间。然后整理剩余的对象,可以有效避免因内存碎片而导致的问题,但是因为整体需要消耗一定的时间,所以效率较低。

复制算法(Copy)

  • 不会有内存碎片
  • 需要占用双倍内存空间

java-virtual-machine - 图15

将内存分为相同大小的两个区域,FROM 和 TO(TO 区域为空)。现将被 GC Root 引用的对象(不会被垃圾回收)从 FROM 放入 TO 中,再回收 FROM 中剩余的不被 GC Root 引用的将要被回收的对象。然后交换 FROM 和 TO。这样也可以避免内存碎片的问题,但是会占用双倍的内存空间。

分代回收

java-virtual-machine - 图16

回收流程

新创建的对象都放在了新生代的伊甸园中

java-virtual-machine - 图17

当伊甸园中的内存不足时,就会进行一次垃圾回收,这时的回收叫做 Minor GC

java-virtual-machine - 图18

Minor GC 会将伊甸园和幸存区 FROM 存活的对象先复制到 幸存区 TO 中, 并让其寿命加 1,再交换两个幸存区

java-virtual-machine - 图19

java-virtual-machine - 图20

再次创建对象,若新生代的伊甸园又满了,则会再次触发 Minor GC(会触发 stop the world, 暂停其他用户线程,只让垃圾回收线程工作),这时不仅会回收伊甸园中的垃圾,还会回收幸存区中的垃圾,再将活跃对象复制到幸存区 TO 中。回收以后会交换两个幸存区,并让幸存区中的对象寿命加 1

java-virtual-machine - 图21

如果幸存区中的对象的寿命超过某个阈值(最大为15,4bit),就会被放入老年代

java-virtual-machine - 图22

如果新生代老年代中的内存都满了,就会先触发 Minor Gc,再触发 Full GC,扫描新生代和老年代中所有不再使用的对象并回收

  • 对象首先分配在新生代的伊甸园区;
  • 新生代空间不足时,触发 minor gc,伊甸园和 from 存活的对象使用 copy 算法复制到 to 中,存活的对象年龄 +1 并交换 from 和 to 区域;
  • minor gc 会引发 stop the world,暂停其他用户的线程,优先执行垃圾回收的线程,等垃圾回收结束后,用户线程才恢复运行;
  • 当对象寿命超过阈值时,会晋升至老年代,最大寿命是 15 次(4bit);
  • 当老年代空间不足,会先尝试触发 minor gc,如果空间仍不足,那么触发 full gc,STW(stop the world)的时间更长;

GC 分析

  • 大对象处理策略
    当遇到一个较大的对象时,就算新生代的伊甸园为空,也无法容纳该对象时,会将该对象直接晋升为老年代
  • 线程内存溢出
    某个线程的内存溢出了而抛异常(out of memory),不会让其他的线程结束运行
    这是因为当一个线程抛出OOM异常后它所占据的内存资源会全部被释放掉,从而不会影响其他线程的运行,进程依然正常

垃圾回收器

串行

  • 单线程
  • 堆内存较小,适合个人电脑(CUP 核心数少)

java-virtual-machine - 图23

安全点:让其他线程都在这个点停下来,以免垃圾回收时移动对象地址,使得其他线程找不到被移动的对象

因为是串行的,所以只有一个垃圾回收线程。且在该线程执行回收工作时,其他线程进入阻塞状态

吞吐量优先

  • 多线程
  • 堆内存较大,多核 CPU
  • 单位时间内,STW 时间最短

java-virtual-machine - 图24

响应时间优先

  • 多线程
  • 堆内存较大,多核 CPU
  • 尽可能让单次 STW 时间最短(尽量不影响其他线程运行)

java-virtual-machine - 图25