相关算法

  • Mark阶段的开销与存活对象的数量成正比;
  • Sweep阶段的开销与所管理区域的大小成正相关;
  • Compact阶段的开销与存活对象的数据成正比。

    基础算法

    标记阶段

  • 对象存活判断:在堆里存放着几乎所有的Java对象实例,在GC执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程我们可以称为垃圾标记阶段。

  • 那么在JVM中究竟是如何标记一个死亡对象呢?简单来说,当一个对象已经不再被任何的存活对象继续引用时,就可以宣判为已经死亡。
  • 判断对象存活一般有两种方式:引用计数算法和可达性分析算法。

引用计数 算法

引用计数算法(Reference Counting)比较简单,对每个对象保存一个整型 的引用计数器属性,用于记录对象被引用的情况。被引用加1,被释放减1,当计数器等于0时即表示对象不可能再被使用,可进行回收。

  • 优点
    • 实现简单,垃圾对象便于辨识;
    • 判定效率高,回收没有延迟性。
  • 缺点
    • 引用计数器最大的缺陷是无法处理循环引用的情况,会导致内存泄漏。这是一 条致命缺陷,因此在Java的垃圾回收器中没有使用这类算法;
    • 它需要单独的字段存储计数器,这样的做法增加了存储空间的开销;
    • 每次赋值都需要更新计数器,伴随着加法和减法操作,这增加了时间开销。

Python使用引用计数算法实现的GC器,它是如何解决循环引用问题的呢?

  • 手动解除:在写代码时,通过给对象赋值为null来解除循环引用。
  • 使用weakref(弱引用),弱引用在GC时会被回收。weakref是Python提供的标准库,旨在解决循环引用问题。

可达性分析 算法

也叫根搜索算法 或 追踪性垃圾收集,Java便是采用的此种GC算法。
通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。

  • 优点
    相对于引用计数算法而言,可达性分析算法不仅同样具备实现简单和执行高效等特点,更重要的是该算法可以有效地解决在引用计数算法中循环引用的问题,防止内存泄漏的发生。
  • 缺点

    • 回收有延迟性
  • GC Roots

所谓”GC Roots”根集合就是一组必须活跃的引用。 在Java语言中,GC Roots对象包括以下几类元素:

  • 虚拟机栈中引用的对象;
    • 如:各个线程当中被调用的方法中使用到的参数、局部变量等。
  • 堆中类静态属性引用的对象;
    • 如:Java类的引用类型静态变量
  • 堆中常量引用的对象;
    • 如:字符串常量池(string Table) 里的引用
  • 本地方法栈内JNI(通常说的native方法)引用的对象;
  • 所有被同步锁synchronized持有的对象;
  • Java虚拟机内部的引用;

基本数据类型对应的Class对象,一些常驻的异常对象(如: NullPointerException、OutOfMemoryError) ,系统类加载器。

  • 反映java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等;
  • 除了这些固定的GCRoots集合以外,根据用户所选用的垃圾收集器以及当前回收的内存区域不同,还可以有其他对象“临时性”地加入,共同构成完整GC Roots集合。比如:分代收集和局部回收(Partial GC)。
    • 如果指针对Java堆中的某一块区域进行垃圾回收(比如:典型的只针对新生代),必须考虑到内存区域是虚拟机自己的实现细节,更不是孤立封闭的,这个区域的对象完全有可能被其他区域的对象所引用,这时候就需要一.并将关联的区域对象也加入GC Roots集合中去考虑,才能保证可达性分析的准确性。

一言蔽之:由于Root采用栈方式存放变量和指针,所以如果一个指针,它保存了堆内存里面的对象,但是自己又不存放在堆内存里面,那它就是一个Root。

  • 注意
      1. 如果要使用可达性分析算法来判断内存是否可回收,那么分析工作必须在 一个能保障一致性的快照中进行。这点不满足的话分析结果的准确性就无法保证。
      1. 即使是号称(几乎)不会发生停顿的CMS收集器中,枚举根节点时也是必须要停顿的。这点也是导致GC进行时必须”StopTheWorld”的一个重要原因。

清除阶段

清除并不是真的置空,而是把需要清除的对象地址保存在空闲 的地址列表里。下次有新对象需要加载时,判断垃圾的位置空间是否够,如果够,就存放。

标记-清除 算法

当堆中的有效内存空间(available memory) 被耗尽的时候,就会停止整个程序(也被称为stop the world),然后进行两项工作,第一项则是标记,第二项则是清除。

  • 标记
    Collector从引用根节点开始遍历,标记所有被引用的对象。一般是在对象的Header中记录为可达对象。
  • 清除
    Collector对堆内存从头到尾进行线性的遍历,如果发现某个对象在其Header中没有标记为可达对象,则将其回收。

  • 缺点

    • 需要进行两次遍历(标记、清除各一次),效率不高,导致STW时间较长;
    • 清理出来的空闲内存是不连续的,产生内存碎片。需要维护一个空闲列表。

复制 算法

将活着的内存空间分为两块,每次只使用其中一块,在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中,之后清除正在使用的内存块中的所有对象,交换两个内存的角色,最后完成垃圾回收。

  • 优点
    • 没有标记和清除过程,实现简单,运行高效;
    • 复制过去以后保证空间的连续性,不会出现“碎片”问题。
  • 缺点
    • 需要两倍的内存空间;
    • 对于G1这种分拆成为大量region的GC,复制而不是移动,意味着GC需要维护region之间对象引用关系,不管是内存占用或者时间开销也不小。
  • 注意
    如果系统中的存活对象很多,复制算法需要复制的存活对象数量太大太多,会导致复制算法的效率变得十分低效。
  • 应用场景

JVM堆中的新生代的S0和S1区的垃圾回收就是使用的复制算法,因为新生代中的对象80%-90%是朝生夕死的,存活下来的对象本就很少,而且S区内存限制仅为新生代的1/10,更加不会出现大量对象复制的情况。相反,老年代中对象的垃圾回收算法使用复制算法就显然不合适了。

标记-整理 算法

在标记-清除算法的基础上进行了内存的碎片化整理,主要执行过程如下三步:

  1. 从根节点开始标记所有被引用对象;
  2. 所有的存活对象移动到内存的一端,按顺序排放(连续内存地址存储);
  3. 清理边界外所有的空间。
  • 优点
    • 解决了标记-清除算法的内存碎片化问题;

给新对象分配内存时,JVM只 需要持有一个内存的起始地址即可,无需维护一个空闲列表。

  • 消除了复制算法当中,内存减半的高额代价。
    • 缺点
  • GC效率较低,连标记-清除算法都不如

落地算法

结合基础算法,来实现生产环境中的解决方案。
现代软件中,算法更注重的是时间复制度,而非空间复制度;垃圾回收器更注重的是低延迟,而非系统吞吐量。

分代收集算法

目前几乎所有的GC都是采用分代收集算法(Generational Collecting) 执行垃圾回收。在HotSpot中,基于分代的概念,GC所使用的内存回收算法结合年轻代和老年代各自的特点。 一言蔽之:没有银弹,根据各个内存区域的特点使用不同的回收算法,以提高垃圾回收效率。

  • 分代思想

为什么要把JVM堆分代?不分代就不能正常工作了么?
经研究,不同对象的生命周期不同。70%-99%的对象都是临时对象。

  • 新生代:对象存活率低,一般采用复制算法;
  • 老年代:存放新生代中经历多次依然存活的对象,对象存活率高,一般采用标记-整理算法。

其实不分代完全可以,分代的唯一理由就是优化GC性能。如果没有分代,那所有的对象都在一块,就如同把一个学校的人都关在一个教室。GC的时候要找到哪些对象没用,这样就会对堆的所有区域进行扫描,而很多对象都是朝生夕死的,如果分代的话,把新创建的对象放到某一地方,当GC的时候先把这块存储“朝生夕死”对象的区域进行回收,这样就会腾出很大的空间出来。

针对hotSpot VM的实现,它里面的GC按照回收区域又分为两大种类型:一种是部分收集(Partial GC),包括 Minor GC、Major GC、Mixed GC;一种是整堆收集(Full GC)。

Minor GC

年轻代回收,又称Young GC,因为Java对象大多都具备朝生夕灭的特性,所以Minor GC 最为频繁,一般回收速度也比较快。Minor GC 会引发STW。

  • 触发机制

当Enden区空间不足时,就会触发Minor GC。此时会将 from 区与Eden 区的对象一起进行可达性分析,将活跃的对象复制到 to 区并且将from区和 Eden 区的对象清空。

  • 如果复制时to区空间不足怎么办呢?

首先S区是不会主动触发Minor GC的,S区的回收都是在Enden区满触发Minor GC而被动回收的。当S区满了会把对象转存到老年代。

  • 特别说明
    在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。
    • 如果大于,则此次Minor GC是安全的
    • 如果小于,则虚拟机会查看-XX:HandlePromotionFailure设置值是否允许担保失败。(JDK 7以后的规则HandlePromotionFailure默认true)
      • 如果HandlePromotionFailure=true,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小。
        • 如果大于,则尝试进行一次Minor GC,只是尝试看能否触发分配担保(我们肯定希望的是分配担保成功Eden—>old/tentired),但这次Minor GC依然是有风险的;
        • 如果小于,则改为进行一次Full GC。
        • 如果HandlePromotionFailure=false,则改为进行一次Full GC。

一言蔽之:JDK7之后,只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC。

Major GC

老年代回收,又称Old GC,速度一般会比Minor GC慢10倍以上,STW时间更长。

  • 触发机制
    • 老年代空间不足;
    • 通过Minor GC后进入老年代的平均大小大于老年代的可用内存;
    • 由Eden区 & from区 向to区复制时,对象大小大于to可用空间,则把该对象转存到old代,且old代的可用内存小于该对象大小。

Mixed GC

混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集。 不涉及方法区回收,只是新生代,老年代的混合收集。

FullGC

整堆收集(Full GC):收集整个java堆和方法区的垃圾收集。

  • 触发机制
    • 调用System.gc()时,建议系统执行Full GC,但是不必然执行;
    • 老年代空间不足;
    • 方法区空间不足;
    • 通过Minor GC后进入老年代的平均大小小于老年代的可用内存;
    • 由Eden区,Survivor S0(from)区向S1(to)区复制时,对象大小由于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小。
  • 说明:Full GC 是开发或调优中尽量要避免的,这样SWT会短一些。

增量收集算法

如果一次性将所有的垃圾进行处理,需要造成系统长时间的停顿,那么就可以让垃圾收集线程和应用程序线程交替执行。每次,垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。依次反复,直到垃圾收集完成。

  • 优点
    由于在垃圾回收过程中,间断性地还执行了应用程序代码,所以能减少STW时间。
  • 缺点
    因为线程切换和上下文转换的消耗,会使得垃圾回收的总体成本上升,造成系统吞吐量的下降。

分区算法

将一块大的内存区域分割成多个小块,根据目标的停顿时间,每次合理地回收若干个小区间,而不是整个堆空间,从而减少一次GC所产生的停顿。

分代算法将按照对象的生命周期长短划分成两个部分,而分区算法将整个堆空间划分成连续的不同小区间。

  • 作用
    和增量收集算法一样,是为了尽量减少STW的时间。
  • 优点
    每一个小区间都独立使用,独立回收。这种算法的好处是可以控制一次回收多少个小区间。

gfu.png

相关概念

对象的finalization机制

垃圾回收此对象之前,总会先调用这个对象的finalize()方法(仅调用一次)。

  • 作用
    可通过重写 finalize()方法,用于在对象被回收时进行资源释放。
  • 永远不要主动调用某个对象的finalize()方法,理由如下:
    • 在finalize()时可能会导致对象复活;
    • finalize()方法的执行时间是没有保障的,它完全由GC线程决定,极端情况下,若不发生GC,则finalize() 方法将没有执行机会;
    • 一个糟糕的finalize()会严重影响GC的性能。
  • 对象的三种状态:
    • 可触及的:

从根节点开始,可以到达这个对象。

  • 可复活的:

对象的所有引用都被释放,但是对象有可能在finalize()中复活。

  • 不可触及的:

对象的finalize()被调用,并且没有复活,那么就会进入不可触及状态。不可触及的对象不可能被复活,因为finalize()只会被调用1次。

  • 注意
    以上3种状态中,是由于finalize()方法的存在,进行的区分。只有在对象不可触及时才可以被回收。 对象重写finalize()方法后,垃圾回收器判定一个对象objA是否可回收,至少要经历两次标记过程:
      1. 如果对象objA到GC Roots没有引用链,则进行第一 次标记;
      1. 进行筛选,判断此对象是否有必要执行finalize()方法。
        • 如果对象objA没有重写finalize()方法,或者finalize()方法已经被虚拟机调用过,则虚拟机视为“没有必要执行”,objA被判定为不可触及的。
        • 如果对象objA重写了finalize()方法,且还未执行过,那么objA会被插入到F一Queue队列中(由一个虚拟机自动创建的、低优先级的Finalizer线程触发其finalize()方法执行)。
        • finalize()方法是对象逃脱死亡的最后机会,GC会对F一Queue队列中的对象进行第二次标记。如果objA在finalize()方法中与GC Roots引用链上的任何一个对象建立了联系,那么在第二次标记时,objA会被移出F一Queue。之后,对象再次出现没有引用存在的情况,finalize方法不会被再次调用了,对象会直接变成不可触及的状态,也就是说,一个对象的finalize()方法只会被调用一次。

安全点&安全区域

安全点

程序执行时并非在所有地方都能停顿下来开始GC,只有在特定的位置才能停顿下来开始GC,这些位置称为“安全点(Safepoint)”。
———————————
Safe Point的选择很重要,如果太少可能导致GC等待的时间太长,如果太频繁可能导致运行时的性能问题。大部分指令的执行时间都非常短暂,通常会根据“是否具有让程序长时间执行的特征”为标准。比如:选择些执行时间较长的指令作为Safe Point, 如方法调用、循环跳转和异常跳转等。

  • GC时,保证非GC线程都能在安全点被挂起的两种策略

    • 抢先式中断(目前没有虚拟机采用了):
      首先中断所有线程。如果还有线程不在安全点,就恢复线程,让线程跑到安全点。
    • 主动式中断
      设置一个中断标志,各个线程运行到Safe Point的时候主动轮询这个标志,如果中断标志为真,则将自己进行中断挂起。

      安全区域

      安全区域是指在一段代码片段中,对象的引用关系不会发生变化,在这个区域中的任何位置开始GC都是安全的。我们也可以把Safe Region 看做是被扩展了的Safepoint。

  • 作用

Safepoint机制保证了程序执行时,在不太长的时间内就会遇到可进入GC的Safepoint,但是,程序“不执行”的时候呢?例如线程处于Sleep 状态或Blocked状态,这时候线程无法响应JVM的中断请求,“走” 到安全点去中断挂起,JVM也不太可能等待线程被唤醒。对于这种情况,就需要安全区域(Safe Region)来解决。

Java中的引用关系

在JDK 1.2版之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference) 、弱引用(Weak Reference) 和虚引用(Phantom Reference) 4种,这4种引用强度依次逐渐减弱。 mjb.png

生命周期 应用场景
强引用 只要引用关系还在,就不会被回收 new 的方式
软引用 OOM前,会GC 缓存
弱引用 每次GC时都会被回收 缓存
虚引用 / 回收跟踪
  • 强引用(StrongReference):

最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“0bject obj=new object()”这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。

  • 在Java程序中,最常见的引用类型是强引用(普通系统99%以上都是强引用),也就是我们最常见的普通对象引用,也是默认的引用类型。
  • 当在Java语言中使用new操作符创建一个新的对象, 并将其赋值给一个变量的时候,这个变量就成为指向该对象的一个强引用。
  • 强引用的对象是可触及的(可达的),垃圾收集器就永远不会回收掉被引用的对象。
  • 对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者显式地将相应(强)引用赋值为null,才可以当做垃圾被收集,当然具体回收时机还是要看垃圾收集策略。
  • 相对的,软引用、 弱引用和虚引用的对象是软可触及、弱可触及和虛可触及的,在一定条件下,都是可以被回收的。所以,强引用是造成Java内存泄漏的主要原因之一。
  • 特点:
    • 强引用可以直接访问目标对象;
    • 强引用所指向的对象在任何时候都不会被系统回收,虚拟机宁愿抛出OOM异常,也不会回收强引用所指向对象;
    • 强引用可能导致内存泄漏。
  • 软引用(SoftReference):

内存不足的情况下(OOM前),会被GC回收。

  1. /**
  2. * 软引用demo
  3. */
  4. class SoftReferenceDemo {
  5. public static void main(String[] args) {
  6. SoftReference<String> str = new SoftReference<>("S"); //建立软引用
  7. String s = str.get(); //从软引用中获取强引用
  8. }
  9. }
  • 弱引用(WeakReference):

被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时,无论内存空间是否足够,都会回收掉被弱引用关联的对象。

  1. /**
  2. * 弱引用demo
  3. */
  4. class WeakReferenceDemo{
  5. public static void main(String[] args) {
  6. WeakReference<String> str = new WeakReference<>("s"); //建立弱引用
  7. String s = str.get(); //从弱引用中获取强引用
  8. }
  9. }
  • 虚引用(PhantomReference):

也称幻象引用,一个对象是否有虛引用的存在,完全不会对其生存时 间构成影响,也无法通过虚引用来获得一个对象的实例。为一个对象设置虛引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知(回收跟踪)。

  • 虚引用(Phantom Reference),也称为“幽灵引用”或者“幻影引用”,是所有引用类型中最弱的一个。
  • 它不能单独使用,也无法通过虚引用来获取被引用的对象。当试图通过虚引用的get()方法取得对象时,总是null。
  • 虚引用必须和引用队列一起使用。虚引用在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时,如果发现它还有虛引用,就会在回收对象后,将这个虚引用加入引用队列,以通知应用程序对象的回收情况。

iro.png

  • 终结器引用

    • 它用以实现对象的finalize()方法,也可以称为终结器引用;
    • 无需手动编码, 其内部配合引用队列使用;
    • 在GC时, 终结器引用入队。由Finalizer线程通过终结器引用找到被引用对象并调用它的finalize()方法,第二次GC时才能回收被引用对象。

      垃圾回收器

  • GC器发展史

有了虚拟机,就一定需要收集垃圾的机制,这就是Garbage Collection, 对应的产品我们称为Garbage Collector.

  • 1999年随JDK1.3.1一 起来的是串行方式的Serial GC,它是第一款GC。ParNew垃圾收集器是Serial收集器的多线程版本
  • 2002年2月26日,Parallel GC和CMS GC(Concurrent Mark Sweep )跟随JDK1.4.2一起发布
  • Parallel GC在JDK6之后成为HotSpot默认GC。
  • 2012年,在JDK1.7u4版本中,G1可用。
  • 2017年,JDK9中G1变成默认的垃圾收集器,以替代CMS。
  • 2018年3月,JDK10中G1垃圾回收器的并行完整垃圾回收,实现并行性来改善最坏情况下的延迟。
    ———————————-分水岭—————————————
  • 2018年9月,JDK11发布。引入Epsilon垃圾回收器,又被称为”No一0p (无操作) “回收器。同时,引入ZGC:可伸缩的低延迟垃圾回收器(Experimental)。
  • 2019年3月,JDK12发布。 增强G1,自动返回未用堆内存给操作系统。同时,引入Shenandoah GC:低停顿时间的GC (Experimental)。
  • 2019年9月,JDK13发布。增强ZGC,自动返回未用堆内存给操作系统。
  • 2020年3月,JDK14发布。删除CMS垃圾回收器。扩展ZGC在macOS和Windows.上的应用
    • 查看默认的GC器
  • 方法1:运行程序时配置参数 -xx:+PrintCommandLineFlags
    • 查看命令行相关参数(包含使用的垃圾收集器)
  • 方法2:使用命令行指令
    • jinfo -flag [相关垃圾回收器参数] PID
    • 例如:jinfo -flag UseParallelGC PID,如果返回 -XX:+UseParallelGC则说明已经使用,返回-XX:-UseParallelGC 则说明未使用。

GC分类 &性能指标

GC分类

标准 类型
GC线程数 串行垃圾回收器
并行垃圾回收器
工作模式 独占垃圾回收器
并发垃圾回收器
碎片处理方式 压缩式垃圾回收器
非压缩式垃圾回收器
工作的内存区间 年轻代垃圾回收器
老年代垃圾回收器
  • 串行GC器

串行回收指的是在同一时间段内只允许有一个线程用于执行垃圾回收操作,此时工作线程被暂停,直至垃圾收集工作结束。

  • 优点
    单线程下,简单而高效,对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
  • 缺点
    数据吞吐量太小,TWS时间较长。不适合已是多核CPU的当今硬件环境下了。
  • 场景
    • 在诸如单CPU处理器或者较小的应用内存等硬件平台不是特别优越的场合,串行回收器的性能表现可以超过并行回收器和并发回收器。所以,串行回收默认被应用在客户端的Client模式下的JVM中
    • 在并发能力比较强的CPU上,并行回收器产生的停顿时间要短于串行回收器。

这类收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束(Stop The World )。

  • 配置方式
    • 在HotSpot虛拟机中,使用 -XX:+UseSerialGC 参数可以指定年轻代和老年代都使用串行收集器。
      • 等价于新生代用Serial GC,且老年代用Serial Old GC,注意不需要显示指定 -XX:+UseSerialOldGC,且没有这个参数。
  • 并行GC器

和串行回收相反,并行收集可以运用多个CPU同时执行垃圾回收。因此提升 了应用的吞吐量,不过并行回收仍然与串行回收一样,采用独占式,使用了“ Stop一the一world”机制。

  • 参数配置
    • -XX:+UseParallelGC 手动指定 年轻代使用Parallel并行收集器执行内存回收任务。
    • -XX:+UseParallelOldGC 手动指定老年代都是使用并行回收收集器。
      • 分别适用于新生代和老年代。默认jdk8是开启的。
      • 上面两个参数,默认开启一个,另一个也会被开启。 (互相激活)
    • -XX: ParallelGCThreads 设置年轻代并行收集器的线程数。一般地,最好与CPU数量相等,以避免过多的线程数切换,影响GC性能。
      • 在默认情况下,当CPU数量小于8个, Paralle lGCThreads 的值等于CPU数量。
      • 当CPU数量大于8个, ParallelGCThreads的值等于 3+[5*CPU_ Count]/8]
    • -XX:MaxGCPauseMillis 设置垃圾收集器最大停顿时间(即STw的时间)。单位是毫秒。
      • 为了尽可能地把停顿时间控制在MaxGCPauseMills以内,收集器在工作时会调整Java堆大小或者其他一些参数。
      • 对于用户来讲,停顿时间越短体验越好。但是在服务器端,我们注重 高并发,整体的吞吐量。所以服务器端适合Parallel,进行控制。
      • 该参数使用需谨慎。
    • -XX:GCTimeRatio 垃圾收集时间占总时间的比例(= 1 / (N + 1))用于衡量吞吐量的大小。
      • 取值范围(0, 100)。默认值99,也就是垃圾回收时间不超过1号。
      • 与前一个-XX:MaxGCPauseMillis参数有一定矛盾性。暂停时间越长,Radio参数就容易超过设定的比例。
    • -XX: +UseAdaptiveSizePolicy 设置Parallel Scavenge收 集器具有自适应调节策略
      • 在这种模式下,年轻代的大小、Eden和Survivor的比例、晋升老年 代的对象年龄等参数会被自动调整,已达到在堆大小、吞吐量和停顿时间之间的平衡点。
      • 在手动调优比较困难的场合,可以直接使用这种自适应的方式,仅指 定虚拟机的最大堆、目标的吞吐量(GCTimeRatio)和停顿时间(MaxGCPauseMills),让虚拟机自己完成调优工作。


  • 独占GC器

独占式垃圾回收器(Stop the world)一旦运行,就停止应用程序中的所有用户线程,直到垃圾回收过程完全结束。

  • 并发GC器

并发式垃圾回收器与应用程序线程交替工作,以尽可能减少应用程序的停顿时间(STW)。

  • 压缩GC器

压缩式(Compat)垃圾回收器会在回收完成后,对存活对象进行压缩整理,消除回收后的碎片。

  • 再分配对象空间使用: 指针碰撞。
    • 非压缩GC器

非压缩式的垃圾回收器不进行这步操作。

  • 再分配对象空间使用: 空闲列表。

评估GC性能的指标

指标 定义 说明
吞吐量 正常运行的时间占总运行时间的比例 总运行时间 = 程序的运行时间
+内存回收的时间
垃圾收集开销 GC时间占总运行时间的比例(吞吐量的补数)
暂停时间(STW) GC时程序的工作线程被暂停的时间(STW)
GC频率 /
内存占用 jvm堆区所占用的内存大小
快速 一个对象从诞生到被回收所经历的时间

飙红的这三者共同构成一个“不可能三角”。三者总体的表现会随着技术进步而越来越好。一款优秀的收集器通常最多同时满足其中的两项(且高吞吐和低STW不能同时满足)。

其中,暂停时间的重要性日益凸显。因为随着硬件发展,内存占用大 越来越能容忍,硬件性能的提升也有助于降低收集器运行时对应用程序的影响,即提高了吞吐量。而内存的扩大,对延迟反而带来负面效果。

  • 简单来说,主要抓住两点:吞吐量暂停时间
  • 高吞吐量 vs 低STW
    • 高吞吐量较好因为这会让用户感觉只有应用程序线程在做“生产性”工作。直觉上,吞吐量越高程序运行越快。
    • 低暂停时间(STW)较好因为从最终用户的角度来看不管是GC还是其他原因导致一个应用被挂起始终是不好的。这取决于应用程序的类型,有时候甚至短暂的200毫秒暂停都可能打断终端用户体验。因此,具有低的较大暂停时间是非常重要的,特别是对于一一个交互式应用程序。
    • 不幸的是”高吞吐量”和”低STW”是一对相互竞争的目标(矛盾)。
      • 因为如果选择以吞吐量优先,那么必然需要降低内存回收的执行频率,但是这样会导致GC需要更长的暂停时间来执行内存回收。
      • 相反的,如果选择以低延迟优先为原则,那么为了降低每次执行内存回收时的暂停时间,也只能频繁地执行内存回收,但这又导致程序吞吐量的下降。
    • 在设计(或使用) GC算法时,我们必须确定我们的目标: 一个GC算法只可能针对两个目标之一(即只专注于较大吞吐量或最小暂停时间),根据具体业务场景,不断去平衡二者。
    • 现在标准:在最大吞吐量优先的情况下,降低停顿时间。

七款经典垃圾回收器

GC 类型 描述
Serial 串行式 串行回收指的是在同一时间段内只允许有一个CPU用于执行垃圾回收操作,此时工作线程被暂停,直至垃圾收集工作结束。
Serial Old
ParNew 并行式 多个GC线程并行执行,以提高GC效率,适用于当下的多核CPU环境。
Parallel Scavenge
Parallel Old
CMS 并发式 并发式可实现GC线程与用户线程同时进行
⭐️G1
  • GC与垃圾分代的关系

pwl.png

  • GC器组合关系

GC器组合关系.svg

  1. - 两个收集器间有连线,表明它们可以搭配使用
  2. - 其中Serial Old作为CMS 出现"Concurrent Mode Failure"失败的后备预案。
  3. - 红色虚线)由于维护和兼容性测试的成本,在JDK 8时将Serial+CMS ParNew+Serial Old这两个组合声明为废弃(JEP 173 ,并在JDK 9中完全取消了这些组合的支持(JEP214),即:移除。
  4. - (绿色虚线)JDK 14中:弃用Parallel ScavengeSerialOld GC组合(JEP366
  5. - (白色虚线)JDK 14中:删除CMS垃圾回收器 JEP 363
  • 各种GC器的适用场景

最小化地使用内存和并行开销,请选Serial GC;
最大化应用程序的吞吐量,请选Parallel GC;
最小化GC的中断或停顿时间,请选CMS GC。

Serial

适用于新生代的GC器,采取复制算法。

Serial Old

适用老年代的GC器,采取标记-整理算法。

ParNew

Par是Parallel的缩写,New: 只能处理的是新生代。
适用于新生代的GC器,可以看作是Serial收集器的多线程版本。 ParNew GC器除了采用并行回收的方式执行内存回收外,与Serial GC器之间几乎没有任何区别,它在年轻代中同样也是采用复制算法。

  • 优点
    在多核CPU的环境下,由于可以充分利用多CPU、 多核心等物理硬件资源优势,可以更快速地完成垃圾收集,提升程序的吞吐量。
  • 缺点
    在多CPU的环境下,由于可以充分利用多CPU、 多核心等物理硬件资源优势,可以更快速地完成垃圾收集,提升程序的吞吐量。

  • 配置方式

    • -XX:+UseParNewGC
      • 表示年轻代使用并行收集器,不影响老年代。
    • -XX:ParallelGCThreads
      • 限制线程数量,默认开启和CPU数据相同的线程数。

Parallel Scavenge

HotSpot的年轻代中除了拥有ParNew GC器是基于并行回收的以外,Parallel ScavengeGC器同样也采用了复制算法、并行回收和”Stop the World”机制。不同之处如下:

  • Parallel Scavenge GC器的目标则是达到一个可控制的吞吐量(Throughput),它也被称为吞吐量优先的GC器。
  • Parallel ScavengeGC器 支持自适应调节策略 。
  • 适用场景

高吞吐量则可以高效率地利用CPU 时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。因此,常见在服务器环境中使用。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序。

Parallel Old

  • Parallel收集器在JDK1.6时提供了用于执行老年代垃圾收集的 Parallel Old收集器,用来代替老年代的Serial Old收集器。
  • Parallel Old收集器同样采用了标记一压缩算法,基于并行回收和STW机制。
  • 在程序吞吐量优先的应用场景中,Parallel 收集器和Parallel Old收集器的组合,在Server模式下的内存回收性能很不错。 在Java8中,默认是此垃圾收集器

CMS

CMS(Concurrent Mark Sweep)收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。

  • CMS的垃圾 收集算法采用标记一清除算法,并且也会STW;
  • 不幸的是,CMS 作为老年代的收集器,却无法与JDK 1.4.0 中已经存在的新生代收集器Parallel Scavenge配合工作,所以在JDK 1. 5中使用CMS来收集老年代的时候,新生代只能选择ParNew或者Serial收集器中的一个。

执行过程

yph.png

  • 初始标记(Initial一Mark)阶段:
    STW在这个阶段中,程序中所有的工作线程都将会因为STW机制而出现短暂的暂停,这个阶段的主要任务仅仅只是标记出GCRoots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用.线程。由于直接关联对象比较小,所以这里的速度非常快。
  • 并发标记(Concurrent一Mark)阶段:
    从GC Roots的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长但是不需要停顿用户线程,可以与垃圾收集线程一起并发运行。
  • 重新标记(Remark) 阶段:
    由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了避免并发标记期间,因用户程序继续运作产生了新的对象而导致漏标(漏标会导致非垃圾对象被回收,这是不能接受的)。这个阶段的停顿时间通常会比初始标记阶段稍长一些,但也远比并发标记阶段的时间短。
  • 并发清除(Concurrent一Sweep)阶段:
    此阶段清理删除掉标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的。但由于没有整理内存,会出现内存碎片的问题。

优劣分析

  • 优点
    并发收集、低STW
  • 缺点
    • 会产生内存碎片,导致并发清除后,用户线程可用的空间不足。在无法分配大对象的情况下,不得不提前触发Full GC。
    • CMS收集器对CPU资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。
    • CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure” 失败而导致另一次Full GC的产生。
      • 浮动垃圾:在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的,那么在并发标记阶段如果产生新的垃圾对象(多标),CMS将 无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象没有被及时回收,从而只能在下一次执行GC时释放这些之前未被回收的内存空间。

两个疑问

  1. 既然重新标记阶段就包含垃圾修正了,那么为什么还会出现浮动垃圾呢?
    重新标记是对已标记的对象进行检测:因为可能之前的垃圾对象又被其他对象引用,就需要重新标记(防止漏标),防止被误以为垃圾被清除掉。而浮动垃圾一开始并没有被标记,是在并发标记阶段之后可能变成垃圾的对象,指产生的新垃圾。
  2. 既然Mark Sweep会造成内存碎片,那么为什么不把算法换成Mark Compact呢?
    因为当并发清除的时候,用Compact整理内存的话,原来的用户线程使用的内存还怎么用呢?要保证用户线程能继续执行,前提的它运行的资源不受影响嘛。Mark Compact更适合”Stop the World”这种场景下使用。

参数设置

  • -XX:+UseConcMarkSweepGc 手动指定使用CMS收集器执行内存回收任务。
    • 开启该参数后会自动将 -XX:+UseParNewGc打开。即: ParNew (Young区用) +CMS (Old区用) +Serial Old的组合。
  • -XX:CMS1ni tiatingOccupanyFraction 设置堆内存使用率的阈值,一旦达到该阈值,便开始进行回收。
    • JDK5及以前版本的默认值为68,即当老年代的空间使用率达到68%时,会执行一次CMS 回收。 JDK6 5及以上版本默认值为92%
    • 如果内存增长缓慢,则可以设置一个稍大的值,大的阈值可以有效降低CMS的触发频率,减少老年代回收的次数可以较为明显地改善应用程序性能。反之,如果应用程序内存使用率增长很快,则应该降低这个阈值,以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Full GC的执行次数。
  • -XX:+UseCMSCompactAtFullCollection 用于指定在执行完Full GC后对内存空间进行压缩整理,以此避免内存碎片的产生。不过由于内存压缩整理过程无法并发执行,所带来的问题就是停顿时间变得更长了。
  • -XX:CMSFullGCsBeforeCompaction 设置在执行多少次Full GC后对内存空间进行压缩整理。
  • -XX:ParallelCMSThreads 设置CMS的线程数量。
    • CMS 默认启动的线程数是(ParallelGCThreads+3) /4, ParallelGCThreads是年轻代并行收集器的线程数。当CPU资源比较紧张时,受到CMs收集器线程的影响,应用程序的性能在垃圾回收阶段可能会非常糟糕。

JKD版本中的变化

  • JDK9新特性: CMS被标记为Deprecate了(JEP291)
    • 如果对JDK 9及以上版本的HotSpot虚拟机使用参数-XX:+UseConcMarkSweepGC来开启CMS收集器的话,用户会收到一个警告信息,提示CMS未来将会被废弃。
  • JDK14新特性: 删除CMS垃圾回收器(JEP363)
    • 移除了CMS垃圾收集器,如果在JDK14中使用-XX:+UseConcMarkSweepGC的话,JVM不会报错,只是给出一个warning信息,但是不会exit。JVM会自动回退以默认GC方式启动JVM

⭐️G1

G1(Garbage一First)开创了收集器面向局部收集的设计思路和基于Region的内存布局形式。把堆内存分割为很多不相关(即 可物理上不连续)的区域(Region),使用不同的Region表示Eden区、s0区、s1区,old区等,实现在延迟可控的情况下获得尽可能高的吞吐量。

  • G1 有计划地避免在整个Java 堆中进行全区域的垃圾收集。G1跟踪各个Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间这两个维度评判),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。
  • G1是一款面向服务端应用的垃圾收集器,主要针对配备多核CPU及大容量内存的机器,以 极高概率满足GC停顿时间的同时,还兼具高吞吐量的性能特征。
  • G1在JDK1. 7版本正式启用,移除了Experimental的标识,是JDK 9以后的默认垃圾回收器,取代了CMS回收器以及jdk8使用的Parallel + Parallel Old组合。被Oracle官方称为“全功能的垃圾收集器” 。 与此同时,CMS已经在JDK 9中被标记为废弃(deprecated)。

参数设置

  • -XX:+UseG1GC

手动指定使用G1收集器执行内存回收任务。

  • -XX:G1HeapRegionSize

设置每个Region的大小。值是2的幂,范围是1MB 到32MB之间,目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000。

  • -XX:MaxGCPauseMillis

设置期望达到的最大GC停顿时间指标(JVM会尽力实现,但不保证达到)。默认值是200ms

  • -XX:ParallelGCThread

设置STW工作线程数的值。最多设置为8

  • -XX:ConcGCThreads

设置并发标记的线程数。将n设置为并行垃圾回收线程数(ParallelGCThreads)的1/4左右。

  • -XX:InitiatingHeapOccupancyPercent

设置触发并发GC周期的Java堆占用率阈值。超过此值,就触发GC,默认值是45%。

  • G1回收器常见操作步骤

1.开启G1垃圾收集器
2.设置堆的最大内存
3.设置最大的停顿时间

优化建议

  • 年轻代大小
    • 避免使用 -Xmn 或 -XX:NewRatio 等相关选项显式设置年轻代大小
    • 固定年轻代的大小会覆盖暂停时间目标
  • 暂停时间目标不要太过严苛
    • G1 GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间
    • 评估G1 GC的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表 示你愿意承受更多的垃圾回收开销,而这些会直接影响到吞吐量。

优劣分析

  • 优点

    • 并行与并发
      • 并行性: G1在回收期间,可以有多个Gc线程同时工作,有效利用多核计算能力。此时用户线程STW;
      • 并发性: G1拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况。
    • 分代收集
      • 从分代上看,G1依然属于分代型垃圾回收器,它会区分年轻代和老年代,年轻代依然有Eden区和Survivor区。但从堆的结构上看,它不要求整个Eden区、年轻代或者老年代都是连续的,也不再坚持固定大小和固定数量。
      • 将堆空间分为若干个区域(Region) ,这些区域中包含了逻辑上的年轻代和老年代。
      • 和之前的各类回收器不同,它同时兼顾年轻代和老年代。而其他回收器,要么工作在年轻代,要么工作在老年代。
    • 空间整合
      • CMS: “标记一清除”算法、内存碎片、若干次GC后进行一次碎片整理
      • G1将内存划分为一个个的region。 内存的回收是以region作为基本单位的。Region之间是复制算法。
      • 但整体上实际可看作是标记一整理(Mark一Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。尤其是当Java堆非常大的时候,G1的优势更加明显。
    • 可预测的停顿时间模型 (即:软实时soft real一time)
      这是G1相对于CMS的另一大优势,G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。
      • 由于分区的原因,G1可以只选取部分区域进行内存回收,这样缩小了回收的范围,因此对于全局停顿情况的发生也能得到较好的控制。
      • G1跟踪各个Region里面的垃圾堆积的价值大小,在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。保证了G1 收集器在有限的时间内可以获取尽可能高的收集效率。
      • 相比于CMSGC,G1未必能做到CMS在最好情况下的延时停顿,但是最差情况要好很多。
  • 缺点

    • 相较于CMS,G1还不具备全方位、压倒性优势。比如在用户程序运行过程中,G1无论是为了垃圾收集产生的内存占用(Footprint) 还是程序运行时的额外执行负载(overload) 都要比CMS要高。
      • 因此在小内存应用上CMS的表现大概率会优于G1,而G1在大内存应用,上则发挥其优势。平衡点在6一8GB之间。
    • 由于Region数量比传统收集器的分代数量明显要多得多,因此G1收集器要比其他的传统垃圾收集器有着更高的内存占用负担。
      • 根据经验,G1至少要耗费大约相当于Java堆容量10%至20%的额外内存来维持收集器工作。

适用场景

  • 面向服务端应用,针对具有大内存、多处理器的机器。(在普通大小的堆里表现并不惊喜)
  • 最主要的应用是需要低GC延迟,并具有大堆的应用程序提供解决方案;
    • 如:在堆大小约6GB或更大时,可预测的暂停时间可以低于0.5秒; ( G1通过每次只清理一部分而不是全部的Region的增量式清理来保证每次GC停顿时间不会过长)。
  • 用来替换掉JDK1.5中的CMS收集器; 在下面的情况时,使用G1可能比CMS好:
    • 超过50%的Java堆被活动数据占用;
    • 对象分配频率或年代提升频率变化很大;
    • GC停顿时间过长(长于0. 5至1秒)。
  • HotSpot垃圾收集器里,除了G1以外,其他的垃圾收集器使用内置的JVM线程执行GC(线程优先级低)的多线程操作。而G1 GC可以采用应用线程承担后台运行的GC工作,即当JVM的GC线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。

region的细节

使用G1收集器时,它将整个Java堆划分成约2048个大小相同的独立Region块,每个Region块大小根据堆空间的实际大小而定,整体被控制在1MB到32MB之间,且为2的N次幂,即1MB, 2MB, 4MB, 8MB, 16MB,32MB。
可以通过 -XX:G1HeapRegionSize 设定。所有的Region大小相同,且在JVM生命周期内不会被改变。
虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region (不需要连续)的集合。通过Region的动态分配方式实现逻辑上的连续。
lnm.pngoyl.pngqnr.png

  • 一个region 有可能属于Eden, Survivor 或者Old/Tenured 内存区域。但是一个region只可能属于一个角色。图中的E表示该region属于Eden内存区域,s表示属于Survivor内存区域,O表示属于Old内存区域。图中空白的表示未使用的内存空间。
  • 在G1中,还有一种特殊的区域,叫Humongous区域。 如果一个对象占用的空间超过了分区容量50%以上,G1收集器就认为这是一个巨型对象。这些巨型对象,默认直接会被分配在年老代,但是如果它是一个短期存在的巨型对象,就会对垃圾收集器造成负面影响。为了解决这个问题,G1划分了一个Humongous区,它用来专门存放巨型对象。如果一个H区装不下一个巨型对象,那么G1会寻找连续的H分区来存储。为了能找到连续的H区,有时候不得不启动Full GC。
  • 各个Region内部通过指针碰撞的形式分配内存。同时,为了提高多线程并行执行效率,每个Region也采用了TLAB机制(为每个线程分配独立的缓存空间,避免加锁)。

GC过程分析

kgr.png
如果不去计算用户线程运行过程中的动作(如使用写屏障维护记忆集的操作)

G1 GC过程主要包括如下四个环节:

初始标记:(Initial Marking)
仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS指针的值,让下一阶段用户线程并发运行时,能正确地在可用的Region中分配新对象。这个阶段需要停顿线程,但耗时很短,而且是借用进行Minor GC的时候同步完成的,所以G1收集器在这个阶段实际并没有额外的停顿。

并发标记:( Concurrent Marking)
从GC Root开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行。当对象图扫描完成以后,还要重新处理SATB记录下的在并发时有引用变动的对象。

最终标记:(Final Marking)
对用户线程做另一个短暂的暂停,用于处理并发阶段结束后仍遗留下来的最后那少量的SATB记录。

筛选回收:(Live Data Counting and Evacuation)
负责更新Region的统计数据,对各个Region的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划,可以自由选择任意多个Region构成回收集,然后把决定回收的那一部分Region的存活对象复制到空的Region中,再清理掉整个旧Region的全部空间。这里的操作涉及存活对象的移动,是必须STW,由多条收集器线程并行完成的。

记忆集与写屏障
  • 为什么需要记忆集

用于解决分代引用的问题。
一个Region很可能不是孤立的,即,一个Region中的对象很可能被其他任意Region中对象引用,比如,年轻代的Region被老年代的Region所引用。因此判断对象存活时,不仅需要扫描年轻代的根,还需要扫描老年代的根,才能避免漏标,保证标记的准确性。那么回收新生代也不得不同时扫描老年代,这样会大大降低MinorGC的效率,因为此时标记是STW状态的。其实在其他的分代收集器,也存在这样的问题,只是G1中更为突出(因为,G1对内存分代更细,同时G1又是主打低延迟的)。

  • 落地方式

于是,G1引进了RSet的概念。它的全称是Remembered Set(记忆集),每个Region有一个RSet,用于跟踪 对象引用。
需要注意的是,如果引用的对象很多,赋值器需要对每个引用做处理,赋值器开销会很大,为了解决赋值器开销这个问题,在G1 中又引入了另外一个概念,卡表(Card Table)。一个Card Table将一个分区在逻辑上划分为固定大小的连续区域,每个区域称之为卡。卡 通常较小,介于128到512字节之间。Card Table通常为字节数组,由Card的索引(即数组下标)来标识每个分区的空间地址。默认情况下,每个卡都未被引用。当一个地址空间被引用时,这个地址空间对应的数组索引的值被标记为”0″,即标记为脏被引用,此外RSet也将这个数组下标记录下来。一般情况下,这个RSet其实是一个Hash Table,Key是别的Region的起始地址,Value是一个集合,里面的元素是Card Table的Index。
因此MinorGC时,标记阶段加入记忆集就可以保证不进行全堆扫描,也不会有遗漏。
每次引用类型数据写操作时,都会产生一个Write Barrier(写屏障)来保证写入的原子性。
其实无论G1还是其他分代收集器,JVM都是使用RememberedSet来避免全局扫描。
hlo.png

GC过程详解

hyh.png

  • 年轻代GC
  1. 扫描根
    根是指static变量指向的对象(类生命周期,方法区引用的对象),正在执行的方法调用链条上的局部变量等(方法生命周期,虚拟机栈引用的对象)。根引用连同RSet记录的外部引用作为扫描存活对象的入口。
  2. 更新RSet
    处理dirty card queue中的card,更新RSet。 此阶段完成后,RSet可以准确的反映老年代对所在的内存分段中对象的引用(指的新生代)。
    • dirty card queue: 对于应用程序的引用赋值语句object.field=object,JVM会在之前和之后执行特殊的操作以在dirty card queue中入队一个保存了对象引用信息的card。
    • 在年轻代回收的时候, G1会对Dirty Card Queue中所有的card进行处理,以更新RSet,保证RSet实时准确的反映引用关系。
    • 那为什么不在引用赋值语句处直接更新RSet呢?这是为了性能的需要,RSet的处理需要线程同步,开销会很大,使用队列性能会好很多。
  3. 处理RSet
    识别被老年代对象指向的Eden中的对象,这些被指向的Eden中的对象被认为是存活的对象。
  4. 复制对象
    此阶段,对象树被遍历,Eden区 内存段中存活的对象会被复制到Survivor区中空的内存分段,Survivor区内存段中存活的对象如果年龄未达阈值,年龄会加1,达到阀值会被会被复制到old区中空的内存分段。如果Survivor空间不够,Eden空间的 部分数据会直接晋升到老年代空间。
  5. 处理引用
    处理Soft,Weak, Phantom, Final, JNI Weak等引用。最终Eden空间的数据为空,GC停止工作,而目标内存中的对象都是连续存储的,没有碎片,所以复制过程可以达到内存整理的效果,减少碎片。
  • 年轻代GC + 并发标记
  1. 初始标记阶段:
    标记从根节点直接可达的对象。这个阶段是STW的,并且会触发一次Minor GC。
  2. 并发标记(Concurrent Marking):
    在整个堆中进行并发标记(和应用程序并发执行),此过程可能被young GC中断。在并发标记阶段,若发现区域对象中的所有对象都是垃圾,那这个区域会被立即回收。同时,并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
  3. 再次标记(Remark):
    由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了避免并发标记期间,因用户程序继续运作产生了新的对象而导致漏标(漏标会导致非垃圾对象被回收,这是不能接受的)。该阶段是STW的。G1中采用了比CMS更快的初始快照算法:snapshot一at一the一beginning (SATB)。
  4. 独占清理(cleanup,STW):
    计算各个区域的存活对象和GC回收比例,并进行排序,识别可以混合回收的区域。为下阶段做铺垫。是STW的。
    • 这个阶段并不会实际上去做垃圾的收集
  5. 并发清理阶段:
    识别并清理完全空闲的区域。
  • 混合回收
    当越来越多的对象晋升到老年代Oldregion时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即Mixed GC, 该算法并不是一个OldGC,除了回收整个Young Region,还会回收一部分的OldRegion。这里需要注意:是一部分老年代, 而不是全部老年代。可以选择哪些OldRegion进行收集,从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC并不是Full GC。

    • 并发标记结束以后,老年代中百分百为垃圾的内存分段被回收了,部分为垃圾的内存分段被计算了出来。默认情况下,这些老年代的内存分段会分8次(可以通过一XX: G1MixedGCCountTarget设置)被回收。
    • 混合回收的回收集(Collection Set) 包括八分之一的老年代内存分段,Eden区内存分段,Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样,只是回收集多了老年代的内存分段。具体过程请参考上面的年轻代回收过程。
    • 由于老年代中的内存分段默认分8次回收,G1会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的,越会被先回收。并且有一个阈值会决定内存分段是否被回收,一xX: G1MixedGCLiveThresholdPercent,默认为65%,意思是垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低,意味着存活的对象占比高,在复制的时候会花费更多的时间。
    • 混合回收并不一定要进行8次。有一个阈值一Xx: G1HeapWastePercent,默认值为10%,意思是允许整个堆内存中有10%的空间被浪费,意味着如果发现可以回收的垃圾占堆内存的比例低于10%,则不再进行混合回收。因为GC会花费很多的时间但是回收到的内存却很少。
  • Full GC

G1的初衷就是要避免Full GC的出现。但是如果上述方式不能正常工作,G1会停止应用程序的执行(Stop一 The一World),使用单线程的内存回收算法进行垃圾回收,性能会非常差,应用程序停顿时间会很长。
要避免Full GC的发生,一旦发生需要进行调整。什么时候会发生Full GC呢?比如堆内存太小,当G1在复制存活对象的时候没有空的内存分段可用,则会回退到full gc, 这种情况可以通过增大内存解决。
导致G1Full GC的原因可能有两个:

  1. Evacuation的时候没有足够的to一 space来存放晋升的对象;
  2. 并发处理过程完成之前空间耗尽。
  • 补充

从Oracle官方透露出来的信息可获知,回收阶段(Evacuation)其实.本也有想过设计成与用户程序一起并发执行,但这件事情做起来比较复杂,考虑到G1只是回收一部分Region, 停顿时间是用户可控制的,所以并不迫切去实现,而选择把这个特性放到了G1之后出现的低延迟垃圾收集器(即ZGC)中。另外,还考虑到G1不是仅仅面向低延迟,停顿用户线程能够最大幅度提高垃圾收集效率,为了保证吞吐量所以才选择了完全暂停用户线程的实现方案。

GC日志分析

常用GC参数

参数 描述
-XX:+PrintGC 输出GC日志。类似: -verbose:gc
-XX:+PrintGCDetails 输出GC的详细日志
-XX:+PrintGCTimeStamps 输出GC的时间戳(以基准时间的形式)
-XX:+PrintGCDateStamps 输出GC的时间戳(以日期的形式,如2013一05一04T21 : 53:59.234+0800 )
-XX:+PrintHeapAtGC 在进行GC的前后打印出堆的信息
-Xloggc:./logs/gc.log 日志文件的输出路径
  • -XX:+PrintGC

这个只会显示总的GC堆的变化, 例如:

  1. [GC Allocation Failure 80832K一>19298K227840K),0.0084018 secs]
  2. [GC Metadata GC Threshold 109499K一>21465K 228352K),0.0184066 secs]
  3. [Full GC Metadata GC Threshold 21 465K一>16716K 201728K),0.0619261 secs ]

参数解释:
GC、Full GC: GC的类型,GC只在新生代上进行,Full GC包括永生代,新生代, 老年代。
Allocation Failure: GC发生的原因。
80832K一> 19298K:堆在GC前的大小和GC后的大小。
228840k:现在的堆大小。
0.0084018 secs: GC持续的时间。

  • -XX:+PrintGCDetails
    配置参数:-verbose:gc -XX:+PrintGCDetaiis
    控制台输出示例:
    1. [GCAllocation Failure)[ PSYoungGen70640K一> 10116K141312K)] 80541K一>20017K 227328K),0.0172573 secs] [Times user=0.03 sys=0.00 real=0.02 secs ]
    2. [GC Metadata GC Threshold [PSYoungGen98859K一>8154K142336K ] 108760K一>21261K 228352K),0.0151573 secs] [Times user=0.00 sys=0.01 real=0.02 secs]
    3. [Full GCMetadata GC Threshold)[PSYoungGen 8154K一>0K142336K)] [ParOldGen 13107K一>16809K62464K ] 21261K一>16809K 204800K),[Metaspace 20599K一>20599K 1067008K ],0.0639732 secs] [Times user=0.14 sys=0.00 real=0.06 secs]
    参数解释:
    GC,Full FC:同样是GC的类型
    Allocation Failure: GC原因
    PSYoungGen:使用了Parallel Scavenge并行垃圾收集器的新生代GC前后大小的变化
    ParOldGen:使用了Parallel Old并行垃圾收集器的老年代Gc前后大小的变化
    Metaspace: 元数据区GC前后大小的变化,JDK1.8中引入了 元数据区以替代永久代
    xxx secs : 指GC花费的时间
    Times: user: 指的是垃圾收集器花费的所有CPU时间,sys: 花费在等待系统调用或系统事件的时间, real :GC从开始到结束的时间,包括其他进程占用时间片的实际时间。

Minor GC 和 FullGC 日志图解

lql.png
tyt.png

补充说明

  • “[GC”和”[Full GC”说明了这次垃圾收集的停顿类型,如果有”Full”则说明GC发生了”StopThe World”
  • 使用Serial收集器在新生代的名字是De fault New Generation, 因此显示的是” [DefNew”
  • 使用ParNew收集器在新生代的名字会变成” 【ParNew”,意思是”Parallel New Generation”
  • 使用Parallel Scavenge收 集器在新生代的名字是” 【PSYoungGen”
  • 老年代的收集和新生代道理一样,名字也是收集器决定的
  • 使用G1收集器的话,会显示为”garbage一 first heap”
  • Allocation Failure 表明本次引起GC的原因是因为在年轻代中没有足够的空间能够存储新的数据了。
  • [PSYoungGen: 5986K一>696K(8704K)] 5986K一> 704K (9216K) 中括号内: GC回收前年轻代大小,回收后大小,( 年轻代总大小) 括号外: GC回收前年轻代和老年代大小,回收后大小,( 年轻代和老年代总大小)
  • user代表用户态回收耗时,sys 内核态回收耗时, rea实际耗时。由于多核的原因,时间总和可能会超过real时间

常用的日志分析工具

可以用一些工具去分析这些gc日志。
常用的日志分析工具有: GCViewer、GCEasy、GCHisto、GCLogViewer 、Hpjmeter、garbagecat等

GC器展望

GC仍然处于飞速发展之中,目前的默认选项G1 GC在不断的进行改进,很多我们原来认为的缺点,例如串行的Full GC、Card Table扫描的低效等,都已经被大幅改进,例如,JDK 10以后,Fu1l GC已经是并行运行,在很多场景下,其表现还略优于Parallel GC的并行Full GC实现。

即使是Serial GC,虽然比较古老,但是简单的设计和实现未必就是过时的,它本身的开销,不管是GC相关数据结构的开销,还是线程的开销,都是非常小的,所以随着云计算的兴起,在Serverless等新的应用场景下,Serial GC找到了新的舞台。

比较不幸的是CMS GC, 因为其算法的理论缺陷等原因,虽然现在还有非常大的用户群体,但在JDK9中已经被标记为废弃,并在JDK14版本中移除。

⭐️ZGC

ZGC与Shenandoah目标高度相似,在尽可能对吞吐量影响不大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停顿时间限制在十毫秒以内的低延迟。

《深入理解Java虚拟机》一书中这样定义ZGC:

ZGC收集器是一款基于Region内存布局的,(暂时) 不设分代的,使用了读屏障、染色指针和内存多重映射等技术来实现可并发的标记一压缩算法的,以低延迟为首要目标的一款垃圾收集器。
ZGC的工作过程可以分为4个阶段:并发标记一并发预备重分配一并发重分配一并发重映射等。
ZGC几乎在所有地方并发执行的,除了初始标记的是sTW的。所以停顿时间.几乎就耗费在初始标记上,这部分的实际时间是非常少的。

在ZGC的强项停顿时间测试上,它毫不留情的将Parallel、G1拉开了两个数量级的差距。无论平均停顿、958停顿、998停顿、99. 98停顿,还是最大停顿时间,ZGC 都能毫不费劲控制在10毫秒以内。

Shenandoah GC

由Red Hat研发
Shenandoah GC的弱项:高运行负担下的吞吐量下降。
Shenandoah GC的强项:低延迟时间。

其他GC器

AliGC

AliGC是阿里巴巴JVM团队基于G1算法,面向大堆(LargeHeap)应用场景。测试数据显示,各方面对比G1都有稳步提升。

Zing

比较有名的低延迟GC