4.1 概述

给一个系统定位问题的时候,知识,经验是关键基础,数据是一句,工具是运用知识处理数据的手段,这里说的数据包括但不限于异常堆栈、虚拟机运行日志、垃圾收集器日志、线程快照(threaddump/javacore文件)、堆转存储快照(heap dump/hprof文件)等。恰当地使用虚拟机故障处理、分析的工具可以提升我们分许数据、定位并解决问题的效率。

4.2.1 jps:虚拟机进程状况工具

JDK的很多小工具的名字都参考了UNIX命令的命名方式,JPS(JVM Process status Tool)是其中的典型。
JPS 命令格式

jps [option] [hostid]

jps还可以通过RMI协议查询开启了RMI服务的远程虚拟机进程状态,参数hostid为RMI注册表中的注册的主机名。

选项 作用
-q 只输出LVMID,省略主类的名
-m 输出虚拟机进程启动时传递给主类main函数的参数
-l 输出主类的全名,如果进程执行的jar包,则输出jar路劲
-v 输出虚拟机启动时的JVM参数

4.2.2 jstat:虚拟机统计信息监视工具

jstat是用于监视虚拟机各种运行状态信息的命令行工具。它可以显示本地或远程虚拟机进程中的类加载,内存垃圾收集、即时编译器等运行时数据,在没有GUI图形化界面、只提供了纯文本控制台环境的服务器上,它将是运行期定位虚拟机性能问题的常用工具
jstat命令格式为

jstat [option vmid [interval[s|ms]] [count]]

参数interval和count代表查询间隔和次数,如果省略这2个参数,说明值查询一次,假设需要每250毫秒查询一次进行2764垃圾收集状况,,一共查询20次,命令是

jstat -gc 2764 250 20

选项option代表用户希望查询的虚拟机信息,主要分为三类:类加载、垃圾收集、运行期编译状况。

选项 作用
-class 监视类加载、卸载数量、总空间以及类装载所耗费的时间
-gc 监视Java堆状况,包括Eden区,2个Survivor区,老年代,永久代等的容量,已用空间、垃圾收集时间合计等信息
-gccapacity 监视内容与-gc基本相同,但输出主要关注java堆各个区域使用的最大最小空间
-gcutil 监视内容与-gc基本相同,但是输出主要关注以使用空间占总空间的百分比
-gccause 与-gcutil功能一样,但是会额外输出导致上一次垃圾收集产生的原因
-gcnew 监视新生代垃圾收集状况
-gcnewcapacity 监视内容与-gcnew基本相同,输出主要关注使用到的最大,最小空间
-gcold 监视老年代垃圾收集状况
-gcoldcapacity 监视内容与-gcold基本相同,输出主要关注使用到的最大、最小空间
-gcpermcapacity 输出永久代使用的最大最小空间
-compiler 输出即时编译器编译过的方法,耗时等信息
-printcompilation 输出已经被即使编译的方法

4.2.3 jinfo:Java配置信息工具

jinfo的作用是实时查看和调整虚拟机各项参数。使用jsp命令的-v参数可以查看虚拟机启动时显示制定的参数列表,但如果想知道未被显示执行的参数的系统默认值,除了去查资料之外,就只能用使用jinfo的-flag选项进行查询了。

4.2.4 jmap:Java内存映像工具

jmap命令用于生成堆转快照,如果不使用jmap命令,要想获取Java堆转快照也还有一种比较暴力的手段。譬如第2章中用过的-XX:+HeapDumpOnOutOfMemoryError参数,可以让虚拟机在内存溢出异常出现之后自动生成堆转存储快照文件,通过-XX:+HeapDumpOnCtrlBreak参数则可以使用Ctrl+Break让虚拟机机生成堆转存储快照文件,又或者在Linux系统下通过Kill -3命令发送进程退出信号“恐吓”一下虚拟机也能顺利拿到堆转储快照。

jmap的作用并不仅仅是为了获取堆转储快照,它还可以查询finalize执行队列,Java堆和方法区的详细信息,如空间使用率,当前用的是哪种收集器。
和jinfo命令一样,jmap有部分功能在window平台下是受限的,除了生成堆转储快照的dump选项和用于查看每个类的实例、空间占用统计的-histo选项在所有操作系统总都可以使用之外,其余选项都只能在linux/Solaris中使用。

4.2.6 jstack:Java堆栈跟踪工具

jstack(Stack Trace for java)命令用于生成虚拟机当前时刻的线程快照(一般称为threaddump或者javacore文件)。线程快照就是当前虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的目的通常是定位线程出现长时间停顿的原因,如线程间死锁,死循环、请求外部资源导致的长时间挂起等,都是导致线程长时间停顿的常见原因。线程出现停顿时通过jstack来查看各个线程的调用堆栈,就可以获知没有响应的线程到底在后台做些什么事情,或者等待什么资源。

选项 作用
-F 当正常输出的请求不被响应时,强制输出线程堆栈
-l 除堆栈外,显示关于锁的附加信息
-m 如果调用本地方法的话,显示C/C++的堆栈

4.3 可视化故障处理工具

https://visualvm.github.io/

4.3.2 JConsole:Java监视与管理控制台

BTrace的用途很广泛,打印调用堆栈、参数、返回值只是它最基础的使用形式,在它的网站上有
使用BTrace进行性能监视、定位连接泄漏、内存泄漏、解决多线程竞争问题等的使用案例,有兴趣的
读者可以去网上了解相关信息。