链接:https://www.pdai.tech/md/java/jvm/java-jvm-debug-tools-list.html
https://www.cnblogs.com/kongzhongqijing/articles/3630264.html
java 自带命令 查看当前jvm信息
1、jps
jps是jdk提供的一个查看当前java进程的小工具, 可以看做是JavaVirtual Machine Process Status Tool的缩写。 jps常用命令
jps # 显示进程的ID 和 类的名称jps –l # 输出输出完全的包名,应用主类名,jar的完全路径名jps –v # 输出jvm参数jps –q # 显示java进程号jps -m # main 方法jps -l xxx.xxx.xx.xx # 远程查看
2、jstack
jstack是jdk自带的线程堆栈分析工具,使用该命令可以查看或导出 Java 应用程序中线程堆栈信息。
# 基本jstack 2815# java和native c/c++框架的所有栈信息jstack -m 2815# 额外的锁信息列表,查看是否死锁jstack -l 2815-l 长列表. 打印关于锁的附加信息,例如属于java.util.concurrent 的 ownable synchronizers列表.-F 当’jstack [-l] pid’没有相应的时候强制打印栈信息-m 打印java和native c/c++框架的所有栈信息.-h | -help 打印帮助信息
3、jinfo
jinfo 是 JDK 自带的命令,可以用来查看正在运行的 java 应用程序的扩展参数,包括Java System属性和JVM命令行参数;也可以动态的修改正在运行的 JVM 一些参数。当系统崩溃时,jinfo可以从core文件里面知道崩溃的Java应用程序的配置信息
# 输出当前 jvm 进程的全部参数和系统属性jinfo 2815# 输出所有的参数jinfo -flags 2815# 查看指定的 jvm 参数的值jinfo -flag PrintGC 2815# 开启/关闭指定的JVM参数jinfo -flag +PrintGC 2815# 设置flag的参数jinfo -flag name=value 2815# 输出当前 jvm 进行的全部的系统属性jinfo -sysprops 2815
4、jmap
命令jmap是一个多功能的命令。它可以生成 java 程序的 dump 文件, 也可以查看堆内对象示例的统计信息、查看 ClassLoader 的信息以及 finalizer 队列。
# 查看堆的情况jmap -heap 2815# dumpjmap -dump:live,format=b,file=/tmp/heap2.bin 2815jmap -dump:format=b,file=/tmp/heap3.bin 2815# 查看堆的占用jmap -histo 2815 | head -10no option: 查看进程的内存映像信息,类似 Solaris pmap 命令。heap: 显示Java堆详细信息histo[:live]: 显示堆中对象的统计信息clstats:打印类加载器信息finalizerinfo: 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象dump:<dump-options>:生成堆转储快照F: 当-dump没有响应时,使用-dump或者-histo参数. 在这个模式下,live子参数无效.help:打印帮助信息J<flag>:指定传递给运行jmap的JVM的参数
5、jstat
jstat -gcutil 2815 1000jstat -gcutil pid 1000:1 查询gc情况(每1秒钟打印一次gc情况)
2 Java 第三方调试工具
1、btrace
首当其冲的要说的是btrace。真是生产环境&预发的排查问题大杀器。 简介什么的就不说了。直接上代码干
查看当前谁调用了ArrayList的add方法,同时只打印当前ArrayList的size大于500的线程调用栈
@OnMethod(clazz = "java.util.ArrayList", method="add", location = @Location(value = Kind.CALL, clazz = "/./", method = "/./"))public static void m(@ProbeClassName String probeClass, @ProbeMethodName String probeMethod, @TargetInstance Object instance, @TargetMethodOrField String method) {if(getInt(field("java.util.ArrayList", "size"), instance) > 479){println("check who ArrayList.add method:" + probeClass + "#" + probeMethod + ", method:" + method + ", size:" + getInt(field("java.util.ArrayList", "size"), instance));jstack();println();println("===========================");println();}}
监控当前服务方法被调用时返回的值以及请求的参数
@OnMethod(clazz = "com.taobao.sellerhome.transfer.biz.impl.C2CApplyerServiceImpl", method="nav", location = @Location(value = Kind.RETURN))public static void mt(long userId, int current, int relation, String check, String redirectUrl, @Return AnyType result) {println("parameter# userId:" + userId + ", current:" + current + ", relation:" + relation + ", check:" + check + ", redirectUrl:" + redirectUrl + ", result:" + result);}
btrace 具体可以参考这里:https://github.com/btraceio/btrace
注意:
- 经过观察,1.3.9的release输出不稳定,要多触发几次才能看到正确的结果
- 正则表达式匹配trace类时范围一定要控制,否则极有可能出现跑满CPU导致应用卡死的情况
- 由于是字节码注入的原理,想要应用恢复到正常情况,需要重启应用。
2、Arthas
是Alibaba开源的Java诊断工具
具体看这里
jvm如何排查现场问题(内存溢出问题,线程池超出问题)
jstack -l pid > file.txt 可以查看线程,堆栈信息
比如死锁会引起cpu爆满
Found one Java-level deadlock:============================="t2":waiting to lock monitor 0x000000000359b868 (object 0x000000076c7953e8, a java.lang.Object),which is held by "t1""t1":waiting to lock monitor 0x000000000359e0f8 (object 0x000000076c7953f8, a java.lang.Object),which is held by "t2"Java stack information for the threads listed above:==================================================="t2":at jvm.DeadLockCheck.lambda$main$1(DeadLockCheck.java:32)- waiting to lock <0x000000076c7953e8> (a java.lang.Object)- locked <0x000000076c7953f8> (a java.lang.Object)at jvm.DeadLockCheck$$Lambda$2/1149319664.run(Unknown Source)at java.lang.Thread.run(Thread.java:745)"t1":at jvm.DeadLockCheck.lambda$main$0(DeadLockCheck.java:17)- waiting to lock <0x000000076c7953f8> (a java.lang.Object)- locked <0x000000076c7953e8> (a java.lang.Object)at jvm.DeadLockCheck$$Lambda$1/1023892928.run(Unknown Source)at java.lang.Thread.run(Thread.java:745)Found 1 deadlock.
jconsole也可以查看线程,和死锁

死循环问题:引起cpu爆满
第一步:top找到CPU使用率最高的进程pid 比如4481
第二步:对该进程下所有线程作监控:top -p pid -H top -p 4481 -H
三、想找出哪段代码占用了这么多资源,先将当前栈信息放入文件中:jstack 4481 > stack.log
四、在stack文件中找到pid=4485(即十六进制为1185)的栈信息,即可找到代码位置
内存占100%问题:
打印 堆信息:
jmap -heap pid
D:\develop\workspace_idea\learn>jmap -heap 4700Attaching to process ID 4700, please wait...Debugger attached successfully.Server compiler detected.JVM version is 25.111-b14using thread-local object allocation.Parallel GC with 8 thread(s)Heap Configuration:MinHeapFreeRatio = 0MaxHeapFreeRatio = 100MaxHeapSize = 10485760 (10.0MB)NewSize = 3145728 (3.0MB)MaxNewSize = 3145728 (3.0MB)OldSize = 7340032 (7.0MB)NewRatio = 2SurvivorRatio = 8MetaspaceSize = 21807104 (20.796875MB)CompressedClassSpaceSize = 1073741824 (1024.0MB)MaxMetaspaceSize = 17592186044415 MBG1HeapRegionSize = 0 (0.0MB)Heap Usage:PS Young GenerationEden Space:capacity = 1048576 (1.0MB)used = 723736 (0.6902084350585938MB)free = 324840 (0.30979156494140625MB)69.02084350585938% usedFrom Space:capacity = 1048576 (1.0MB)used = 163840 (0.15625MB)free = 884736 (0.84375MB)15.625% usedTo Space:capacity = 1048576 (1.0MB)used = 0 (0.0MB)free = 1048576 (1.0MB)0.0% usedPS Old Generationcapacity = 7340032 (7.0MB)used = 2186328 (2.0850448608398438MB)free = 5153704 (4.914955139160156MB)29.78635515485491% used
查看运行时各区域占比,youngc,fullgc次数
jstat -gcutil pid 1000
D:\develop\workspace_idea\learn>jstat -gcutil 4700 1000S0 S1 E O M CCS YGC YGCT FGC FGCT GCT6.25 0.00 79.48 30.79 92.61 86.55 18 0.027 1 0.025 0.0526.25 0.00 79.48 30.79 92.61 86.55 18 0.027 1 0.025 0.052
综上:如果cpu爆满,大部分是死循环或者死锁问题,或者请求过多,创建线程过多,主要看栈信息。
如果内存爆满,主要看堆信息,以及垃圾回收。
