链接:https://www.pdai.tech/md/java/jvm/java-jvm-debug-tools-list.html
https://www.cnblogs.com/kongzhongqijing/articles/3630264.html

java 自带命令 查看当前jvm信息

1、jps

jps是jdk提供的一个查看当前java进程的小工具, 可以看做是JavaVirtual Machine Process Status Tool的缩写。 jps常用命令

  1. jps # 显示进程的ID 和 类的名称
  2. jps l # 输出输出完全的包名,应用主类名,jar的完全路径名
  3. jps v # 输出jvm参数
  4. jps q # 显示java进程号
  5. jps -m # main 方法
  6. jps -l xxx.xxx.xx.xx # 远程查看

2、jstack

jstack是jdk自带的线程堆栈分析工具,使用该命令可以查看或导出 Java 应用程序中线程堆栈信息。

  1. # 基本
  2. jstack 2815
  3. # java和native c/c++框架的所有栈信息
  4. jstack -m 2815
  5. # 额外的锁信息列表,查看是否死锁
  6. jstack -l 2815
  7. -l 长列表. 打印关于锁的附加信息,例如属于java.util.concurrent ownable synchronizers列表.
  8. -F 当’jstack [-l] pid’没有相应的时候强制打印栈信息
  9. -m 打印javanative c/c++框架的所有栈信息.
  10. -h | -help 打印帮助信息

3、jinfo

jinfo 是 JDK 自带的命令,可以用来查看正在运行的 java 应用程序的扩展参数,包括Java System属性和JVM命令行参数;也可以动态的修改正在运行的 JVM 一些参数。当系统崩溃时,jinfo可以从core文件里面知道崩溃的Java应用程序的配置信息

  1. # 输出当前 jvm 进程的全部参数和系统属性
  2. jinfo 2815
  3. # 输出所有的参数
  4. jinfo -flags 2815
  5. # 查看指定的 jvm 参数的值
  6. jinfo -flag PrintGC 2815
  7. # 开启/关闭指定的JVM参数
  8. jinfo -flag +PrintGC 2815
  9. # 设置flag的参数
  10. jinfo -flag name=value 2815
  11. # 输出当前 jvm 进行的全部的系统属性
  12. jinfo -sysprops 2815

4、jmap

命令jmap是一个多功能的命令。它可以生成 java 程序的 dump 文件, 也可以查看堆内对象示例的统计信息、查看 ClassLoader 的信息以及 finalizer 队列。

  1. # 查看堆的情况
  2. jmap -heap 2815
  3. # dump
  4. jmap -dump:live,format=b,file=/tmp/heap2.bin 2815
  5. jmap -dump:format=b,file=/tmp/heap3.bin 2815
  6. # 查看堆的占用
  7. jmap -histo 2815 | head -10
  8. no option 查看进程的内存映像信息,类似 Solaris pmap 命令。
  9. heap 显示Java堆详细信息
  10. histo[:live]: 显示堆中对象的统计信息
  11. clstats:打印类加载器信息
  12. finalizerinfo 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象
  13. dump:<dump-options>:生成堆转储快照
  14. F 当-dump没有响应时,使用-dump或者-histo参数. 在这个模式下,live子参数无效.
  15. help:打印帮助信息
  16. J<flag>:指定传递给运行jmapJVM的参数

5、jstat

  1. jstat -gcutil 2815 1000
  2. jstat -gcutil pid 1000:1 查询gc情况(每1秒钟打印一次gc情况)

2 Java 第三方调试工具

1、btrace

首当其冲的要说的是btrace。真是生产环境&预发的排查问题大杀器。 简介什么的就不说了。直接上代码干

查看当前谁调用了ArrayList的add方法,同时只打印当前ArrayList的size大于500的线程调用栈

  1. @OnMethod(clazz = "java.util.ArrayList", method="add", location = @Location(value = Kind.CALL, clazz = "/./", method = "/./"))
  2. public static void m(@ProbeClassName String probeClass, @ProbeMethodName String probeMethod, @TargetInstance Object instance, @TargetMethodOrField String method) {
  3. if(getInt(field("java.util.ArrayList", "size"), instance) > 479){
  4. println("check who ArrayList.add method:" + probeClass + "#" + probeMethod + ", method:" + method + ", size:" + getInt(field("java.util.ArrayList", "size"), instance));
  5. jstack();
  6. println();
  7. println("===========================");
  8. println();
  9. }
  10. }

监控当前服务方法被调用时返回的值以及请求的参数

  1. @OnMethod(clazz = "com.taobao.sellerhome.transfer.biz.impl.C2CApplyerServiceImpl", method="nav", location = @Location(value = Kind.RETURN))
  2. public static void mt(long userId, int current, int relation, String check, String redirectUrl, @Return AnyType result) {
  3. println("parameter# userId:" + userId + ", current:" + current + ", relation:" + relation + ", check:" + check + ", redirectUrl:" + redirectUrl + ", result:" + result);
  4. }

btrace 具体可以参考这里:https://github.com/btraceio/btrace
注意:

  • 经过观察,1.3.9的release输出不稳定,要多触发几次才能看到正确的结果
  • 正则表达式匹配trace类时范围一定要控制,否则极有可能出现跑满CPU导致应用卡死的情况
  • 由于是字节码注入的原理,想要应用恢复到正常情况,需要重启应用。

    2、Arthas

    是Alibaba开源的Java诊断工具
    具体看这里

jvm如何排查现场问题(内存溢出问题,线程池超出问题)

jstack -l pid > file.txt 可以查看线程,堆栈信息

比如死锁会引起cpu爆满

  1. Found one Java-level deadlock:
  2. =============================
  3. "t2":
  4. waiting to lock monitor 0x000000000359b868 (object 0x000000076c7953e8, a java.lang.Object),
  5. which is held by "t1"
  6. "t1":
  7. waiting to lock monitor 0x000000000359e0f8 (object 0x000000076c7953f8, a java.lang.Object),
  8. which is held by "t2"
  9. Java stack information for the threads listed above:
  10. ===================================================
  11. "t2":
  12. at jvm.DeadLockCheck.lambda$main$1(DeadLockCheck.java:32)
  13. - waiting to lock <0x000000076c7953e8> (a java.lang.Object)
  14. - locked <0x000000076c7953f8> (a java.lang.Object)
  15. at jvm.DeadLockCheck$$Lambda$2/1149319664.run(Unknown Source)
  16. at java.lang.Thread.run(Thread.java:745)
  17. "t1":
  18. at jvm.DeadLockCheck.lambda$main$0(DeadLockCheck.java:17)
  19. - waiting to lock <0x000000076c7953f8> (a java.lang.Object)
  20. - locked <0x000000076c7953e8> (a java.lang.Object)
  21. at jvm.DeadLockCheck$$Lambda$1/1023892928.run(Unknown Source)
  22. at java.lang.Thread.run(Thread.java:745)
  23. Found 1 deadlock.

jconsole也可以查看线程,和死锁

image.png

死循环问题:引起cpu爆满

第一步:top找到CPU使用率最高的进程pid 比如4481

第二步:对该进程下所有线程作监控:top -p pid -H top -p 4481 -H

三、想找出哪段代码占用了这么多资源,先将当前栈信息放入文件中:jstack 4481 > stack.log

四、在stack文件中找到pid=4485(即十六进制为1185)的栈信息,即可找到代码位置

内存占100%问题:

打印 堆信息:

jmap -heap pid

  1. D:\develop\workspace_idea\learn>jmap -heap 4700
  2. Attaching to process ID 4700, please wait...
  3. Debugger attached successfully.
  4. Server compiler detected.
  5. JVM version is 25.111-b14
  6. using thread-local object allocation.
  7. Parallel GC with 8 thread(s)
  8. Heap Configuration:
  9. MinHeapFreeRatio = 0
  10. MaxHeapFreeRatio = 100
  11. MaxHeapSize = 10485760 (10.0MB)
  12. NewSize = 3145728 (3.0MB)
  13. MaxNewSize = 3145728 (3.0MB)
  14. OldSize = 7340032 (7.0MB)
  15. NewRatio = 2
  16. SurvivorRatio = 8
  17. MetaspaceSize = 21807104 (20.796875MB)
  18. CompressedClassSpaceSize = 1073741824 (1024.0MB)
  19. MaxMetaspaceSize = 17592186044415 MB
  20. G1HeapRegionSize = 0 (0.0MB)
  21. Heap Usage:
  22. PS Young Generation
  23. Eden Space:
  24. capacity = 1048576 (1.0MB)
  25. used = 723736 (0.6902084350585938MB)
  26. free = 324840 (0.30979156494140625MB)
  27. 69.02084350585938% used
  28. From Space:
  29. capacity = 1048576 (1.0MB)
  30. used = 163840 (0.15625MB)
  31. free = 884736 (0.84375MB)
  32. 15.625% used
  33. To Space:
  34. capacity = 1048576 (1.0MB)
  35. used = 0 (0.0MB)
  36. free = 1048576 (1.0MB)
  37. 0.0% used
  38. PS Old Generation
  39. capacity = 7340032 (7.0MB)
  40. used = 2186328 (2.0850448608398438MB)
  41. free = 5153704 (4.914955139160156MB)
  42. 29.78635515485491% used

查看运行时各区域占比,youngc,fullgc次数

jstat -gcutil pid 1000

  1. D:\develop\workspace_idea\learn>jstat -gcutil 4700 1000
  2. S0 S1 E O M CCS YGC YGCT FGC FGCT GCT
  3. 6.25 0.00 79.48 30.79 92.61 86.55 18 0.027 1 0.025 0.052
  4. 6.25 0.00 79.48 30.79 92.61 86.55 18 0.027 1 0.025 0.052

综上:如果cpu爆满,大部分是死循环或者死锁问题,或者请求过多,创建线程过多,主要看栈信息。

如果内存爆满,主要看堆信息,以及垃圾回收。