一、简介
Arthas 阿尔萨斯 , Alibaba开源的Java诊断工具,持JDK 6+,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。
[官方文档]
: https://alibaba.github.io/arthas/
[开源地址]
: https://github.com/alibaba/arthas/
[解决的问题点]
1、这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
2、我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
3、遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
4、线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
5、是否有一个全局视角来查看系统的运行状况?
6、有什么办法可以监控到JVM的实时运行状态?
二、安装
1、Arthas Install - JAR方式
[arthas-boot.jar 下载]
: wget https://alibaba.github.io/arthas/arthas-boot.jar
: java -jar arthas-boot.jar --repo-mirror aliyun --use-http // 阿里镜像下载
: wget https://arthas.gitee.io/arthas-boot.jar // gitee镜像
[Java -jar arthas-boot.jar 启动]
: java -jar arthas-boot.jar
[帮助]
: java -jar arthas-boot.jar -h
2、Arthas Install - Linux BASH脚本方式
[命令安装]
: curl -L https://alibaba.github.io/arthas/install.sh | sh
: curl -L https://arthas.gitee.io/install.sh | sh // gitee 镜像
[运行]
: ./as.sh
[帮助]
: ./as.sh -h
3、Arthas Install - 全量安装
[下载地址全量安装包]
[解压并启动]
: java -jar arthas-boot.jar
[帮助]
: java -jar arthas-boot.jar -h
arthas-packaging-3.0.5-bin.zip
arthas-demo.jar 测试程序案例,实现每隔一秒生成一个随机数,再执行质因式分解,并打印出分解结果。
三、基本测试和使用
1、启动 Arthas ,进入Arthas的命令交互环境
[启动]
: java -jar arthas-boot.jar
查找目标所在的进程 PID
启动Arthas ,启动JDK和目标启动的JDK必须一致 ,启动时使用和调试的目标程序启动相同的用户及权限
选择目录对应的程序 PID
2、Arthas 命令交互环境,输入对应命令进行交互调试
Arthas 命令列表,官方参考文档
1>. dashboard 命令 ,获取 当前系统的实时数据面板 ,动态刷新面板信息
[参数说明]
ID Java级别的线程ID,注意这个ID不能跟jstack中的nativeID一一对应
NAME 线程名
GROUP 线程组名
PRIORITY 线程优先级, 1~10之间的数字,越大表示优先级越高
STATE 线程的状态
CPU% 线程消耗的cpu占比, 采样100ms,将所有线程在这100ms内的cpu使用量求和, 再算出每个线程的cpu使用占比
TIME 线程运行总时间,数据格式为分:秒
INTERRUPTED 线程当前的中断位状态
DAEMON 是否是daemon线程
2>. Arthas 基本命令
[基础命令]
help——查看命令帮助信息
cls——清空当前屏幕区域
session——查看当前会话的信息
reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
version——输出当前目标 Java 进程所加载的 Arthas 版本号
history——打印命令历史
quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
shutdown——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
keymap——Arthas快捷键列表及自定义快捷键
[JVM相关命令]
dashboard——当前系统的实时数据面板
thread——查看当前 JVM 的线程堆栈信息
jvm——查看当前 JVM 的信息
sysprop——查看和修改JVM的系统属性
sysenv——查看JVM的环境变量
getstatic——查看类的静态属性
New! ognl——执行ognl表达式
[class/classloader相关]
sc——查看JVM已加载的类信息
sm——查看已加载类的方法信息
dump——dump 已加载类的 byte code 到特定目录
redefine——加载外部的.class文件,redefine到JVM里
jad——反编译指定已加载类的源码
classloader——查看classloader的继承树,urls,类加载信息,使用classloader去getResource
[monitor/watch/trace相关]
monitor——方法执行监控
watch——方法执行数据观测
trace——方法内部调用路径,并输出方法路径上的每个节点上耗时
stack——输出当前方法被调用的调用路径
tt——方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测
请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 shutdown 或将增强过的类执行 reset 命令
[options]
options——查看或设置Arthas全局开关
[管道]
Arthas支持使用管道对上述命令的结果进行进一步的处理
grep——搜索满足条件的结果
plaintext——将命令的结果去除ANSI颜色
wc——按行统计输出结果
[后台异步任务]
当线上出现偶发的问题,比如需要watch某个条件,而这个条件一天可能才会出现一次时
> 将结果重写向到日志文件,使用 & 指定命令是后台运行,session断开不影响任务执行(生命周期默认为1天)
jobs——列出所有job
kill——强制终止任务
fg——将暂停的任务拉到前台执行
bg——将暂停的任务放到后台执行