诊断助手帮助用户快速直接分析异常指标,结合日志、指标、事件以及进程分析其异常根源

1. 日志分析

1)选择需要分析的异常机器、指标,并敲击回车键进行查询

2)默认查看指定机器上的“ERROR”“Exception”日志信息,亦可手动修改关键词查询日志

3)点击日志列表前的“+”,可查看完整日志信息

分析诊断 - 图1

2. 指标关联

1)选择“指标”一栏

2)故障拓扑图中可查看异常指标可能影响的上、下游服务

3)关联指标由平台根据机器学习算法,将平台收集的所有指标进行关联分析,筛选与异常指标走势呈正相关/负相关的指标,由关联关系,推断其潜在的因果关系。例如下图中,CPU使用率上升,可能是由SQLServer的异常连接引起的

分析诊断 - 图2

3. 事件关联

1)选择“事件”一栏

2)默认查看选中时间范围内的服务启动/关闭事件

3)帮助用户判断异常指标与事件之间的关系,以达到快速定位故障的目的

分析诊断 - 图3

4. 进程分析

1)选择“进程”一栏

2)默认查看选中时间范围内的指定机器上的进程信息

3)帮助用户判断异常指标与进程之间的关系,同时把握机器上的资源高消耗进程

分析诊断 - 图4