异常描述
作业平台-脚本执行,使用Agent管理方式的主机脚本执行失败,提示“Link agent error, Please try again later or contact the developer.”
版本:v1.3.6
异常平台:作业平台 功能模块:脚本执行
异常前操作:
- 管控平台中手工添加主机并加入纳管
异常截图
异常排查
- 检查主机纳管状态
检查主机是否正常纳管,如果手动安装的agent一定要执行纳管,待纳管状态正常后再进行脚本执行操作
- 检查平台与主机之间的联通情况
(1)进入管控平台,对要执行脚本的服务器进行联通测试,联通情况正常
(2)进入saltstack容器检查与主机之间的联通情况,正常
(3)进入主机检查与平台的联通情况,正常
(4)进入主机检查与平台4505、4506连接状态,正常连接
- 日志排查
日志文件:
/opt/opsany/saas/apps/logs/job/celery.log
/opt/opsany/saas/apps/logs/job/job.log
定时任务日志:/opt/opsany/saas/apps/logs/job/celery.log, 无异常
saas日志:/opt/opsany/saas/apps/logs/job/job.log
- 尝试重新安装agent并重新加入纳管,依旧不能执行。
- 请厂商协助,根据厂商提示,重启esb容器,重新尝试执行
- 厂商排查思路
(1)进入数据库查看数据是否正常:control.
(2)进入paasagent容器,重启control服务
(3)检查采控管理中的控制器与采集器状态是否均为正常
(4)检查日志是否有error信息,通过error信息排查错误
总结:
日志排查过程技巧
(1)尽量使用grep error xxx.log 的方式
(2)使用tail -f 查看实时日志