异常描述
作业平台-脚本执行,使用Agent管理方式的主机脚本执行失败,提示“Link agent error, Please try again later or contact the developer.”

版本:v1.3.6
异常平台:作业平台 功能模块:脚本执行
异常前操作:

  1. 管控平台中手工添加主机并加入纳管

异常截图image.png

异常排查

  1. 检查主机纳管状态

检查主机是否正常纳管,如果手动安装的agent一定要执行纳管,待纳管状态正常后再进行脚本执行操作

  1. 检查平台与主机之间的联通情况

(1)进入管控平台,对要执行脚本的服务器进行联通测试,联通情况正常
image.png
(2)进入saltstack容器检查与主机之间的联通情况,正常image.png
(3)进入主机检查与平台的联通情况,正常image.png
(4)进入主机检查与平台4505、4506连接状态,正常连接
image.png

  1. 日志排查

日志文件:
/opt/opsany/saas/apps/logs/job/celery.log
/opt/opsany/saas/apps/logs/job/job.log

定时任务日志:/opt/opsany/saas/apps/logs/job/celery.log, 无异常image.png
saas日志:/opt/opsany/saas/apps/logs/job/job.logimage.png

  1. 尝试重新安装agent并重新加入纳管,依旧不能执行。
  2. 请厂商协助,根据厂商提示,重启esb容器,重新尝试执行
  3. 厂商排查思路

(1)进入数据库查看数据是否正常:control.
(2)进入paasagent容器,重启control服务
(3)检查采控管理中的控制器与采集器状态是否均为正常
(4)检查日志是否有error信息,通过error信息排查错误


总结:

日志排查过程技巧
(1)尽量使用grep error xxx.log 的方式
(2)使用tail -f 查看实时日志