介绍

有一个任务执行系统是一个典型的生产者消费者模型,生产者提交任务,消费者定时从MySQL提取对应的任务。
生产者A: web给大家提交任务
节点B: 处理某些任务
节点C: 处理某些任务
maven节点D: 处理jar包上传过程中,保存jar包,由节点C ssh到这台机器执行脚本

B,C 处理的是不同类型的任务

背景

今天有一个同志提交的一个deploy jar包的任务在执行的时候出现了ssh connect超时的情况。我到系统一看确实只有2个节点,我手动到节点C执行ssh跳转到节点D是正常的。

处理

于是手动又提交了3次任务,发现一次正常,2次不正常,正常执行的可以在节点C查看日志,不正常的不见了。怀疑存在第三个节点取走了任务,但是系统又不存在。只能通过 show processlist 查看有哪些机器连了这个库。

image.png