问题现象:

使用zabbix-agent2 5.0版本 监控进程,使用key为proc.num[,,,smartfoxserver] ,进程做的判断是最后一次获取的值等于0就告警,然后进程收到进程的告警,实际登录主机,进程确实存在。

登录zabbix最新数据查看,确实历史记录有很多获取进程数为0的
image.png

将zabbix-agent2日志调试等级设置DebugLevel=4,发现agent发送给zabbix-proxy就是0
image.png

而smartfoxserver进程,启动时间是7月27日,进程一直都在,zabbix-agent2 取值偶尔是0
image.png

这里猜测可能是zabbix-agent2的bug。

先暂时卸载zabbix-agent2,老实安装zabbix-agent

  1. #卸载zabbix-agent2,重新安装zabbix-agent
  2. yum remove zabbix-agent2
  3. rm -rf /etc/zabbix/zabbix_agent2.conf.rpmsave
  4. yum install zabbix-agent
  5. hostname=`hostname|sed 's/live/web/g'`
  6. cat > /etc/zabbix/zabbix_agentd.conf <<EOF
  7. PidFile=/var/run/zabbix/zabbix_agentd.pid
  8. LogFile=/var/log/zabbix/zabbix_agentd.log
  9. LogFileSize=0
  10. Server=192.168.0.215
  11. ServerActive=192.168.0.215
  12. Hostname=${hostname}
  13. Include=/etc/zabbix/zabbix_agentd.d/*.conf
  14. EOF
  15. systemctl restart zabbix-agent
  16. systemctl enable zabbix-agent
  17. systemctl status zabbix-agent

目前没有出现获取值为0的情况,待后续观察。
image.png

后续两周没有出现proc.num取值为0的问题。

问题已解决.

原因:

zabbix-agent2 proc.num存在bug。

解决方案:

使用zabbix-agent。抛弃zabbix-agent2