最近项目上由于BUG问题导致Tomcat程序在运行过程中经常内存泄漏,而本身监控系统之中没有更好的检测到Tomcat堆空间(Head Memory)的使用情况导致报警频发,这篇文章主要讲述,如何在Zabbix之中调用jmx监控服务器上Tomcat堆空间的使用情况并增加对应报警功能。

测试环境:
CentOS 6.8
Zabbix 2.4
Tomcat 7.0

实验前提默认是各位已经安装Zabbix Server服务器,并且至少有一台Zabbix agent服务器正常监控。关于如何搭建Zabbix监控集群,会有专门文章描述。

zabbix-java-gateway的工作机制

  • 首先我们需要配置我们的Tomcat服务启用监控服务,这个是默认不启用的
  • 之后需要在Zabbix的管理页面添加对应Tomcat服务器的jmx监控接口
  • 最后zabbix端会自动获取zabbix-java-gateway的数据并根据相应模板进行展
  • 工作流: [Zabbix-Server]—>(port:10053 on zabbix server)—> [zabbix-java-gateway] —(port:12345 on tomcatserver)—> [JMX enabled]

1. Install zabbix-java-gateway on Zabbix Server

因为我的zabbix是使用zabbix 2.4官方源安装,所以只需要用yum在安装即可:

  1. [root@6 ~]# sudo yum install -y zabbix-java-gateway

如果你没有官方源可能先安装该源,注意我的服务器zabbix版本是2.4 如果你是不同的版本,请到[这里]查找对应版本。

  1. # 查看zabbix server版本
  2. [root@6 ~]# zabbix_server --version
  3. Zabbix server v2.4.8 (revision 59539) (20 April 2016)
  4. Compilation time: May 4 2016 01:32:12

在使用yum安装zabbix-java-gateway源时,会自动关联安装openjdk,尽管这段程序没多大影响,如果你想保证系统JAVA环境不受到改变的话,可以在/etc/profile文件最后,增加如下内容:

  1. # add follows to the end
  2. export JAVA_HOME=/usr/java/default
  3. export PATH=$PATH:$JAVA_HOME/bin
  4. export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar

2. Confiure Tomcat host with enable jmx

首先在$tomcatdir/bin/catalina.sh文件开头处增加如下:

  1. #!/bin/sh
  2. CATALINA_OPTS="-Dcom.sun.management.jmxremote \
  3. -Dcom.sun.management.jmxremote.authenticate=false \
  4. -Dcom.sun.management.jmxremote.ssl=false \
  5. -Dcom.sun.management.jmxremote.port=12345"

然后,启动Tomcat,你会发现多了一个12345端口,这就是jmx的监听端口,请保证zabbix-java-gateway可以访问到这台服务器。

  1. [root@6 ~]# /tomcat7/bin/startup.sh
  2. Starting Tomcat7:
  3. Using CATALINA_BASE: /tomcat7
  4. Using CATALINA_HOME: /tomcat7
  5. Using CATALINA_TMPDIR: /tomcat7/temp
  6. Using JRE_HOME: /usr
  7. Using CLASSPATH: /tomcat7/bin/bootstrap.jar:/tomcat7/bin/tomcat-juli.jar
  8. Tomcat started.
  9. [root@6 ~]# netstat -ntlp | grep 12345
  10. tcp 0 0 :::12345 :::* LISTEN 8793/java
  11. [root@6 ~]#

这里疏忽了1个问题,如果您的zabbix server与agent端之间有防火墙规则,而按照我上面的所述只是增加了12345这个端口,那么很可能,您在/var/log/zabbix/zabbix_java_gateway.log 中会看到“No route to host”的报错,这是因为JMX不光开启了12345端口,还开启了另外两个随机端口,而在获取监控数据时会使用到其中一个,这就导致了无法通过固定的防火墙规则来开放该端口。其实有另外一个替代方式来使该监听端口固定下来——使用Tomcat提供的额外组件 catalina-jmx-remote.jar,这个组件是需要另外下载的:

  1. # 查看当前Tomcat版本.
  2. [root@6 bin]# ./catalina.sh version
  3. Using CATALINA_BASE: /tomcat7
  4. Using CATALINA_HOME: /tomcat7
  5. Using CATALINA_TMPDIR: /tomcat7/temp
  6. Using JRE_HOME: /usr
  7. Using CLASSPATH: /tomcat7/bin/bootstrap.jar:/tomcat7/bin/tomcat-juli.jar
  8. Server version: Apache Tomcat/7.0.64
  9. Server built: Aug 19 2015 17:18:06 UTC
  10. Server number: 7.0.64.0
  11. OS Name: Linux
  12. OS Version: 2.6.32-642.11.1.el6.x86_64
  13. Architecture: amd64
  14. JVM Version: 1.8.0_111-b15
  15. JVM Vendor: Oracle Corporation
  16. # 下载 catalina-jmx-remote.jar # 请注意下载版本不要高于当前tomcat版本.
  17. wget http://mirror.bit.edu.cn/apache/tomcat/tomcat-7/v7.0.57/bin/extras/catalina-jmx-remote.jar -O lib/catalina-jmx-remote.jar

增加如下内容,在conf/server.xml中:

  1. <Listener className="org.apache.catalina.mbeans.JmxRemoteLifecycleListener"
  2. rmiRegistryPortPlatform="12345" rmiServerPortPlatform="12346" />

因为我们已经在conf/server.xml定义了rmiRegistryPortPlatform,所以要将bin/catalina.sh中CATALINA_OPTS的com.sun.management.jmxremote.port去掉,否则会因为jmxremote.port配置有优先级更高而导致配置失效。

  1. CATALINA_OPTS="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false"

完成之后,重启tomcat这时会发现jmx默认端口已经固定为12345何12346,而server依然可以正常获取监控数据.


Option: JavaGatewayPort

Port that Zabbix Java gateway listens on.

Mandatory: no

Range: 1024-32767

Default:

JavaGatewayPort=10053 # 设置服务端监听接口

Option: StartJavaPollers

Number of pre-forked instances of Java pollers.

Mandatory: no

Range: 0-1000

Default:

StartJavaPollers=5 # 设置多线程启动

  1. 然后修改zabbix\_java\_gateway.conf 配置如下:

Option: zabbix.listenIP

IP address to listen on.

Mandatory: no

Default:

LISTEN_IP=”10.211.55.4” # 配置监听IP

Option: zabbix.listenPort

Port to listen on.

Mandatory: no

Range: 1024-32767

Default:

LISTEN_PORT=10053 # 配置监听端口

Option: zabbix.pidFile

Name of PID file.

If omitted, Zabbix Java Gateway is started as a console application.

Mandatory: no

Default:

PID_FILE=

PID_FILE=”/var/run/zabbix/zabbix_java.pid”

Option: zabbix.startPollers

Number of worker threads to start.

Mandatory: no

Range: 1-1000

Default:

不能大于zabbix_server.conf的值,否则可能导致当连接Java gateway时没有多余的线程进行处理

START_POLLERS=5

  1. 最后启动启动zabbix-java-gateway,并重启zabbix-server

[root@6 ~]# service zabbix-java-gateway start
Starting zabbix java gateway: [ OK ]
[root@6 ~]# service zabbix-server restart
Stopping zabbix server: [ OK ]
Starting zabbix server: [ OK ]

  1. 我在尝试重启发现一问题,zabbix-java-gateway通过service命令管理stop不能删除pid文件导致服务无法启动,如果你也碰到,解决办法如下:

[root@6 zabbix]# vim /etc/rc.d/init.d/zabbix-java-gateway

line 97, 注释修改为如下:

kill cat $PID_FILE && rm $PID_FILE

  1. rm -f $PID_FILE
  1. #### 4. Adding jmx host on Zabbix Web consloe
  2. 首先,上传Template Tomcat Head Memory模板,这个我做了一个简单的模板,只针对了堆内存空间的监控,并针对使用率超过60%以及80%,不同的警报。需要的同学可以直接从我这里下载,然后在Configuration-Templates导入到zabbix模板库内。
  3. 下载请点击:[Template App Tomcat Head Memory](https://samzong.oss-cn-shenzhen.aliyuncs.com/2016/12/zbx_template_app_tomcat_head_memory.xml)
  4. 然后,增加服务器的jmx监控
  5. ![](https://samzong.oss-cn-shenzhen.aliyuncs.com/2016/12/zabbix-jmx-settings.png)
  6. 关联模板
  7. ![](https://samzong.oss-cn-shenzhen.aliyuncs.com/2016/12/zabbix-host-select-template.png)
  8. #### 5. View the Head Memory Monitoring.
  9. ![](https://samzong.oss-cn-shenzhen.aliyuncs.com/2016/12/zabbix-view-monitor.png)