学习目标:

  • 能够实现一个web页面的监测
  • 能够实现自动发现远程linux主机
  • 能够通过动作在发现主机后自动添加主机并链接模板
  • 能够创建一个模版并添加相应的元素(监控项,图形,触发器等)
  • 能够将主机或模板的配置实现导出和导入
  • 能够实现至少一种报警方式(邮件,微信等)
  • 能够通过zabbix_proxy来实现监控

web监测

web监测:类似一个监控项,可以对一个url页面进行监测(监测它的状态码,页面匹配的字符串,响应时间,下载速度等)

web监测可以创建一个场景,并包含几个步骤

下面来做个例子(监测agent1的httpd的主页)

1, web管理界面--》配置--》主机--》web监测(选agent1的web监测)--》右上角点创建web场景

web监测.png

2,再点步骤,填上名称与监测的URL(你可以添加多个步骤,我这里只加这一个)

web监测2.png

3,继续在步骤界面的最下面填上200状态码,然后点添加,出来后再点添加

web监测3.png

4,创建完后,去下图中查看验证

  • 如果看到是连接失败,则表示agent1的httpd没有启动
  • 如果是404错误,则表示服务启动了,但找不到主页

web监测4.png

5, 去agent1上安装httpd,并做一个主页,再重启服务

  1. [root@agent1 ~]# yum install httpd httpd-devel
  2. [root@agent1 ~]# echo "agent1 主页" > /var/www/html/index.html
  3. [root@agent1 ~]# systemctl restart httpd
  4. [root@agent1 ~]# systemctl enable httpd

6,再去查看验证

web监测5.png

练习:

  1. 为上面的web监测创建一个图形
  2. 为上面的web监测创建一个触发器,状态码不为200就触发(选监控项的时候要注意看清楚,一个web监测会产生好几个小的监控项,选状态码的那一个)

自动发现与动作

发现:假设我现在需要添加监控100台主机,这个工作量有点大。所以我可以把这100台连好网络,配置并启动好zabbix-agent服务。然后在zabbix server上配置一个自动发现规则,自动发现这100台主机。

自动发现是由服务端主动发起,Zabbix Server开启发现进程,定时扫描网络中符合条件的主机。

动作:自动发现了这100台主机,但是还要添加监控主机和链接模板啊。这时可以通过动作来达到此目的。

咱们前面早就准备了一台agent2,一直还没使用,这里就尝试自动发现这台agent2。

1,在agent2上安装zabbix-agent包

  1. [root@agent2 ~]# yum install zabbix-agent

2,配置zabbix-agent端的配置文件,启动服务并做成开机自动启动

  1. [root@agent2 ~]# vim /etc/zabbix/zabbix_agentd.conf
  2. 97 Server=10.1.1.11 修改成zabbix监控服务器的IP
  3. [root@agent2 ~]# systemctl restart zabbix-agent
  4. [root@agent2 ~]# systemctl enable zabbix-agent
  5. [root@agent2 ~]# lsof -i:10050

思考: 如果100台服务器都要装系统,然后再做上面两步,也挺累的。用什么方法来做更高效?

答: 安装系统可以使用pxe(kickstart)或cobbler.安装软件,修改配置可以使用cobbler的postscript,再或者使用ansible,saltstack这种软件。

3, web管理界面--》配置--》自动发现

自动发现1.png
自动发现2.png

自动发现3.png

4, 自动发现规则启用后,按下图显示的去验证

自动发现4.png

5,发现了agent2,但有一个问题,并没有把agent添加到监控的主机列表中,如下图所示
自动发现5.png

6,通过动作,将发现的主机添加到监控主机列表,并加上监控模板。

web管理界面--》配置--》动作--》右上角事件源选自动发现--》有一个叫Auto discovery. Linux servers的动作,直接启用就好
自动发现6.png

7, 再次验证就OK了(这里等待比较久,你也可以尝试把自动发现规则关闭一下,再次打开)
自动发现7.png

课外拓展: 自动注册

自动注册: 与自动发现实现的功能相同,区别在于自动发现是由zabbixserver去发现被监控机器。而自动注册是由被监控机器去找zabbixserver注册。

请问: 如果有大量的被监控机器,哪一种方式性能更好?

小结: 生产环境的自动化思路

  • cobbler自动安装系统和系统初始化
  • ansible实现配置自动化
  • 自动发现加动作实现自动监控与模板链接

模板

模板(template): 就是包括监控项,应用集,触发器,图形,聚合图形,自动发现规则,web监测等的一组实体。

使用模板可以方便链接到主机,更改模板也会将更改应用到所有链接的主机。

参考: https://www.zabbix.com/documentation/3.4/zh/manual/config/templates

web管理界面--》配置--》模板--》创建模板

创建模板1.png

创建模板2.png

创建模板3.png

导入导出

辛辛苦苦配置了一个模板或一个主机,我想给另一台zabbix服务器使用或者我想保存下来,如何实现?

导入导出可以帮你轻松实现,导出的是xml格式文件.

目的:

  • 备份防止误删除
  • 将一台zabbix的模板配置迁移到另一台zabbix服务器

配置--》主机--》选取要导出的主机(前面打勾)--》下面选择导出
导出主机.png

配置--》模版--》选取要导出的模版(前面打勾)--》下面选择导出

模板导出.png

配置--》主机--》右上角导入

主机导入.png

配置--》模板--》右上角导入

模板导入.png
练习: 导入导出练习

  1. 把本机的一个模版删除
  2. 然后从同桌的zabbix服务器那导出成xml文件,并拷贝过来导入(里面有IP参数的要记得修改相应的IP)

报警

zabbix的报警媒介支持email,jabber,sms(短信),微信,电话语音等。

报警原理图.png

告警平台申请

自己配置报警比较复杂,而且邮件容易被拒或当做垃圾邮件。有些专业的报警平台就可以帮你简单实现。

如:onealeart 参考:http://www.onealert.com/

请先申请一个账号,绑定邮箱,手机,微信等。

登录进去后,按如下图示操作
onealert新版-1.png

告警平台增加zabbix应用

onealert新版-2.png
onealert新版-3.png

onealert新版-4.png

在zabbixserver安装告警平台agent

onealert新版-5.png

  1. 按照它的提示,进行安装
  2. [root@zabbixserver ~]# cd /usr/lib/zabbix/alertscripts
  3. [root@zabbixserver alertscripts]# wget https://download.aiops.com/ca_agent/zabbix/ca_zabbix_relea se-2.1.0.tar.gz
  4. [root@zabbixserver alertscripts]# tar xf ca_zabbix_release-2.1.0.tar.gz
  5. [root@zabbixserver alertscripts]# cd cloudalert/bin/
  6. [root@zabbixserver bin]# bash install.sh 2842d6d7-f7a1-fb97-254d-9be972403dd0
  7. start to create config file...
  8. Zabbix管理地址: http://10.1.1.11/zabbix
  9. Zabbix管理员账号: admin
  10. Zabbix管理员密码:
  11. ......

验证安装

配置完onealert后,我们可以验证下它安装后到底对zabbix做了啥。简单来说,它做了三件事:

  1. 增加了一个报警媒介类型
  2. 增加了一个用户和一个用户组用于报警
  3. 增加了一个报警动作

onealert新版-6.png

onealert新版-7.png
onealert新版-8.png

配置通知策略

onealert新版-9.png

触发器触发告警

我们这里以前面都定义过的”agent1远程登录用户数”来测试报警,当agent1远程登录用户数大于20个就会触发器,然后报警。(注意:请在测试前先把agent1的登录用户数调整到20个以下)

验证: 将agent1远程登录用户数调整成大于20个,让触发器触发,也会触发报警。

onealert新版-10.png

zabbix proxy

参考网址: https://www.zabbix.com/documentation/3.4/zh/manual/distributed_monitoring/proxies

zabbix proxy的应用场景

应用场景1: 跨内外网监控

当zabbix server与被监控机器不在同一个机房时,跨公网监控会很麻烦, 也会带来安全隐患(比如有防火墙的情况,需要防火墙开放的端口增多。而且像mysql数据库这类应用是不适合直接被公网连接的)

zabbix_proxy.png

应用场景2: 分布式监控

当监控机主机特别多,甚至分散在不同的地域机房。这个时候zabbix server压力很大,所以可以通过增加zabbix proxy来代理收集每个机房里的主机信息,再统一给zabbix server.

分布式监控图.png

zabbix proxy的两个主要应用场景总结:

  1. 分布式监控,为zabbix server分担压力
  2. zabbix server监控有防火墙的内网各服务器时,需要防火墙开放各个端口。使用zabbix proxy在内网统一监控,然后与zabbix server通过公网连接,此时防火墙只需要开放zabbix server与zabbix proxy的连接就可以了。

案例环境准备

我这里把原来的agent2用来模拟zabbixproxy

  1. 先在zabbix的web管理界面把agent2的配置删除(并把先前做的自动发现规则禁用,报警也禁用)
  2. 把agent2主机名改成zabbixproxy.cluster.com并且三台重新绑定/etc/hosts
  1. # hostnamectl set-hostname --static zabbixproxy.cluster.com
  2. # vim /etc/hosts
  3. 10.1.1.11 zabbixserver.cluster.com
  4. 10.1.1.12 agent1.cluster.com
  5. 10.1.1.13 zabbixproxy.cluster.com
  1. 把zabbixproxy上的zabbix-agent服务先停一下
  1. [root@zabbixproxy ~]# systemctl stop zabbix-agent

zabbix_proxy实验图.png

案例实现过程

  1. 在zabbixproxy上安装相关软件包
  1. [root@zabbixproxy ~]# yum install mariadb-server zabbix-proxy-mysql zabbix-agent

2,启动数据库,授权并导入数据

  1. [root@zabbixproxy ~]# systemctl restart mariadb
  2. [root@zabbixproxy ~]# systemctl enable mariadb
  3. [root@zabbixproxy ~]# mysql
  4. MariaDB [(none)]> create database zabbix_proxy default charset utf8;
  5. MariaDB [(none)]> grant all privileges on zabbix_proxy.* to 'zabbix'@'localhost' identified by '123';
  6. MariaDB [(none)]> flush privileges;
  7. [root@zabbixproxy ~]# zcat /usr/share/doc/zabbix-proxy-mysql-3.4.15/schema.sql.gz |mysql zabbix_proxy -u zabbix -p123

3, 修改zabbix_proxy上的配置文件,并重启服务

  1. [root@zabbixproxy ~]# vim /etc/zabbix/zabbix_proxy.conf
  2. 13 ProxyMode=0 主动模式
  3. 24 Server=10.1.1.11 zabbix_serverip
  4. 43 Hostname=zabbixproxy.cluster.com 这个名字和你的主机名还有后面在web界面配置代理的名字保持一致
  5. 156 DBHost=localhost
  6. 167 DBName=zabbix_proxy
  7. 182 DBUser=zabbix
  8. 190 DBPassword=123 打开注释,并写上密码(与前面授权一致)
  9. 244 ConfigFrequency=60 主动模式下zabbix_proxy多久从zabbix_server接收一次配置数据
  10. 253 DataSenderFrequency=5 主动模式下zabbix_proxy多久发送一次收集的数据给zabbixserver
  11. [root@zabbixproxy ~]# systemctl restart zabbix-proxy
  12. [root@zabbixproxy ~]# systemctl enable zabbix-proxy

4, 如果zabbix_server也要监控zabbix_proxy的话,那么可以使用zabbix_proxy来代理自己(可选步骤)

  1. [root@zabbixproxy ~]# vim /etc/zabbix/zabbix_agentd.conf
  2. 97 Server=10.1.1.13
  3. 138 ServerActive=10.1.1.13 自己代理自己,所以IPzabbix_proxyip
  4. 149 Hostname=zabbixproxy.cluster.com
  5. [root@zabbixproxy ~]# systemctl restart zabbix-agent
  6. [root@zabbixproxy ~]# systemctl enable zabbix-agent

5, 修改agent1上的服务并重启服务

  1. 把服务器的ip改成zabbix_proxyip,而不是zabbix_serverip
  2. [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf
  3. 97 Server=10.1.1.13 agent的被动模式
  4. 138 ServerActive=10.1.1.13 agent的主动模式
  5. 149 Hostname=agent1.cluster.com agent的主动模式必须要加主机名
  6. [root@agent1 ~]# systemctl restart zabbix-agent

6, 回到zabbix server的web管理界面创建主机,添加代理服务器为一台主机

zabbix_proxy1.png

7, 增加代理, 代理自己和agent1

zabbix_proxy2.png

zabbix_proxy3.png

zabbix_proxy4.png

8, 验证测试

在agent1上找一个监控项做改变(比如登录用户数),然后在zabbix_server的图形界面能看到这个改变,说明proxy成功.

主动监控和被动监控(拓展)

主动与被动.png

agent被动模式

相对于agent的被动,也就是表示是server或proxy去找agent拿数据(这也是zabbix server的默认模式)

配置方法如下:

  1. agent端配置被动模式的参数如下
  2. [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf
  3. Server=10.1.1.13 IPzabbix_proxyip(如果没有proxy,则直接为zabbix_serverip)
  4. [root@agent1 ~]# systemctl restart zabbix-agent

agent主动模式

相对于agent的主动,也就是表示是agent主动把数据传给server或proxy

agent主动模式的优点是: 当agent太多的情况下,server或proxy去找这么多agent搜集数据,压力负载过大。用主动模式就可以缓解server或proxy的压力。

但用主动模式的问题是: 监控项也要转为主动式才行,而且很多zabbix自带模板里的监控项不支持转为主动式.

  1. agent端配置主动模式的参数如下
  2. [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf
  3. Serveractive=10.1.1.13 IPzabbix_proxyip(如果没有proxy,则直接为zabbix_serverip)
  4. [root@agent1 ~]# systemctl restart zabbix-agent

主动与被动2.png
主动与被动3.png

主动与被动4.png

主动与被动5.png

验证测试:

在agent1上把登录用户数再次调整,然后在zabbix_server的图形界面能看到这个改变,说明主动监控成功.

proxy主动模式

zabbix_proxy主动发数据给zabbix_server(proxy的默认模式)

  1. # vim /etc/zabbix/zabbix_proxy.conf
  2. ProxyMode=0 --此参数为0表示proxy主动模式

proxy被动模式

zabbix_server找zabbix_proxy为收集数据

  1. # vim /etc/zabbix/zabbix_proxy.conf
  2. ProxyMode=1 --此参数为1表示proxy主动模式

场景

场景: 公司大概十几台服务器(主要是lnmp环境),现在需要你来设计并使用zabbix监控它们,并且要考虑以后的扩展,尽量使用自动的方式实现.

传智要做一个宣传网站—》1台—> 架构(高可用,负载均衡)—》监控(安装监控软件并连接) —》按需求设置监控模板—》 因公司发展,业务增长,服务器增加,我们得基础扩展监控模板 ——-》公司再发展,有多个机房,我们要实现分布式监控+自动注册+主动被动模式的优化

操作的大概步骤:

  1. 创建管理用户并配置报警策略
  2. 创建模版
  3. 在模版里加应用集与监控项
  4. 自定义配置每一个监控项(如要监测cpu,mem,io,disk use等等)
  5. 为相应的监控项创建图形,有些监控项可以多个合成一个图形,也有些监控项(如返回的字符串这种)无法创建图形
  6. 为相应的监控项设置触发器
  7. 完成基本模版的创建(可考虑创建更多模版,也可考虑将模版导出备份)
  8. 配置自动发现或自动注册规则
  9. 配置动作(指定监控符合哪些条件的主机,并为他们加入哪个组和链接哪些模版)
  10. 使用ansible这种配置自动化工具,把所有需要被监控的机器从zabbix-agent安装,配置,启动服务一体化完成
  11. 实现自动发现或自动注册,让所有被监控的机器自动被监控
  12. 增加分布式监控或调整主动被动模式进行优化