I. 概述

目前,比较流行的实现Nginx高可用方案就是:keepalived+nginx实现主备方案。keepalived是集群管理中保证集群高可用的一个服务软件,用来防止单点故障。
Keepalived的作用是检测web服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的web服务器从系统中剔除,当web服务器工作正常后Keepalived自动将web服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的web服务器。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(VIP = Virtual IP Address,虚拟IP地址,该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到VRRP包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。
d043ad4bd11373f034e5e5ac3686acfdfaed04bf.jpeg

II. 准备工作

  1. 分别在两个服务器中安装nginx与keepalived

    1. yum -y install keepalived
    2. yum -y install nginx
  2. keepalived安装后会在/etc/中生成keepalived文件夹,里面有keepalived.conf。

  3. keepalived常用命令 ```bash systemctl start keepalived.service

systemctl stop keepalived.service

systemctl restart keepalived.service

tail -f /var/log/messages

  1. <a name="UapHe"></a>
  2. # III. 具体配置
  3. <a name="12cgH"></a>
  4. ## 3.1 修改keepalived配置文件
  5. 找到第一台机器的/etc/keepalived目录的keepalived.conf配置文件,主要配置一下两个节点:<br />![2020060920445793.png](https://cdn.nlark.com/yuque/0/2021/png/20357720/1620030310411-ed6c9f81-c62e-44cd-80b4-a2fd3b48dac6.png#align=left&display=inline&height=881&margin=%5Bobject%20Object%5D&name=2020060920445793.png&originHeight=881&originWidth=833&size=78256&status=done&style=none&width=833)<br />将以上两个节点配置为如下:
  6. ```bash
  7. global_defs {
  8. notification_email { # keepalived服务宕机异常出现的时候,发送通知邮件 可以是多个
  9. acassen@firewall.loc # 收件人邮箱1
  10. failover@firewall.loc # 收件人邮箱2
  11. sysadmin@firewall.loc # 收件人邮箱3
  12. }
  13. notification_email_from Alexandre.Cassen@firewall.loc #邮件发件人
  14. smtp_server 192.168.200.1 # 邮件服务器地址
  15. smtp_connect_timeout 30 # 超时时间
  16. router_id LVS_DEVEL # 机器标识 局域网内唯一即可
  17. vrrp_skip_check_adv_addr # 默认是不跳过检查。检查收到的VRRP通告中的所有地址可能会比较耗时,设置此命令的意思是,如果通告与接收的上一个通告来自相同的master路由器,则不执行检查(跳过检查)。
  18. #vrrp_strict # 严格遵守VRRP协议。下列情况将会阻止启动Keepalived:1. 没有VIP地址。2. 单播邻居。3. 在VRRP版本2中有IPv6地址。
  19. vrrp_garp_interval 0 # 小数类型,单位秒,在一个网卡上每组gratuitous arp消息之间的延迟时间,默认为0,一个发送的消息=n组 arp报文
  20. vrrp_gna_interval 0 # 小数类型,单位秒, 在一个网卡上每组na消息之间的延迟时间,默认为0
  21. }
  22. # vrrp实例 我们集群设置 多机配置,除了state和priority不一样,其他都一样
  23. vrrp_instance VI_1 {
  24. state MASTER # 服务器状态 MASTER是主服务器 BACKUP是备份服务器 主服务器的priority要比备份服务器大
  25. interface ens33 # 通信端口 通过ip addr可以看到 根据自己的机器配置
  26. virtual_router_id 51 # vrrp实例id keepalived集群,实例id必须一致
  27. priority 100 # 权重比 主服务器的priority要比备份服务器大
  28. advert_int 1 # 心跳间隔 单位秒 keepalived多机器集群 通过心跳检测,如果发送心跳没反应 就立刻接管;
  29. authentication { # 服务器之间通信密码
  30. auth_type PASS
  31. auth_pass 1111
  32. }
  33. virtual_ipaddress { # 自定义虚拟IP
  34. 192.168.91.199
  35. }
  36. }

3.2 添加检测脚本

  1. 修改keepalived.conf文件,在此位置添加配置:

20200610112756624.png

  1. #!/bin/bash
  2. A=`ps -C nginx --no-header |wc -l` #统计nginx进程是否存在
  3. if [ $A -eq 0 ];then #为0,表明nginx停止了
  4. /usr/local/nginx/sbin/nginx #尝试重启nginx
  5. if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then #nginx重启失败,则keepalived自杀,进行VIP转移
  6. killall keepalived #杀掉,vip就漫游到另一台机器
  7. fi
  8. fi
  1. 然后相对应的地址创建nginx_check.sh
    1. touch /home/nginx_check.sh
    脚本内容: ```shell

    !/bin/bash

echo ‘xxxxxx’

count_nginx=ps -ef|grep -w nginx|grep -v grep|wc -l

echo $count_nginx

if [ $count_nginx -eq 0 ];then

  1. systemctl start nginx.service
  2. sleep 2
  3. if [ `ps -ef|grep -w nginx|grep -v grep|wc -l` -eq 0 ];then
  4. systemctl stop keepalived.service
  5. fi

fi

  1. <a name="kGyI0"></a>
  2. ## 3.3 启动nginx和keepalived
  3. ```bash
  4. systemctl start nginx.service
  5. systemctl start keepalived.service

IV. keepalived配置规则

keepalived配置文件由三部分组成,global_defs全局配置、vrrp_script chk_http_port脚本配置以及vrrp_instance VI_1虚拟IP配置。

  1. global_defs {
  2. notification_email { # keepalived服务宕机异常出现的时候,发送通知邮件 可以是多个
  3. acassen@firewall.loc # 收件人邮箱1
  4. failover@firewall.loc # 收件人邮箱2
  5. sysadmin@firewall.loc # 收件人邮箱3
  6. }
  7. notification_email_from Alexandre.Cassen@firewall.loc #邮件发件人
  8. smtp_server 192.168.200.1 # 邮件服务器地址
  9. smtp_connect_timeout 30 # 超时时间
  10. router_id LVS_DEVEL # 机器标识 局域网内唯一即可(重要!)
  11. vrrp_skip_check_adv_addr # 默认是不跳过检查。检查收到的VRRP通告中的所有地址可能会比较耗时,设置此命令的意思是,如果通告与接收的上一个通告来自相同的master路由器,则不执行检查(跳过检查)。
  12. #vrrp_strict # 严格遵守VRRP协议。下列情况将会阻止启动Keepalived:1. 没有VIP地址。2. 单播邻居。3. 在VRRP版本2中有IPv6地址。
  13. vrrp_garp_interval 0 # 小数类型,单位秒,在一个网卡上每组gratuitous arp消息之间的延迟时间,默认为0,一个发送的消息=n组 arp报文
  14. vrrp_gna_interval 0 # 小数类型,单位秒, 在一个网卡上每组na消息之间的延迟时间,默认为0
  15. }
  16. # vrrp实例 我们集群设置 多机配置,除了state和priority不一样,其他都一样
  17. vrrp_instance VI_1 {
  18. state MASTER # 服务器状态 MASTER是主服务器 BACKUP是备份服务器 主服务器的priority要比备份服务器大
  19. interface ens33 # 通信端口 通过ip addr可以看到 根据自己的机器配置
  20. virtual_router_id 51 # vrrp实例id keepalived集群,实例id必须一致
  21. priority 100 # 权重比 主服务器的priority要比备份服务器大
  22. advert_int 1 # 心跳间隔 单位秒 keepalived多机器集群 通过心跳检测,如果发送心跳没反应 就立刻接管;
  23. authentication { # 服务器之间通信密码
  24. auth_type PASS
  25. auth_pass 1111
  26. }
  27. virtual_ipaddress { # 自定义虚拟IP
  28. 192.168.91.199
  29. }
  30. }