I. 概述

目前，比较流行的实现Nginx高可用方案就是：keepalived+nginx实现主备方案。keepalived是集群管理中保证集群高可用的一个服务软件，用来防止单点故障。
Keepalived的作用是检测web服务器的状态，如果有一台web服务器死机，或工作出现故障，Keepalived将检测到，并将有故障的web服务器从系统中剔除，当web服务器工作正常后Keepalived自动将web服务器加入到服务器群中，这些工作全部自动完成，不需要人工干涉，需要人工做的只是修复故障的web服务器。
虚拟路由冗余协议，可以认为是实现路由器高可用的协议，即将N台提供相同功能的路由器组成一个路由器组，这个组里面有一个master和多个backup，master上面有一个对外提供服务的vip（VIP = Virtual IP Address，虚拟IP地址，该路由器所在局域网内其他机器的默认路由为该vip），master会发组播，当backup收不到VRRP包时就认为master宕掉了，这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。

II. 准备工作

分别在两个服务器中安装nginx与keepalived
```
yum -y install keepalived
yum -y install nginx
```
keepalived安装后会在/etc/中生成keepalived文件夹，里面有keepalived.conf。
keepalived常用命令 ```bash systemctl start keepalived.service

systemctl stop keepalived.service

systemctl restart keepalived.service

tail -f /var/log/messages

<a name="UapHe"></a>
# III. 具体配置
<a name="12cgH"></a>
## 3.1 修改keepalived配置文件
找到第一台机器的/etc/keepalived目录的keepalived.conf配置文件，主要配置一下两个节点：<br />![2020060920445793.png](https://cdn.nlark.com/yuque/0/2021/png/20357720/1620030310411-ed6c9f81-c62e-44cd-80b4-a2fd3b48dac6.png#align=left&display=inline&height=881&margin=%5Bobject%20Object%5D&name=2020060920445793.png&originHeight=881&originWidth=833&size=78256&status=done&style=none&width=833)<br />将以上两个节点配置为如下：
```bash
global_defs {
   notification_email { # keepalived服务宕机异常出现的时候，发送通知邮件 可以是多个
     acassen@firewall.loc  #  收件人邮箱1
     failover@firewall.loc #  收件人邮箱2
     sysadmin@firewall.loc #  收件人邮箱3
   }
   notification_email_from Alexandre.Cassen@firewall.loc  #邮件发件人
   smtp_server 192.168.200.1  # 邮件服务器地址
   smtp_connect_timeout 30   # 超时时间
   router_id LVS_DEVEL   # 机器标识 局域网内唯一即可
   vrrp_skip_check_adv_addr # 默认是不跳过检查。检查收到的VRRP通告中的所有地址可能会比较耗时，设置此命令的意思是，如果通告与接收的上一个通告来自相同的master路由器，则不执行检查(跳过检查)。
   #vrrp_strict   # 严格遵守VRRP协议。下列情况将会阻止启动Keepalived：1. 没有VIP地址。2. 单播邻居。3. 在VRRP版本2中有IPv6地址。
   vrrp_garp_interval 0  # 小数类型，单位秒，在一个网卡上每组gratuitous arp消息之间的延迟时间，默认为0，一个发送的消息=n组 arp报文
   vrrp_gna_interval 0 # 小数类型，单位秒， 在一个网卡上每组na消息之间的延迟时间，默认为0
}
# vrrp实例  我们集群设置 多机配置，除了state和priority不一样，其他都一样
vrrp_instance VI_1 {
    state MASTER  # 服务器状态 MASTER是主服务器  BACKUP是备份服务器 主服务器的priority要比备份服务器大
    interface ens33 # 通信端口 通过ip addr可以看到 根据自己的机器配置
    virtual_router_id 51  # vrrp实例id  keepalived集群，实例id必须一致
    priority 100  # 权重比 主服务器的priority要比备份服务器大
    advert_int 1  # 心跳间隔  单位秒  keepalived多机器集群 通过心跳检测，如果发送心跳没反应 就立刻接管；
    authentication { # 服务器之间通信密码
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress { # 自定义虚拟IP 
        192.168.91.199
    }
}

3.2 添加检测脚本

修改keepalived.conf文件，在此位置添加配置：

#!/bin/bash
A=`ps -C nginx --no-header |wc -l`       #统计nginx进程是否存在
if [ $A -eq 0 ];then                            #为0，表明nginx停止了
      /usr/local/nginx/sbin/nginx                #尝试重启nginx
      if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then    #nginx重启失败，则keepalived自杀，进行VIP转移
              killall keepalived    #杀掉，vip就漫游到另一台机器                
      fi
fi

然后相对应的地址创建nginx_check.sh
```
touch /home/nginx_check.sh
```
脚本内容： ```shell
!/bin/bash

echo ‘xxxxxx’

count_nginx=ps -ef|grep -w nginx|grep -v grep|wc -l

echo $count_nginx

if [ $count_nginx -eq 0 ];then

systemctl start nginx.service
sleep 2
if [ `ps -ef|grep -w nginx|grep -v grep|wc -l` -eq 0 ];then
    systemctl stop keepalived.service
fi

<a name="kGyI0"></a>
## 3.3 启动nginx和keepalived
```bash
systemctl start nginx.service 
systemctl start keepalived.service

IV. keepalived配置规则

keepalived配置文件由三部分组成，global_defs全局配置、vrrp_script chk_http_port脚本配置以及vrrp_instance VI_1虚拟IP配置。

global_defs {
   notification_email { # keepalived服务宕机异常出现的时候，发送通知邮件 可以是多个
     acassen@firewall.loc  #  收件人邮箱1
     failover@firewall.loc #  收件人邮箱2
     sysadmin@firewall.loc #  收件人邮箱3
   }
   notification_email_from Alexandre.Cassen@firewall.loc  #邮件发件人
   smtp_server 192.168.200.1  # 邮件服务器地址
   smtp_connect_timeout 30   # 超时时间
   router_id LVS_DEVEL   # 机器标识 局域网内唯一即可（重要！）
   vrrp_skip_check_adv_addr # 默认是不跳过检查。检查收到的VRRP通告中的所有地址可能会比较耗时，设置此命令的意思是，如果通告与接收的上一个通告来自相同的master路由器，则不执行检查(跳过检查)。
   #vrrp_strict   # 严格遵守VRRP协议。下列情况将会阻止启动Keepalived：1. 没有VIP地址。2. 单播邻居。3. 在VRRP版本2中有IPv6地址。
   vrrp_garp_interval 0  # 小数类型，单位秒，在一个网卡上每组gratuitous arp消息之间的延迟时间，默认为0，一个发送的消息=n组 arp报文
   vrrp_gna_interval 0 # 小数类型，单位秒， 在一个网卡上每组na消息之间的延迟时间，默认为0
}
# vrrp实例  我们集群设置 多机配置，除了state和priority不一样，其他都一样
vrrp_instance VI_1 {
    state MASTER  # 服务器状态 MASTER是主服务器  BACKUP是备份服务器 主服务器的priority要比备份服务器大
    interface ens33 # 通信端口 通过ip addr可以看到 根据自己的机器配置
    virtual_router_id 51  # vrrp实例id  keepalived集群，实例id必须一致
    priority 100  # 权重比 主服务器的priority要比备份服务器大
    advert_int 1  # 心跳间隔  单位秒  keepalived多机器集群 通过心跳检测，如果发送心跳没反应 就立刻接管；
    authentication { # 服务器之间通信密码
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress { # 自定义虚拟IP 
        192.168.91.199
    }
}