1.高可用概述

1.1什么是高可用?

简单理解:出现故障,自动恢复,对于用户而言无感知。 专业理解:减少系统不能对外提供服务的时间。4个9 5个9。 48. keepalived高可用 - 图1

1.2 高可用实现手段?

硬件 软件 keepalived 基于VRRP协议来实现。VRRP虚拟路由冗余协议,主要用来解决单点故障问题。

1.3 vrrp虚拟路由冗余协议

vrrp诞生过程 vrrp实现原理 https://blog.csdn.net/u013982161/article/details/51192337

1.4 keepalived高可用使用场景?

看业务不重要,需不需要高可用keepalived

1.5 keepalived高可用核心概念总结?

1.如何确认谁是主谁是备节点? 优先级。 谁的优先级高谁就是master。 2.master故障,然后恢复? 抢占式、非抢占式。

2 keepalived部署

安装:yum install keepalived -y
配置:MASTER
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf

  1. global_defs {
  2. router_id lb01
  3. }
  4. vrrp_instance VI_1 {
  5. state MASTER
  6. interface eth0
  7. virtual_router_id 50
  8. priority 150
  9. advert_int 1
  10. authentication {
  11. auth_type PASS
  12. auth_pass 1111
  13. }
  14. virtual_ipaddress {
  15. 10.0.0.3
  16. }
  17. }

配置:BACKUP
[root@lb02 ~]# cat /etc/keepalived/keepalived.conf

global_defs {
    router_id lb02
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth0
    virtual_router_id 50
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.3
    }
}

自启: systemctl enable keepalived
启动systemctl start keepalived
48. keepalived高可用 - 图2

3. keepalived高可用地址漂移测试

[root@lb01 ~]# ip addr | grep 10.0.0.3

  • 尝试停止master的keeplaived
    [root@lb01 ~]# systemctl stop keepalived

  • 在slave上查看是否有对应的VIP
    [root@lb02 ~]# ip addr|grep 10.0.0.3
    inet 10.0.0.3/32 scope global eth0

windows检查方法: ping 10.0.0.3 -t arp -a

4.keepalived高可用抢占式与非抢占式

抢占式(默认) master故障,backup接管,master恢复后会抢占VIP。 (发生切换) master 和 backup 的 配置 不对等。 适合使用抢占式。
非抢占式 master故障,backup接管,master恢复了不会抢占VIP。(除非backup故障,切换) 适合对于并发访问非常高的 站点
  • 配置非抢占式步骤如下

    1、 两个节点的state都必须配置为BACKUP(官方建议) 2、 两个节点都在vrrp_instance中添加nopreempt参数 3、 其中一个节点的优先级必须要高于另外一个节点的优先级。 两台服务器都角色状态启用nopreempt后,必须修改角色状态统一为BACKUP,唯一的区分就是优先级。

#Master
    vrrp_instance VI_1 {
        state BACKUP
        priority 150
        nopreempt
   ....

#Backup
    vrrp_instance VI_1 {
        state BACKUP
        priority 100
        nopreempt
........

5.keepalived高可用与Nginx集成

①准备环境: 10.0.0.5 已经配置好的负载均衡 ( blog、zh ) 10.0.0.6 安装Nginx 拉取10.0.0.5 的配置 确保10.0.0.5 与 10.0.0.6 配置一致,无论通过5 或者 6 都能正常访问 blog 和 zh

[root@lb02 ~]# scp root@172.16.1.5:/etc/yum.repos.d/nginx.repo /etc/yum.repos.d/ [root@lb02 ~]# yum install nginx -y [root@lb02 ~]# scp -rp 172.16.1.5:/etc/nginx /etc/ [root@lb02 ~]# nginx -t [root@lb02 ~]# systemctl enable nginx [root@lb02 ~]# systemctl start nginx

②配置高可用: 1.提供的VIP是10.0.0.3 (lb1,lb2安装—->配置—->启动 vip10.0.0.3) 2.将域名解析指向到10.0.0.3

解析:10.0.0.3 blog.oldxu.com zh.oldxu.com

Nginx和Keepalived实践

Nginx和Keepalived关系,keepalived是如何实现nginx高可用的呢? 没有关系。 Nginx仅借助了Keepalived的地址漂移技术,实现的高可用。

nginx停止了?那么VIP还会漂移吗? 不会。

1.停止nginx
[root@lb01 ~]# systemctl stop nginx

2.检查vip,发现没有漂移。
[root@lb01 ~]# ip addr |grep 10.0.0.3
    inet 10.0.0.3/32 scope global eth0

    VIP在什么时候会漂移?
        1.keepalived服务停止了,地址就会漂移。
        2.服务器直接关机、重启了,地址会漂移。

解决办法:
希望Nginx如果故障停止了,那么希望VIP漂移到另外一台节点。

写一个脚本: 1.判断Nginx是否存活, 如果存活则不处理。 如果不存活,尝试1~3次,强制杀掉keeplaived。

[root@lb01 ~]# mkdir /server/scripts -p
[root@lb01 ~]# vim /server/scripts/check_web.sh

#!/bin/sh
nginxpid=$(ps -C nginx --no-header|wc -l)
#1.判断Nginx是否存活,如果不存活则尝试启动Nginx
if [ $nginxpid -eq 0 ];then
    systemctl start nginx
    sleep 3
    #2.等待3秒后再次获取一次Nginx状态
    nginxpid=$(ps -C nginx --no-header|wc -l) 
    #3.再次进行判断, 如Nginx还不存活则停止Keepalived,让地址进行漂移,并退出脚本  
    if [ $nginxpid -eq 0 ];then
        systemctl stop keepalived
   fi
fi

给脚本增加执行权限
[root@lb01 ~]# chmod +x /server/scripts/check_web.sh
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf

global_defs {
    router_id lb01
}


vrrp_script check_web {                  #定义脚本,名称check_web
    script "/server/scripts/check_web.sh"  #指定脚本所在的路径
    interval 5                             #5s检查一次,要大于脚本运行的时间
}

vrrp_instance VI_1 {
    state BACKUP
    priority 150
    nopreempt

    interface eth0
    virtual_router_id 50
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
}
    virtual_ipaddress {
        10.0.0.3
    }

    track_script {                      #调用脚本定义脚本的名称,并运行该脚本
    check_web
    }
}

6. keepalived如何投产?

6.1 虚拟的IP地址。是无法对外的,意味着 DNS 怎么解析到你的 VIP ?

NAT: SNAT 源地址转换 ( 共享上网的 ) | DNAT 目标地址转换 ( 端口映射 ) | 借助路由器实现地址的转换———->>> 访问

6.2 keepalived 脑裂?

  • 什么是脑裂?
    当两个节点同时认为自己是唯一处于活动状态的时候,从而出现了资源抢占,双方都在抢占资源的情况下,及为脑裂。
  • 脑裂的产生?
    1.网线松动
    2.开启了防火墙。
  • 脑裂影响的范围?
    1.对于无状态的服务,比如Nginx集群,没啥影响。
    2.对于有状态的服务,比如MySQL,就必须严格防止脑裂现象。

对于MySQL来说,可能出现多种情况,比如无法正常访问、或者得不到正确的返回结果,但大部分是无法正常访问,直接没有响应;如果出现了脑裂,有多种办法可以规避,比如我们可以写一些监控性的脚本,同时监控2台服务器的地址配置情况,如果检测同时存在2个IP,就可以认定为脑裂,这 时软件解决办法,生产中用这种比较多;也有硬件解决办法,但不常用。

  • 解决keepalived脑裂的问题?

7. Keepalived 和 Firewalld