1.高可用概述
1.1什么是高可用?
简单理解:出现故障,自动恢复,对于用户而言无感知。 专业理解:减少系统不能对外提供服务的时间。4个9 5个9。
1.2 高可用实现手段?
硬件 软件 keepalived 基于VRRP协议来实现。VRRP虚拟路由冗余协议,主要用来解决单点故障问题。
1.3 vrrp虚拟路由冗余协议
vrrp诞生过程 vrrp实现原理 https://blog.csdn.net/u013982161/article/details/51192337
1.4 keepalived高可用使用场景?
看业务不重要,需不需要高可用keepalived
1.5 keepalived高可用核心概念总结?
1.如何确认谁是主谁是备节点? 优先级。 谁的优先级高谁就是master。 2.master故障,然后恢复? 抢占式、非抢占式。
2 keepalived部署
安装:yum install keepalived -y
配置:MASTER
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf
global_defs {
router_id lb01
}
vrrp_instance VI_1 {
state MASTER
interface eth0
virtual_router_id 50
priority 150
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.0.0.3
}
}
配置:BACKUP
[root@lb02 ~]# cat /etc/keepalived/keepalived.conf
global_defs {
router_id lb02
}
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 50
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.0.0.3
}
}
自启: systemctl enable keepalived
启动systemctl start keepalived
3. keepalived高可用地址漂移测试
[root@lb01 ~]# ip addr | grep 10.0.0.3
尝试停止master的keeplaived
[root@lb01 ~]#systemctl stop keepalived
在slave上查看是否有对应的VIP
[root@lb02 ~]#ip addr|grep 10.0.0.3
inet 10.0.0.3/32 scope global eth0
windows检查方法: ping 10.0.0.3 -t arp -a
4.keepalived高可用抢占式与非抢占式
抢占式(默认) | master故障,backup接管,master恢复后会抢占VIP。 (发生切换) | master 和 backup 的 配置 不对等。 适合使用抢占式。 |
---|---|---|
非抢占式 | master故障,backup接管,master恢复了不会抢占VIP。(除非backup故障,切换) | 适合对于并发访问非常高的 站点 |
- 配置非抢占式步骤如下
1、 两个节点的state都必须配置为BACKUP(官方建议) 2、 两个节点都在vrrp_instance中添加nopreempt参数 3、 其中一个节点的优先级必须要高于另外一个节点的优先级。 两台服务器都角色状态启用nopreempt后,必须修改角色状态统一为BACKUP,唯一的区分就是优先级。
#Master
vrrp_instance VI_1 {
state BACKUP
priority 150
nopreempt
....
#Backup
vrrp_instance VI_1 {
state BACKUP
priority 100
nopreempt
........
5.keepalived高可用与Nginx集成
①准备环境: 10.0.0.5 已经配置好的负载均衡 ( blog、zh ) 10.0.0.6 安装Nginx 拉取10.0.0.5 的配置 确保10.0.0.5 与 10.0.0.6 配置一致,无论通过5 或者 6 都能正常访问 blog 和 zh
[root@lb02 ~]# scp root@172.16.1.5:/etc/yum.repos.d/nginx.repo /etc/yum.repos.d/ [root@lb02 ~]# yum install nginx -y [root@lb02 ~]# scp -rp 172.16.1.5:/etc/nginx /etc/ [root@lb02 ~]# nginx -t [root@lb02 ~]# systemctl enable nginx [root@lb02 ~]# systemctl start nginx
②配置高可用: 1.提供的VIP是10.0.0.3 (lb1,lb2安装—->配置—->启动 vip10.0.0.3) 2.将域名解析指向到10.0.0.3
解析:10.0.0.3 blog.oldxu.com zh.oldxu.com
Nginx和Keepalived实践
Nginx和Keepalived关系,keepalived是如何实现nginx高可用的呢? 没有关系。 Nginx仅借助了Keepalived的地址漂移技术,实现的高可用。
nginx停止了?那么VIP还会漂移吗? 不会。
1.停止nginx
[root@lb01 ~]# systemctl stop nginx
2.检查vip,发现没有漂移。
[root@lb01 ~]# ip addr |grep 10.0.0.3
inet 10.0.0.3/32 scope global eth0
VIP在什么时候会漂移?
1.keepalived服务停止了,地址就会漂移。
2.服务器直接关机、重启了,地址会漂移。
解决办法:
希望Nginx如果故障停止了,那么希望VIP漂移到另外一台节点。
写一个脚本: 1.判断Nginx是否存活, 如果存活则不处理。 如果不存活,尝试1~3次,强制杀掉keeplaived。
[root@lb01 ~]# mkdir /server/scripts -p
[root@lb01 ~]# vim /server/scripts/check_web.sh
#!/bin/sh
nginxpid=$(ps -C nginx --no-header|wc -l)
#1.判断Nginx是否存活,如果不存活则尝试启动Nginx
if [ $nginxpid -eq 0 ];then
systemctl start nginx
sleep 3
#2.等待3秒后再次获取一次Nginx状态
nginxpid=$(ps -C nginx --no-header|wc -l)
#3.再次进行判断, 如Nginx还不存活则停止Keepalived,让地址进行漂移,并退出脚本
if [ $nginxpid -eq 0 ];then
systemctl stop keepalived
fi
fi
给脚本增加执行权限
[root@lb01 ~]# chmod +x /server/scripts/check_web.sh
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf
global_defs {
router_id lb01
}
vrrp_script check_web { #定义脚本,名称check_web
script "/server/scripts/check_web.sh" #指定脚本所在的路径
interval 5 #5s检查一次,要大于脚本运行的时间
}
vrrp_instance VI_1 {
state BACKUP
priority 150
nopreempt
interface eth0
virtual_router_id 50
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.0.0.3
}
track_script { #调用脚本定义脚本的名称,并运行该脚本
check_web
}
}
6. keepalived如何投产?
6.1 虚拟的IP地址。是无法对外的,意味着 DNS 怎么解析到你的 VIP ?
NAT: SNAT 源地址转换 ( 共享上网的 ) | DNAT 目标地址转换 ( 端口映射 ) | 借助路由器实现地址的转换———->>> 访问
6.2 keepalived 脑裂?
- 什么是脑裂?
当两个节点同时认为自己是唯一处于活动状态的时候,从而出现了资源抢占,双方都在抢占资源的情况下,及为脑裂。 - 脑裂的产生?
1.网线松动
2.开启了防火墙。 - 脑裂影响的范围?
1.对于无状态的服务,比如Nginx集群,没啥影响。
2.对于有状态的服务,比如MySQL,就必须严格防止脑裂现象。
对于MySQL来说,可能出现多种情况,比如无法正常访问、或者得不到正确的返回结果,但大部分是无法正常访问,直接没有响应;如果出现了脑裂,有多种办法可以规避,比如我们可以写一些监控性的脚本,同时监控2台服务器的地址配置情况,如果检测同时存在2个IP,就可以认定为脑裂,这 时软件解决办法,生产中用这种比较多;也有硬件解决办法,但不常用。
- 解决keepalived脑裂的问题?