一、半同步复制

1、什么是半同步复制

image-20200901093404443.png

所谓的半同步复制就是master每commit一个事务(简单来说就是做一个改变数据的操作),要确保slave接受完主服务器发送的binlog日志文件并写入到自己的中继日志relay log里,然后会给master信号,告诉对方已经接收完毕,这样master才能把事物成功commit。这样就保证了master-slave的数据绝对的一致(但是以牺牲master的性能为代价).但等待时间也是可以调整的。

2、半同步复制的基本实现

第一步:准备一套M-S的主从架构(建议使用基于GTIDs架构设计)

第二步:给MASTER与SLAVE安装plugin插件(`$basedir/lib/plugin/)

MASTER:

  1. mysql> install plugin rpl_semi_sync_master soname 'semisync_master.so';
  2. mysql> show global variables like 'rpl_semi_sync%';

SLAVE:

  1. mysql> install plugin rpl_semi_sync_slave soname 'semisync_slave.so';
  2. mysql> show global variables like 'rpl_semi_sync%';

第三步:激活MASTER与SLAVE服务器中的半同步复制插件

MASTER:

  1. mysql> set global rpl_semi_sync_master_enabled=on;
  2. mysql> show global status like 'rpl_semi_sync%';

SLAVE:

  1. mysql> set global rpl_semi_sync_slave_enabled=on;
  2. mysql> show global variables like 'rpl_semi_sync%';

第四步:在SLAVE服务器中重启IO线程

  1. mysql> stop slave IO_THREAD;
  2. mysql> start slave IO_THREAD;

第五步:测试验证半同步复制

当slave从库的IO_Thread 线程将binlog日志接受完毕后,要给master一个确认,如果超过10s未收到slave的接收确认信号,那么就会自动转换为传统的异步复制模式。

1)master插入一条记录,查看slave是否有成功返回

  1. mysql> insert into db_itheima.tb_student values (null,'j');
  2. mysql> show global status like 'rpl_semi_sync%_yes_tx';
  3. +-----------------------------+-------+
  4. | Variable_name | Value |
  5. +-----------------------------+-------+
  6. | Rpl_semi_sync_master_yes_tx | 1 |
  7. 表示这次事物成功从slave返回一次确认信号
  8. +-----------------------------+-------+

2)模拟slave服务器故障

SLAVE:

  1. # service mysqld stop

MASTER:

  1. mysql> insert into db_itheima.tb_student values (null,'k');
  2. mysql> insert into db_itheima.tb_student values (null,'l');
  3. 这次插入一个值需要等待10秒(默认的等待时间)
  4. mysql> insert into db_itheima.tb_student values (null,'m');
  5. 现在自动转成了原来的异步模式

3)重新启动半同步复制

SLAVE:

  1. # service mysqld start
  2. # mysql -P 3310 -p
  3. mysql> set global rpl_semi_sync_slave_enabled=on;
  4. mysql> stop slave IO_THREAD;
  5. mysql> start slave IO_THREAD;

master需要等到slave确认后才能提交,如果等不到确认消息,master等待10s种后自动变成异步同步;slave启起来后,master上改变的数据还是会自动复制过来,数据又回到一致。

3、等待时间的修改(默认10s)

  1. mysql> set global rpl_semi_sync_master_timeout=3600000;
  2. mysql> show global variables like 'rpl_semi_sync%';
  3. +------------------------------------+---------+
  4. | Variable_name | Value |
  5. +------------------------------------+---------+
  6. | rpl_semi_sync_master_enabled | ON |
  7. | rpl_semi_sync_master_timeout | 3600000 |
  8. | rpl_semi_sync_master_trace_level | 32 |
  9. | rpl_semi_sync_master_wait_no_slave | ON |
  10. +------------------------------------+---------+

4、卸载半同步复制插件(不需要时)

  1. mysql> select plugin_name,load_option from information_schema.plugins;
  2. mysql> uninstall plugin 插件名称;

补充:mysqld重启后,需要手工启动主从同步

  1. # service mysqld stop
  2. # service mysqld start
  3. # mysql -P 3310 -p
  4. mysql> show slave status\G
  5. Slave_IO_Running: No
  6. Slave_SQL_Running: No

以上情况代表,mysqld重启后,主从同步也会随之关闭,需要手工开启。

  1. mysql> start slave;

二、MHA简介

1、什么是MHA

MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton(现就职于Facebook公司)开发,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在较大程度上保证数据的一致性,以达到真正意义上的高可用。

2、MHA工作原理

image-20200901105954602.png

  1. 当master出现故障时,通过对比slave之间I/O线程读取master上binlog的位置,选取最接近的slave做为最新的slave(latest slave)。
  2. 其它slave通过与latest slave对比生成差异中继日志,并应用。
  3. 在latest slave上应用从master保存的binlog,同时将latest slave提升为master。
  4. 最后在其它slave上应用相应的差异中继日志并开始从新的master开始复制.

3、MHA组件

  • MHA Manager(管理节点)
    MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。
  • MHA Node(数据节点)
    MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。

4、MHA组件介绍

  • MHA Manager

运行一些工具,比如masterha_manager工具实现自动监控MySQL Master和实现master故障切换,其它工具手动实现master故障切换、在线mater转移、连接检查等等。一个Manager可以管理多 个master-slave集群

  • MHA Node

部署在所有运行MySQL的服务器上,无论是master还是slave。主要有三个作用:

1)保存二进制日志

  1. 如果能够访问故障master,会拷贝master的二进制日志

2)应用差异中继日志

  1. 从拥有最新数据的slave上生成差异中继日志,然后应用差异日志。

3)清除中继日志

  1. 在不停止SQL线程的情况下删除中继日志

5、MHA中工具介绍

㈠ Manager工具

工具 说明
masterha_check_ssh 检查MHA的SSH配置
masterha_check_repl 检查MySQL复制
masterha_manager 启动MHA
masterha_check_status 检测当前MHA运行状态
masterha_master_monitor 监测master是否宕机
masterha_master_switch 控制故障转移(自动或手动)
masterha_conf_host 添加或删除配置的server信息

㈡ Node工具

工具 说明
save_binary_logs 保存和复制master的二进制日志
apply_diff_relay_logs 识别差异的中继日志事件并应用于其它slave
filter_mysqlbinlog 去除不必要的ROLLBACK事件(MHA已不再使用这个工具)
purge_relay_logs 清除中继日志(不会阻塞SQL线程)

注意:Node这些工具通常由MHA Manager的脚本触发,无需人手操作__。

三、MHA部署架构

1、部署规划

角色 IP 主机名 server-id 功能 备注
MHA-Manager 10.1.1.40 mha.itcast.cn 管理节点
MHA-Node(Master) 10.1.1.10 master.itcast.cn 10 数据节点
MHA-Node(Slave1) 10.1.1.20 slave1.itcast.cn 20 数据节点
MHA-Node(Slave2) 10.1.1.30 slave2.itcast.cn 30 数据节点

2、系统和软件版本

系统版本 MySQL版本 MHA版本
CentOS 7.6 MySQL-5.7.31 mha4mysql-manager-0.57 mha4mysql-node-0.57

3、系统环境初始化

第一步:克隆机器,首先启动MASTER,然后在一次启动SLAVE1、SLAVE2以及MHA

第二步:更改计算机的主机名称

  1. # hostnamectl set-hostname master.itcast.cn
  2. # su
  3. # hostnamectl set-hostname slave1.itcast.cn
  4. # su
  5. # hostnamectl set-hostname slave2.itcast.cn
  6. # su
  7. # hostnamectl set-hostname mha.itcast.cn
  8. # su

第三步:更改IP地址以及绑定主机名称及IP地址到/etc/hosts文件

  1. # vim /etc/sysconfig/network-scripts/ifcfg-ens33
  2. ...
  3. IPADDR=10.1.1.10IPADDR=10.1.1.20IPADDR=10.1.1.30IPADDR=10.1.1.40
  4. ...
  5. # systemctl stop NetworkManager
  6. # systemctl disable NetworkManager
  7. # systemctl restart network

使用MX连接4台服务器,绑定IP地址与主机名称到/etc/hosts文件中

  1. # vim /etc/hosts
  2. 10.1.1.10 master.itcast.cn
  3. 10.1.1.20 slave1.itcast.cn
  4. 10.1.1.30 slave2.itcast.cn
  5. 10.1.1.40 mha.itcast.cn

第四步:关闭防火墙与SELinux

  1. # systemctl stop firewalld
  2. # systemctl disable firewalld
  3. # setenforce 0
  4. # sed -i '/SELINUX=enforcing/cSELINUX=disabled' /etc/selinux/config

第五步:配置YUM源

基础源(略,建议使用腾讯源)

配置epel源

  1. # wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo
  2. # yum clean all
  3. # yum makecache

配置本地自建仓库的yum源

① 上传mha-yum软件包到/soft/mha目录

  1. # mkdir -p /soft/mha

② 配置本地yum源,当我们使用yum时,可以自动找到mha-yum这个仓库目录

  1. # vim /etc/yum.repos.d/local.repo
  2. [mha]
  3. name=mha soft
  4. baseurl=file:///soft/mha/mha-yum
  5. enabled=1
  6. gpgcheck=0

测试MHA依赖软件库的安装

  1. yum -y install perl-DBD-MySQL \
  2. perl-Config-Tiny \
  3. perl-Time-HiRes \
  4. perl-Mail-Sender \
  5. perl-Mail-Sendmail \
  6. perl-MIME-Base32 \
  7. perl-MIME-Charset \
  8. perl-MIME-EncWords \
  9. perl-Params-Classify \
  10. perl-Params-Validate.x86_64 \
  11. perl-Log-Dispatch \
  12. perl-Parallel-ForkManager \
  13. net-tools

第六步:ntpdate时间同步(非常重要)

  1. # ntpdate 182.92.12.11

4、部署MySQL主从复制环境

数据库安装位置:/usr/local/mysql

数据库的数据目录:/usr/local/mysql/data

套接字文件:/tmp/mysql.sock

端口设置:3306

配置文件位置:/usr/local/mysql/my.cnf(MySQL => 安装目录下 => /etc目录下)

☆ MASTER主服务器

第一步:上传软件到/root目录

第二步:使用脚本安装MySQL软件

  1. # vim mysql.sh
  2. #!/bin/bash
  3. yum install libaio -y
  4. tar -xf mysql-5.7.31-linux-glibc2.12-x86_64.tar.gz
  5. mv mysql-5.7.31-linux-glibc2.12-x86_64 /usr/local/mysql
  6. useradd -r -s /sbin/nologin mysql
  7. rm -rf /etc/my.cnf
  8. cd /usr/local/mysql
  9. mkdir mysql-files
  10. chown mysql:mysql mysql-files
  11. chmod 750 mysql-files
  12. bin/mysqld --initialize --user=mysql --basedir=/usr/local/mysql &> /root/password.txt
  13. bin/mysql_ssl_rsa_setup --datadir=/usr/local/mysql/data
  14. cp support-files/mysql.server /etc/init.d/mysqld
  15. service mysqld start
  16. echo 'export PATH=$PATH:/usr/local/mysql/bin' >> /etc/profile
  17. source /etc/profile
  18. # source mysql.sh

第三步:设置MySQL密码

  1. # mysql -p
  2. mysql> set password='123';
  3. mysql> flush privileges;

第四步:进行安全初始化

  1. # mysql_secure_installation

第五步:编写MASTER主机中my.cnf配置文件

  1. # vim /usr/local/mysql/my.cnf
  2. [mysqld]
  3. basedir=/usr/local/mysql
  4. datadir=/usr/local/mysql/data
  5. socket=/tmp/mysql.sock
  6. port=3306
  7. log-error=/usr/local/mysql/data/master.err
  8. log-bin=/usr/local/mysql/data/binlog
  9. server-id=10
  10. character_set_server=utf8mb4
  11. gtid-mode=on
  12. log-slave-updates=1
  13. enforce-gtid-consistency
  14. # service mysqld restart

☆ SLAVE1/SLAVE2从服务器

第一步:上传MySQL软件到服务器端

第二步:使用脚本安装MySQL,但是不需要进行初始化

  1. # vim mysql.sh
  2. #!/bin/bash
  3. yum install libaio -y
  4. tar -xf mysql-5.7.31-linux-glibc2.12-x86_64.tar.gz
  5. rm -rf /usr/local/mysql
  6. mv mysql-5.7.31-linux-glibc2.12-x86_64 /usr/local/mysql
  7. useradd -r -s /sbin/nologin mysql
  8. rm -rf /etc/my.cnf
  9. cd /usr/local/mysql
  10. mkdir mysql-files
  11. chown mysql:mysql mysql-files
  12. chmod 750 mysql-files
  13. cp support-files/mysql.server /etc/init.d/mysqld
  14. echo 'export PATH=$PATH:/usr/local/mysql/bin' >> /etc/profile
  15. source /etc/profile
  16. # source mysql.sh

第三步:使用rsync把MASTER服务器中的data数据目录同步到SLAVE1与SLAVE2

MASTER:

  1. # rm -rf /usr/local/mysql/data/auto.cnf
  2. # rsync -av /usr/local/mysql/data root@10.1.1.20:/usr/local/mysql/
  3. # rsync -av /usr/local/mysql/data root@10.1.1.30:/usr/local/mysql/

第四步:给SLAVE1与SLAVE2配置my.cnf文件

SLAVE1:

  1. # vim /usr/local/mysql/my.cnf
  2. [mysqld]
  3. basedir=/usr/local/mysql
  4. datadir=/usr/local/mysql/data
  5. socket=/tmp/mysql.sock
  6. port=3306
  7. log-error=/usr/local/mysql/data/slave1.err
  8. log-bin=/usr/local/mysql/data/binlog
  9. relay-log=/usr/local/mysql/data/relaylog
  10. server-id=20
  11. character_set_server=utf8mb4
  12. gtid-mode=on
  13. log-slave-updates=1
  14. enforce-gtid-consistency
  15. skip-slave-start

SLAVE2:

  1. # vim /usr/local/mysql/my.cnf
  2. [mysqld]
  3. basedir=/usr/local/mysql
  4. datadir=/usr/local/mysql/data
  5. socket=/tmp/mysql.sock
  6. port=3306
  7. log-error=/usr/local/mysql/data/slave2.err
  8. log-bin=/usr/local/mysql/data/binlog
  9. relay-log=/usr/local/mysql/data/relaylog
  10. server-id=30
  11. character_set_server=utf8mb4
  12. gtid-mode=on
  13. log-slave-updates=1
  14. enforce-gtid-consistency
  15. skip-slave-start

配置完成后,启动MySQL软件

  1. # service mysqld restart

☆ 配置主从数据同步

第一步:在MASTER服务器中创建一个slave同步账号

  1. mysql> create user 'slave'@'10.1.1.%' identified by '123';
  2. mysql> grant replication slave on *.* to 'slave'@'10.1.1.%';
  3. mysql> flush privileges;

第二步:创建一个mha账号(方便后期MHA监控主从同步状态)

  1. mysql> create user 'mha'@'10.1.1.40' identified by '123';
  2. mysql> grant all privileges on *.* to 'mha'@'10.1.1.40';
  3. mysql> flush privileges;

第三步:在SLAVE1与SLAVE2中配置主从数据同步

  1. mysql> change master to master_host='10.1.1.10',master_port=3306,master_user='slave',master_password='123',master_auto_position=1;
  2. mysql> start slave;
  3. mysql> show slave status\G

到此整个一主两从就配置完毕了!

5、MHA软件的安装

㈠ 不同节点安装软件

说明:在所有节点安装 mha-node 软件包,在 mha 管理端再安装 mha-manager 软件包

  1. [root@mha ~]# yum y install mha4mysql-node-0.57-0.el7.noarch.rpm
  2. [root@master ~]# yum y install mha4mysql-node-0.57-0.el7.noarch.rpm
  3. [root@slave1 ~]# yum -y install mha4mysql-node-0.57-0.el7.noarch.rpm
  4. [root@slave2 ~]# yum y install mha4mysql-node-0.57-0.el7.noarch.rpm
  5. [root@mha ~]# yum y install mha4mysql-manager-0.57-0.el7.noarch.rpm

如果已经提前安装依赖软件,则大家可以使用rpm -ivh直接安装

㈡ 配置ssh互信(免密登录)

说明:

  1. 在生产环境中几乎都是禁止root远程登陆服务器的,所以ssh免密码登陆要在admin用户下进行配置,这是处于安全角度考虑出发。
  2. admin用户可以是任意普通用户
  3. 该普通用户用于mha的管理节点远程访问mysql复制组中的所有主机,完成一些其他工作

第一步:在所有机器上创建一个普通账号admin,密码123

  1. # useradd admin
  2. # echo 123|passwd --stdin admin

第二步:配置mha主机到其他主机的admin用户互信

  1. mha端:
  2. [root@mha ~]# su - admin
  3. [admin@mha ~]$ ssh-keygen -P "" -f ~/.ssh/id_rsa
  4. [admin@mha ~]$ cd .ssh/
  5. [admin@mha .ssh]$ ls
  6. id_rsa id_rsa.pub
  7. [admin@mha .ssh]$ mv id_rsa.pub authorized_keys
  8. [admin@mha .ssh]$ for i in 10 20 30;do scp -r ../.ssh/ 10.1.1.$i:~/;done
  9. 测试免密登录:
  10. [admin@mha .ssh]$ ssh 10.1.1.10
  11. [admin@mha .ssh]$ ssh 10.1.1.20
  12. [admin@mha .ssh]$ ssh 10.1.1.30

疑问:SSH免密只需要拷贝公钥,但是以上代码是把整个.ssh目录拷贝过去了。

答:因为MHA的互信,要求不仅仅是MHA免密到MASTER、SLAVE1、SLAVE2,MASTER也要免密到MHA、SLAVE1、SLAVE2…

㈢ 配置admin用户的sudo权限

MASTER主机上:

  1. [root@master ~]# vim /etc/sudoers.d/admin
  2. #User_Alias 表示具有sudo权限的用户列表; Host_Alias表示主机的列表
  3. User_Alias MYSQL_USERS = admin
  4. #Runas_Alias 表示用户以什么身份登录
  5. Runas_Alias MYSQL_RUNAS = root
  6. #Cmnd_Alias 表示允许执行命令的列表(命令需要使用完整路径)
  7. Cmnd_Alias MYSQL_CMNDS = /sbin/ifconfig,/sbin/arping
  8. MYSQL_USERS ALL = (MYSQL_RUNAS) NOPASSWD: MYSQL_CMNDS

把这个权限分发给SLAVE1与SLAVE2一份(当故障发生时,从服务器也可以自己设置VIP)

  1. [root@master ~]# for i in 20 30;do scp /etc/sudoers.d/admin 10.1.1.$i:/etc/sudoers.d/;done

测试admin用户是否可以挂载VIP(只能在MASTER机器上挂载VIP)

  1. # su - admin
  2. [admin@master ~]$ sudo /sbin/ifconfig ens33:1 10.1.1.100 broadcast 10.1.1.255 netmask 255.255.255.0
  3. [admin@master ~]$ sudo /sbin/arping -fqc 5 -w 5 -I ens33 -s 10.1.1.100 -U 10.1.1.10
  4. [admin@master ~]$ ip a
  5. 补充:
  6. arping:用来向局域网内的其它主机发送ARP请求的指令,可以用来测试局域网内的某个IP是否已被使用。
  7. -f:收到第一个响应包后退出。
  8. -qquite模式,不显示输出。
  9. -c:发送指定的countARP REQUEST包后停止。如果指定了-w参数,则会等待相同数量的ARP REPLY包,直到超时为止。
  10. -w:指定一个超时时间,单位为秒,arping在到达指定时间后退出,无论期间发送或接收了多少包。在这种情况下,arping在发送完指定的count(-c)个包后并不会停止,而是等待到超时或发送的count个包都进行了回应后才会退出。
  11. -I:指定设备名,用来发送ARP REQUEST包的网络设备的名称。
  12. -D:重复地址探测模式,用来检测有没有IP地址冲突,如果没有IP冲突则返回0
  13. -s:设置发送ARP包的IP资源地址
  14. -U:无理由的(强制的)ARP模式去更新别的主机上的ARP CACHE列表中的本机的信息,不需要响应。
  15. -h:显示帮助页。

㈣ 创建mha相关配置文件

MHA服务器:创建工作目录

  1. [root@mha ~]# mkdir /etc/mha/
  2. [root@mha ~]# mkdir -p /data/mha/masterha/app1
  3. [root@mha ~]# chown -R admin. /data/mha

创建mha局部配置文件:

  1. [root@mha ~]# vim /etc/mha/app1.conf
  2. [server default]
  3. # 设置监控用户和密码(修改1)
  4. user=mha
  5. password=123
  6. # 设置复制环境中的复制用户和密码(修改2)
  7. repl_user=slave
  8. repl_password=123
  9. # 设置ssh的登录用户名(修改3)
  10. ssh_user=admin
  11. # 设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行failover
  12. ping_interval=3
  13. # 设置mgr的工作目录
  14. manager_workdir=/data/mha/masterha/app1
  15. # 设置mysql master保存binlog的目录,以便MHA可以找到master的二进制日志(修改4)
  16. master_binlog_dir=/usr/local/mysql/data
  17. # 设置master的pid文件(修改5)
  18. master_pid_file=/usr/local/mysql/data/master.itcast.cn.pid
  19. # 设置mysql master在发生切换时保存binlog的目录(在mysql master上创建这个目录)
  20. remote_workdir=/data/mysql/mha
  21. # 设置mgr日志文件(MHA遇到问题,主要看这个日志)
  22. manager_log=/data/mha/masterha/app1/app1-3306.log
  23. # MHA到master的监控之间出现问题,MHA Manager将会尝试从slave1和slave2登录到master上
  24. secondary_check_script=/usr/bin/masterha_secondary_check -s 10.1.1.20 -s 10.1.1.30 --user=admin --port=22 --master_host=10.1.1.10 --master_port=3306
  25. # 设置自动failover时候的切换脚本(故障发生时,自动挂载VIP到SLAVE1或SLAVE2)
  26. master_ip_failover_script="/etc/mha/master_ip_failover.sh 10.1.1.100 1"
  27. # 设置手动切换时候的切换脚本
  28. #master_ip_online_change_script="/etc/mha/master_ip_online_change.sh 10.1.1.100 1"
  29. # 设置故障发生后关闭故障主机脚本
  30. # shutdown_script="/etc/mha/power_manager"
  31. [server1]
  32. hostname=10.1.1.10
  33. port= 3306
  34. candidate_master=1
  35. [server2]
  36. hostname=10.1.1.20
  37. port= 3306
  38. candidate_master=1
  39. [server3]
  40. hostname=10.1.1.30
  41. port= 3306
  42. candidate_master=1

㈤ 上传相应脚本/etc/mha目录,然后更改配置信息,授权

  1. [root@mha ~]# ls /etc/mha/
  2. app1.conf master_ip_failover.sh
  3. 注意:脚本内容中要修改网卡名字和连接用户为admin
  4. my $vip = shift;
  5. my $interface = 'ens33'; 网卡名(38行)
  6. my $key = shift;
  7. ...
  8. sub stop_vip() {
  9. my $ssh_user = "admin"; 用户名(110行)
  10. print "=======$ssh_stop_vip==================\n";
  11. `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
  12. }
  13. [root@mha ~]# chmod +x /etc/mha/master_ip_*

6、检测SSH互信以及MySQL主从状态

MHA:

  1. # su - admin
  2. # 检测SSH互信
  3. [admin@mha ~]$ masterha_check_ssh --conf=/etc/mha/app1.conf
  4. # 检测集群状态
  5. [admin@mha ~]$ masterha_check_repl --conf=/etc/mha/app1.conf

7、检查MHA状态,然后运行MHA(监控开始)

MHA:

  1. [admin@mha ~]$ masterha_check_status --conf=/etc/mha/app1.conf
  2. app1 is stopped(2:NOT_RUNNING).
  3. 开启MHA Manager监控(关键,代表启动MHA):
  4. [admin@mha ~]$ nohup masterha_manager --conf=/etc/mha/app1.conf --remove_dead_master_conf --ignore_last_failover &
  5. 再次查看监控状态:
  6. [admin@mha ~]$ masterha_check_status --conf=/etc/mha/app1.conf
  7. app1 (pid:8913) is running(0:PING_OK), master:10.1.1.10
  8. 注意:
  9. 1. 如果正常,会显示”PING_OK ”,否则会显示”NOT_RUNNING ”,说明 MHA监控没有开启
  10. 2. 使用admin用户启动监控,否则会报权限拒绝
  11. 3. 手动停止监控命令:masterha_stop --conf=/etc/mha/app1.conf

其实到此,咱们MHA就已经配置完毕了!

四、自动Failover测试

1、在MASTER服务器安装测试工具

  1. [root@master ~]# yum -y install sysbench

2、插入测试数据

  1. master服务器上创建测试库test
  2. mysql> create database test charset utf8mb4;
  3. Query OK, 1 row affected (0.17 sec)
  4. mysql> grant all on *.* to 'mha'@'localhost' identified by '123';
  5. Query OK, 0 rows affected (0.14 sec)
  6. mysql> flush privileges;
  7. Query OK, 0 rows affected (0.11 sec)
  8. mysql> exit
  9. Bye
  10. [root@master ~]# sysbench /usr/share/sysbench/oltp_read_only.lua \
  11. --mysql-host=10.1.1.10 --mysql-port=3306 --mysql-user=mha \
  12. --mysql-password=123 --mysql-socket=/tmp/mysql.sock \
  13. --mysql-db=test --db-driver=mysql --tables=1 \
  14. --table-size=100000 --report-interval=10 --threads=128 --time=120 prepare
  15. mysql> select count(*) from sbtest1;
  16. +----------+
  17. | count(*) |
  18. +----------+
  19. | 100000 |
  20. +----------+
  21. 1 row in set (0.01 sec)

3、拍摄快照

MHA、MASTER、SLAVE1、SLAVE2

4、模拟MASTER服务器故障

MHA服务器:监控日志

  1. [root@mgr ~]# tail -f /data/mha/masterha/app1/app1-3306.log

MASTER服务器:

  1. # service mysqld stop

MHA日志显示结果:

故障切换:
image-20200901174326023.png

VIP漂移:
image-20200901174341745.png

常见问题

1、管理节点配置文件错误

  1. [root@mgr ~]# cat /etc/mha/app1.conf
  2. [server default]
  3. # 设置监控用户和密码,该用户是master上创建的数据库管理账号,拥有所有权限
  4. user=mha
  5. password=123
  6. # 设置复制环境中的复制用户和密码,注意需要有以下权限:
  7. #REPLICATION SLAVE和REPLICATION CLIENT
  8. repl_user=slave
  9. repl_password=123
  10. # 设置ssh的登录用户名
  11. ssh_user=admin
  12. ....
  13. [server1]
  14. hostname=10.1.1.10
  15. port= 3306
  16. candidate_master=1
  17. [server2]
  18. hostname=10.1.1.20
  19. port= 3306
  20. candidate_master=1
  21. [server3]
  22. hostname=10.1.1.30
  23. port= 3306
  24. candidate_master=1
  25. 注意:一定要配置正确的IP和端口号

2、配置MHA时数据只读设置

错误1.png

解决办法:设置从服务器为只读

  1. mysql> set @@global.read_only=1;
  2. Query OK, 0 rows affected (0.00 sec)
  3. mysql> show variables like 'read_only';
  4. +---------------+-------+
  5. | Variable_name | Value |
  6. +---------------+-------+
  7. | read_only | ON |
  8. +---------------+-------+
  9. 1 row in set (0.00 sec)

3、复制用户权限密码错误

错误2.png

原因:

  1. 复制用户slave没有相关权限,REPLICATION SLAVE和REPLICATION CLIENT
  2. 从服务器没有创建复制用户

4、其他错误

MHA集群至少需要2个slave,所以如果只有一台slave的话,检查也是通不过的!