canal [kə’næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费
早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。
基于日志增量订阅和消费的业务包括

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

自适配项目 配合es

分离节点
image.png

mysql同步es的同步方案

开启和使用binlog

配置主节点

  1. # ------------- binlog 主节点配置 ------------------------
  2. #[必须]服务器唯一ID,默认是1
  3. server-id= 1
  4. # 只保留7天的二进制日志,以防磁盘被日志占满
  5. expire-logs-days = 7
  6. #不备份的数据库
  7. binlog-ignore-db=mysql
  8. binlog-ignore-db=information_schema
  9. binlog-ignore-db=performation_schema

查看(第一个)binlog文件的内容,可以指定文件,增加参数in ‘文件名称’参数

  1. show master status;

查看binlog日志位置

  1. show variables like '%datadir%';

+———————-+————————-+ | Variable_name | Value | +———————-+————————-+ | datadir | /var/lib/mysql/ | +———————-+————————-+

指定使用master节点数据

指定使用master节点数据,避免更新不到,执行语句前加上 /*MASTER*/ 注释。