转载:《数据库主从不一致,怎么解?》

背景

常见的数据库集群架构如何?
一主多从,主从同步,读写分离。

数据库主从不一致 - 图1

如上图:

  • 一个主库提供写服务;
  • 多个从库提供读服务,可以增加从库提升读性能;
  • 主从之间同步数据;

为什么会出现不一致?

主从同步有时延,这个时延期间读从库,可能读到不一致的数据。

数据库主从不一致 - 图2

如上图:

  • 服务发起了一个写请求;
  • 服务又发起了一个读请求,此时同步未完成,读到一个不一致的脏数据;
  • 数据库主从同步最后才完成;

如何避免这种主从延时导致的不一致?

常见的方案有下面几种。

方案

忽略

任何脱离业务的架构设计都是耍流氓,绝大部分业务,例如:百度搜索,淘宝订单,QQ 消息,58帖子都允许短时间不一致。

如果业务能够接受,别把系统架构搞得太复杂。

强制读主

数据库主从不一致 - 图3

如上图:

  • 使用一个高可用主库提供数据库服务;
  • 读和写都落到主库上;
  • 采用缓存来提升系统读性能;

这是很常见的微服务架构,可以避免数据库主从一致性问题。

选择性读主

强制读主过于粗暴,毕竟只有少量写请求,很短时间,可能读取到脏数据。

有没有可能实现,只有这一段时间,可能读到从库脏数据的读请求读主,平时读从呢?

可以利用一个缓存记录必须读主的数据。

数据库主从不一致 - 图4

如上图,当写请求发生时:

  1. 写主库;
  2. 将哪个库,哪个表,哪个主键三个信息拼装一个 key 设置到 cache 里,这条记录的超时时间,设置为“主从同步时延”,key 的格式为 db:table:PK,假设主从延时为1s,这个 key 的 cache 超时时间也为1s。

数据库主从不一致 - 图5

如上图,当读请求发生时:

这是要读哪个库,哪个表,哪个主键的数据呢,也将这三个信息拼装一个 key,到 cache 里去查询,如果,

  • cache 里有这个 key,说明1s内刚发生过写请求,数据库主从同步可能还没有完成,此时就应该去主库查询;
  • cache 里没有这个 key,说明最近没有发生过写请求,此时就可以去从库查询;

以此,保证读到的一定不是不一致的脏数据。

作者:殷建卫 链接:https://www.yuque.com/yinjianwei/vyrvkf/duwe93 来源:殷建卫 - 架构笔记 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。