1.简介
①HBase默认采用异步复制的方式同步数据,即客户端执行完put之后,RegionServer的后台线程不断推送HLog的Entry到Peer集群
2.复制场景及原理
①步骤一:先确认表的多个Column Family都已经将REPLICATION_SCOPE设为1
②步骤二:在集群A上添加一条DISABLED复制链路,提前把主机集群正在写入的HLog堵在复制队列中
③步骤三:对TableX做一个Snapshot,并用HBase内置的ExportSnapshot工具把Snapshot拷贝到离线集群上。注意不要使用distcp拷贝Snapshot,因为在某些情况下造成数据丢失
④步骤四:待Snapshot数据拷贝完成后,从Snapshot中恢复一个TableX表到离线集群
⑤步骤五:打开步骤一中添加的Peer
⑥步骤六:等待Peer=100,所有堵住的Hlog都被在线集群推送到离线集群,也就是两个集群的复制延迟等于0.
