RPO和RTO是衡量灾备方案的两个重要指标,RPO-恢复点目标,决定了丢失多少数据,RTO-恢复时间目标,决定了业务中断了多长时间。由于传统的Hadoop集群灾备方式使用的是distcp来做容灾,也就意味着数据复制不是实时的,因此用户必须承受至少小时级到天级的RPO。并且主站宕机后,将只读集群或二级存储中的数据恢复出来会占用大量时间,而拉起standby集群重新启动业务依然是一个耗时的操作。因此,传统的Hadoop集群灾备方式在RPO和RTO方面都有较大挑战
1 原生的容灾
Hadoop集群灾备方式使用的是distcp来做容灾,定时远端拷贝
DistCp(分布式拷贝)是用于大规模集群内部和集群之间拷贝的工具。 它使用Map/Reduce实现文件分发,错误处理和恢复,以及报告生成。 它把文件和目录的列表作为map任务的输入,每个任务会完成源列表中部分文件的拷贝。
2 阿里的组件
HDR- BD此次带来的双向实时复制技术可以在两个Hadoop集群之间建立双活架构,RPO接近0;RTO因为数据随时可读写而极大压缩;双活架构可以让两个集群运行不同的应用,避免资源浪费。这些特性将Hadoop灾备标准提高到了一个全新的高度,为Hadoop用户带来了极高的价值
阿里云此次推出的Hadoop双活容灾方案HDR-BD引入了业界领先的大数据双向复制技术,结合强大的公共云基础设施,可以满足极高要求的大数据灾备场景,为企业Hadoop集群数据保护提供了全新的选择。
HDR-BD的优势在于:
- 极低RPO:数据的实施复制决定了每一个写操作都会实时复制到配对集群,RPO几乎为0
- 极高资源利用率:数据双向复制确保两个集群共享一份数据但运行不同应用,不会出现一个集群必须处于只读会备用状态的问题,计算资源可以充分利用
- 运维复杂度极低: HDR-BD实现了数据的全自动实时双向复制,无需特定时间窗口,也无需担心对业务的影响
在自建数据中心和阿里云之间部署HDR-BD服务器配对,用户就可以将自建Hadoop集群与阿里云无缝集成,充分利用阿里云EMR和OSS建立极为高效的Hadoop灾备,迁移系统。HDR-BD可以满足的核心场景包括
1.近0 RPO Hadoop云容灾
将自建Hadoop集群的数据实时复制到阿里云EMR集群,实现接近0 RPO的Hadoop集群容灾。
2.Hadoop集群与阿里云EMR集群双活
在自建Hadoop集群和阿里云EMR集群之间建立数据双向复制。两个集群共享一份数据,但是运行不同的应用,实现集群双活,达到资源的最大化利用。
3.Hadoop数据实时备份,迁移上云
云上HDR-BD服务器可以直连至阿里云对象存储OSS。在无需EMR集群的情况下,HDR for Big Data可以将Hadoop数据实时复制到阿里云OSS,实现接近0 RPO的云备份;同时这个机制也可以作为Hadoop数据迁移上云的理想方案。利用这个机制做Hadoop集群迁移上云,在迁移过程中无需启动EMR集群;同时迁移过程无需复杂定制化脚本开发或者复杂的业务停机规划。
