概述
解决的问题:
建立和执行稳定、高效、有效的备份方案,是保障IT系统和数据资产安全所必需的。备份系统可以保证在应用系统或数据出现问题的情况下能够回退到正常状态,是企业IT安全的最后一道防线。云计算在提供弹性、敏捷的、经济的IT服务的同时,也对应用系统和数据的可靠性提出了新的挑战。企业IT部门应当充分利用公有云厂商提供的多种备份功能、服务和工具,制定适合自身业务特性的备份策略,以保障企业的业务连续性和数据安全性。提供的内容:
针对不同需求类型,业务场景以及IT规模,评估业务功能需求,为客户制定合理的云环境备份策略提供参考,包含且不限于云产品主机备份策略、数据库备份策略、云存储备份策略。云环境下备份要点
制定云环境下备份策略时,应注意: 1.根据业务/成本的需求制定RPO/RTO 容灾和备份要保证灾难发生时系统能够做到最快恢复和最小损失,RTO和RPO是衡量容灾和备份的两个重要指标,通俗来讲,是这两个指标可以描述为业务连续性目标及数据一致性目标。- RTO(Recovery Time Objective): 即恢复时间目标,主要指当发生灾难或紧急事件时,业务系统所能容忍的停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。
- RPO(Recovery Point Objective): 即数据恢复点目标,主要指当发生灾难或紧急事件时,业务系统所能容忍的数据丢失量。
云主机备份策略
公有云厂商通过其技术框架,提供底层硬件(物理层面)和虚拟化层面的可用性,并从物理层保证数据的高可靠性,确保数据不会因为物理硬件的损坏而丢失。然而还有很多其他途径导致数据的丢失,例如误删除、勒索病毒、逻辑错误等等。公有云厂商针对云服务器,往往提供了快照、镜像等多种备份方式。应充分利用这些备份方式,对云服务器进行备份。快照
所谓快照,就是某一个时间点上某一个磁盘的数据备份。 快照是非常有用的备份方式,使用快照可以在以下场景中迅速恢复数据:- 病毒感染
- 人为误操作
- 恶意篡改
- 系统宕机造成的数据损坏
- 应用程序BUG造成的数据损坏
- 存储系统BUG造成的数据损坏
- 手动快照由您手动创建。您可以根据需要,手动为磁盘创建快照,作为数据备份。
- 公有云厂商(如阿里云)一般提供自动快照功能,自动为您创建快照。您需要首先创建自动快照策略,然后再把自动快照策略应用到磁盘上,公有云平台就会在您设置的时间,自动为该磁盘创建快照。
- 自动快照策略可以对多块磁盘同时创建快照,提高了管理员的工作效率;
- 快照的保留期限可以自定义,这样子可以保证快照不会积累过多占用服务器的空间;
- 可以根据实际需求自定义快照的创建时间,重复日期,灵活调整需求,减少人工干预,节省管理员的时间,真正实现自动化运维;
- 系统盘:每天凌晨0:00执行,保留30天
- 应用服务器:每天22:00执行,保留60天
- 文件服务器:每6小时执行一次,保留30天
- 数据库服务器:每天7点和19点执行,保留30天
- 备份短期内不会更改的系统,如已经完成发布或更新的应用系统。
- 以已经完成安装和配置的系统为模板,创建新的应用服务器,如批量部署。
- 系统及数据迁移,如将经典网络的ECS迁移到VPC下。
- 跨可用区和地域还原。
- 在使用 Linux 系统创建自定义镜像时,注意不要在 /etc/fstab 文件中加载数据盘的信息,否则使用该镜像创建的实例无法启动。
- 强烈建议您在制作自定义镜像前把 Linux 下的数据盘都 unmount,然后再打快照和创建自定义镜像,否则有可能造成以该自定义镜像创建的云服务器不能启动和使用。
- 内核和操作系统版本请不要随意进行升级。
- 请勿调整系统盘分区,目前只支持单个根分区。
- 请检查系统盘使用剩余空间,确保系统盘没有被写满。
- 请勿修改关键系统文件如 /sbin, /bin, /lib 目录等。
- 请勿修改默认登录用户名root。
- 按备份集恢复:您可以将指定备份集的数据恢复到一个临时实例或克隆实例上。您可以在临时实例或克隆实例上检查自己的数据是否完好。
- 按时间点恢复:您可以选择临近时间点,系统根据全量备份以及之后的日志备份,将数据重新放到一个临时实例或克隆实例上。
- 覆盖性恢复:您可以将指定备份集的数据恢复到当前RDS实例上,而非临时实例或克隆实例。但若您使用这种恢复方式,恢复后的实例将不具备数据恢复功能,谨慎使用。数据恢复功能和备份策略紧密相关,其中:
- 数据恢复的早时间取决于早一个数据备份(与数据备份的频率和过期策略相关)。
- 数据恢复的晚时间取决于后一个日志备份(与日志生成量有很大关系)。
- 数据恢复是否支持按时间点恢复取决于日志备份是否开启。
- 数据恢复的速度取决于数据备份的频率(也与日志生成量有很大关系)。