概述

解决的问题:

建立和执行稳定、高效、有效的备份方案,是保障IT系统和数据资产安全所必需的。备份系统可以保证在应用系统或数据出现问题的情况下能够回退到正常状态,是企业IT安全的最后一道防线。云计算在提供弹性、敏捷的、经济的IT服务的同时,也对应用系统和数据的可靠性提出了新的挑战。企业IT部门应当充分利用公有云厂商提供的多种备份功能、服务和工具,制定适合自身业务特性的备份策略,以保障企业的业务连续性和数据安全性。

提供的内容:

针对不同需求类型,业务场景以及IT规模,评估业务功能需求,为客户制定合理的云环境备份策略提供参考,包含且不限于云产品主机备份策略、数据库备份策略、云存储备份策略。

云环境下备份要点

制定云环境下备份策略时,应注意: 1.根据业务/成本的需求制定RPO/RTO 容灾和备份要保证灾难发生时系统能够做到最快恢复和最小损失,RTO和RPO是衡量容灾和备份的两个重要指标,通俗来讲,是这两个指标可以描述为业务连续性目标及数据一致性目标。
  • RTO(Recovery Time Objective): 即恢复时间目标,主要指当发生灾难或紧急事件时,业务系统所能容忍的停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。
  • RPO(Recovery Point Objective): 即数据恢复点目标,主要指当发生灾难或紧急事件时,业务系统所能容忍的数据丢失量。
一个适合企业的备份方案,必然是在业务对RTO/RPO的需求、成本和可维护性等多方面的平衡。 2.根据自身架构特点和公有云厂商提供的备份工具和接口,制定备份策略 除了传统的IT环境备份方式和工具外,公有云厂商往往提供了丰富的备份策略和功能的支持,不同级别的备份接口和工具。但是对于用这些云厂商备份工具备份数据的访问,往往受到限制。用户并不能轻松高效地管理备份数据。用户应充分熟悉和评估传统备份方式和公有云厂商提供的备份工具, 制定适合自己的备份方案和策略。

云主机备份策略

公有云厂商通过其技术框架,提供底层硬件(物理层面)和虚拟化层面的可用性,并从物理层保证数据的高可靠性,确保数据不会因为物理硬件的损坏而丢失。然而还有很多其他途径导致数据的丢失,例如误删除、勒索病毒、逻辑错误等等。公有云厂商针对云服务器,往往提供了快照、镜像等多种备份方式。应充分利用这些备份方式,对云服务器进行备份。

快照

所谓快照,就是某一个时间点上某一个磁盘的数据备份。 快照是非常有用的备份方式,使用快照可以在以下场景中迅速恢复数据:
  • 病毒感染
  • 人为误操作
  • 恶意篡改
  • 系统宕机造成的数据损坏
  • 应用程序BUG造成的数据损坏
  • 存储系统BUG造成的数据损坏
快照可以分为手动快照和自动快照:
  • 手动快照由您手动创建。您可以根据需要,手动为磁盘创建快照,作为数据备份。
  • 公有云厂商(如阿里云)一般提供自动快照功能,自动为您创建快照。您需要首先创建自动快照策略,然后再把自动快照策略应用到磁盘上,公有云平台就会在您设置的时间,自动为该磁盘创建快照。
自动快照策略与普通快照相比有以下优势:
  • 自动快照策略可以对多块磁盘同时创建快照,提高了管理员的工作效率;
  • 快照的保留期限可以自定义,这样子可以保证快照不会积累过多占用服务器的空间;
  • 可以根据实际需求自定义快照的创建时间,重复日期,灵活调整需求,减少人工干预,节省管理员的时间,真正实现自动化运维;
通过创建磁盘的自动快照策略,可以方便的定义自动快照的创建时间、重复时间和保留时间等参数,可参考 为磁盘设置自动快照策略。对于不同类型的数据,我们可以采取不同的快照策略来实现更精细化的数据备份颗粒度。以下快照策略供参考:
  • 系统盘:每天凌晨0:00执行,保留30天
  • 应用服务器:每天22:00执行,保留60天
  • 文件服务器:每6小时执行一次,保留30天
  • 数据库服务器:每天7点和19点执行,保留30天
自动快照的策略创建后,还可以根据具体的业务需求进行修改,可参考 创建或修改自动快照策略删除快照和自动快照策略 ## 镜像 快照是跟随虚拟机磁盘存储的,不能脱离虚拟机磁盘使用,而虚拟机磁盘不能跨可用区和区域恢复。如果我们需要将备份存储或恢复到其他可用区、区域时,就要用到自定义镜像。 镜像是云服务器 ECS 实例运行环境的模板,一般包括操作系统和预装的软件。 镜像适用场景:
  • 备份短期内不会更改的系统,如已经完成发布或更新的应用系统。
  • 以已经完成安装和配置的系统为模板,创建新的应用服务器,如批量部署。
  • 系统及数据迁移,如将经典网络的ECS迁移到VPC下。
  • 跨可用区和地域还原。
1.使用实例创建自定义镜像 通过基于实例创建自定义镜像,我们可以把实例中的所有磁盘,包括系统盘和数据盘中的数据,全部完整的复制到自定义镜像中。在创建自定义镜像的过程中,该实例的每块磁盘都会自动创建一个新快照,这些新快照构成了一个完整的自定义镜像。详细操作可参考 使用实例创建自定义镜像 注意:请将实例中的敏感数据删除之后再创建自定义镜像,避免数据安全隐患。 2.使用快照创建自定义镜像 自定义镜像是 ECS 实例系统盘某一时刻的快照,我们可以使用快照创建自定义镜像,将快照的操作系统、数据环境信息完整的包含在镜像中。然后使用自定义镜像创建多台具有相同操作系统和数据环境信息的实例,非常方便的复制实例,而且也快速节省管理员的时间,提高了管理员的工作效率。详细操作可参考 使用快照创建自定义镜像 Linux实例的注意事项:
  • 在使用 Linux 系统创建自定义镜像时,注意不要在 /etc/fstab 文件中加载数据盘的信息,否则使用该镜像创建的实例无法启动。
  • 强烈建议您在制作自定义镜像前把 Linux 下的数据盘都 unmount,然后再打快照和创建自定义镜像,否则有可能造成以该自定义镜像创建的云服务器不能启动和使用。
  • 内核和操作系统版本请不要随意进行升级。
  • 请勿调整系统盘分区,目前只支持单个根分区。
  • 请检查系统盘使用剩余空间,确保系统盘没有被写满。
  • 请勿修改关键系统文件如 /sbin, /bin, /lib 目录等。
  • 请勿修改默认登录用户名root。
创建了自定义镜像后,建议您合理管理自己的镜像资源。您可以重新修改自定义镜像的名称和描述,或者删除不再需要的自定义镜像以确保镜像额度不超过使用限制。详情可参考 管理自定义镜像 # 数据库备份策略 ## 云数据库备份策略 为保证数据的完整性和可靠性,数据库需要进行备份来保障数据的可恢复性。 不同公有云厂商为其云数据库提供了不同的备份方式,用户可通过配置备份策略,实现对云数据库的自动备份或手动备份。 以阿里云为例,阿里云RDS提供如下两种备份功能: 1.数据备份:强制项,用户每周必须选择两天及两天以上的备份周期和备份时间段来进行全量的常规物理备份。另外,用户也可以根据运维需要,通过控制台或者API随时发起全量的临时物理备份。建议配置自动备份,每周进行一次全量备份,每天进行一次增量备份。在系统变更或遇业务重大时间节点时可发起手动备份。 2.日志备份:可选项,您可以选择开启或者关闭。如果关闭日志备份,那么恢复数据时只能恢复到数据备份集所在的时间点。数据备份和日志备份使用相同的过期删除策略。您可以将备份过期的天数设置为7到730中的任何一个数字,也可以通过调整过期策略实时删除较老的备份。 关于阿里云云数据库数据备份的详细指导可参考 备份RDS数据 数据备份后,同时要保证备份数据的可恢复,因为数据可恢复性是判断数据库运维可靠性的关键指标。 以阿里云为例,阿里云RDS提供如下三种恢复功能:
  • 按备份集恢复:您可以将指定备份集的数据恢复到一个临时实例或克隆实例上。您可以在临时实例或克隆实例上检查自己的数据是否完好。
  • 按时间点恢复:您可以选择临近时间点,系统根据全量备份以及之后的日志备份,将数据重新放到一个临时实例或克隆实例上。
  • 覆盖性恢复:您可以将指定备份集的数据恢复到当前RDS实例上,而非临时实例或克隆实例。但若您使用这种恢复方式,恢复后的实例将不具备数据恢复功能,谨慎使用。数据恢复功能和备份策略紧密相关,其中:
    • 数据恢复的早时间取决于早一个数据备份(与数据备份的频率和过期策略相关)。
    • 数据恢复的晚时间取决于后一个日志备份(与日志生成量有很大关系)。
    • 数据恢复是否支持按时间点恢复取决于日志备份是否开启。
    • 数据恢复的速度取决于数据备份的频率(也与日志生成量有很大关系)。

云主机自建数据库备份策略

云主机自建数据库,即在公有云厂商提供的云主机及其运行环境之上,用户自行安装数据库。 在备份方面,相对于云数据库,云主机上自建数据库需自行实现数据备份,需要寻找备份存放空间以及定期验证备份是否可恢复。云主机自建数据库的备份策略,可以认为与传统数据中心中的数据库备份区别不大。 而对于备份数据的存放和管理,则较之云数据库有较大程度的灵活和自主。而较之传统数据中心的数据库备份,云主机自建数据库备份得到的备份文件往往首次存放位置位于公有云上(通常位于云主机硬盘内)。为保证备份数据的有效性和容灾,至少应将备份文件复制至采用云存储(如对象存储,共享文件存储等)之上,利用云存储的分布式和多副本技术,提高数据可靠性。在此基础上,用户亦可根据自身对数据可靠性和业务持续性的需求,选择将备份文件进行异地备份,或由云端备份至用户的数据中心。具体方法可参见本文的”非结构化数据备份策略”。

阿里云数据库备份服务DBS

在阿里云上,通过数据库备份DBS将本地IDC、公网、第三方云数据库、阿里云RDS和阿里云ECS自建数据库实时备份到OSS上。 数据库备份DBS是为数据库提供连续数据保护、低成本的备份服务。它可以为多种环境的数据提供强有力的保护,包括企业数据中心、其他云厂商及公共云。数据库备份提供数据备份和操作恢复的整体方案,具备实时增量备份、精确到秒级的数据恢复能力。 数据库备份到OSS的方案实施流程如下:
  1. 创建备份计划。详情请参见创建备份计划
  2. 配置备份计划。详情请参见配置备份计划
  3. 查看备份计划。详情请参见查看备份计划
  4. 恢复数据库。详情请参见恢复数据库
关于数据库备份DBS对数据库数据的备份操作,可参考 数据库备份到OSS # 非结构化数据备份策略 ## 云主机上文件备份策略 针对云主机上文件的备份,可使用多种不同的工具进行备份。 1.最常见的策略将文件备份至其他主机或共享文件存储上。其中rsync为最常用的工具,支持增量复制。 可参考 RHCE系列之备份工具——镜像备份Rsync 2.亦可将云主机上文件,拷贝至云存储上(如阿里云OSS,AWS的S3等)。云存储因其弹性扩容,按需付费,易于管理,免于运维等特性,适合作为数据备份的目标。通常,公有云厂商或第三方开源项目中,会提供各种不同工具,帮助实现将主机(包括云主机)上的文件备份至云存储之上。 以阿里云OSS为例,阿里云提供了多种 命令行或图形化的工具,阿里云OSS的帮助文档列出了这些不同工具。推荐使用OssUtil, OssImport工具,若需要使用图形化工具,可使用OssBrowser 3.备份即服务 针对云环境下的备份需求,各公有云厂商相继推出了备份即服务(Backup as a Service)产品,结合备份软件的企业级的优点和云环境的优势。部分备份即服务产品对文件备份支持较好。 以阿里云为例,其“混合云备份”产品,即可用于备份云主机上的文件系统。

云上对象存储备份策略

对于云上对象存储(如阿里云OSS,AWS的S3等)中的数据,公有云厂商一般会提供跨数据中心级别的数据备份容灾方案,帮助用户仅通过控制台配置,或通过API/SDK, 实现云上对象存储数据的异地备份。建议用户根据实际需求,使用这些方案,进行数据备份。 以阿里云为例,跨区域复制提供了控制台配置操作以及基于API/SDK两种模式,可实现对象存储数据的云上异地备份。具体请参考管理跨区域复制备份OSS存储空间