什么是云容灾?
云容灾一般是指云数据中心的虚拟机或物理机容灾。
云容灾解决了建设成本高,资源利用不足,管理困难,切换时间长,业务连续性差的问题。
云容灾兼容多业务系统,建设简单,灾备资源能够以服务方式提供。
云容灾和云备份的差异?
云备份,是指备份技术将生产存储数据直接备份到云端,进而实现数据备份与恢复功能。
云备份产品最早可以追溯到云计算概念兴起的时候,且在网盘、手机备份等产品的推动下,及防范勒索软件、云平台故障、人为误操作、业务测试等需求下,云备份逐渐成为一种刚需。
云备份注重数据备份的安全性,并未实现有效的数据恢复,业务连续性难以实现。
云容灾不仅有备份的安全性,还可以快速恢复数据,实现业务连续性的目标。
由于发生灾难时,云备份所起到的作用局限于保护数据的安全,而恢复数据拉起业务的速度非常慢,恢复时间长,恢复对象不完整,业务连续难以实现,所以云备份已经很难满足当前的多云市场需求。
云容灾技术在达到了云备份的作用的基础上,还满足了云备份无法满足的这些市场需求,凸显了云容灾的优越性。
云容灾和传统容灾的优缺点?
传统容灾
传统容灾主要是本地容灾和异地容灾两种方式,都是通过建立灾备中心来保护生产中心的数据资源。其中,异地容灾要求数据中心间距离须保证在三百公里以上,同时还必须做到“三不”,即不在同一地震带,不在同一电网,不在同一江河流域。
灾备中心是和生产中心类似的信息资源平台,当生产中心的主机不能正常工作时,灾备中心的主机可以替换该主机,继续正常工作提供服务。
传统容灾根据运营模式可以分为主备和双活两种形式:
主备模式即生产中心正常对外提供服务时,同步将数据单项复制到备端数据中心,且备端不对外提供服务。一旦生产中心故障,备端生产中心接管服务。
这种模式资源投入较低且技术实施和后期维护相对简单,但是灾后业务恢复速度慢。
传统主备模式的弊端在于,备端长时间处于待机状态,存在资源浪费情况。且多种潜在因素如心跳线中断、网络短时间中断、应用服务器响应不及时等,容易导致在生产中心实际运行正常情况下进行误切换,即存在“脑裂”现象。
双活模式下的两个数据中心分别对外提供服务,且彼此之间保持双向复制。一旦一端故障,另 一端立即接管其业务,保障业务的连续性。这种方式相较于主备模式,其业务恢复速度更快,但整体资源投入更高,实施及运维难度更复杂,且存在业务冲突风险。
传统方式的数据管理已经不能满足许多企业的数据恢复和保护的需要。从企业的角度,花在数据保护上的高昂费用,面对越来越高的行业数据存储规范标准,传统的保存模式已经显得越来越木讷了。
云容灾
云容灾技术的云主机系统由大量服务器组成,并分布在不同的地点,同一时间为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。云容灾技术还具有以下特点:
(1)基础设施少
抛弃了采购传统的灾备服务器,借助云平台供应商提供的计算和存储平台,或者直接采用云容灾 DRaaS 应用服务。解决系统崩溃的苦恼,用户也不再需要去采购新的存储设备, 以及随之带来的维护需求和成本消耗。用户甚至可以关闭备份中心,在节省更多的物理空间的同时, 也可以节省更多的 IT 资源,将相关的维护人员解放出来,参与到其它的工作中去。
(2)iT成本降低
云存储系统则主要采用大量廉价的普通主机,是基于网络,利用分布式协同软件,将数据分散存储于若干通用存储服务器上,并通过副本或编码方法进行综合管理,向用户提供可靠的统一的逻辑存储空间,但单台云主机故障发生概率也相对较高,所以基于云主机、云存储的容灾机制必须开始就被包含在架构设计和每个开发环节中。
根据具体需要采用更为经济、更具弹性的云存储进行备份,免去自建数据中心所带来的硬件购买及维护成本,免去维护各种硬件所带来的烦恼,实现了对资源的精细化管理,进而减少大部分的灾备支出。
(3)按需付费
不同于传统的灾备方案需要建立架构完全对应的灾备中心,云容灾可以采用云基础设施,或者灾备即服务的模式,允许用户自由选定重要的系统和数据。因为底层架构被其它采用同样云计算解决方案的公司所共有,共同分担成本,所以用户只需为实际所使用的资源付费,从而大大减少了资源的浪费,并提升了效率。
(4)高度机动性
基于虚拟化云计算技术,实现了在主节点发生异常而无法提供服务时,仍然在云端保持系统的稳定运行。只要能连上网络,员工仍能继续在原有的服务器环境中工作。这种高度机动性,使得从一个办公场所移动到另一个场所,或短期的在家办公都极为方便。
(5)高度灵活性
云容灾使得业务需求更容易评估,用户可以更准确预估哪个系统、甚至哪个子系统需要维护。 也可以更细粒度地选择关键的数据来优化自身的备份计划,而不是整个地完全备份,更精确地设置 RPO ,即能容忍的最大数据丢失量。云中建立的高可用、高容错架构可以提升恢复时间和恢复点目标,基于公有云平台或者开源的私有云技术,也可以简便快速灵活地构建灾备节点并将数据迁移或者复制到云端,提升灾难恢复的速度。
(6)快速恢复
对于灾难发生时,多长的停机时间是可接受的,不同的用户针对自身业务特点有不同需求。而如果服务器宕机、长时间的电力中断、光纤挖断或突发的自然灾害,这些意外发生后多久会导致损失, 对于很多用户而言是即时的灾难后果。因为即使有传统定制的远程备份,仍然需要时间去做数据的恢复和业务重启,且取决于远程备份的地点远近和远程服务器的性能。
随着云容灾云高可用的出现,你可以预先准确估计恢复的时间,确保停机时间在一个可接受的合理范围内,从而制定一个准确、可交付的 SLA 协议,并远程使用云计算和云存储资源。
(7)安全备份
很多组织都有和现有生产系统直接或间接在一起的备份系统。但很多灾难发生时,会同时对当前的网络系统造成冲击,从而影响到相关联的备份数据及系统。如相应的系统被网络攻击或篡改数据,则对应的备份系统也不能幸免。而云容灾采用的云平台一般具有高可靠高标准的异地云数据中心等基础设施,使得备份被安全地存储在异地。当然服务商以及云容灾技术选择很重要,比如是否具备云端 CDP 持续数据保护能力等。
云容灾,是以云服务的方式为企业提供提供数据容灾备份服务,企业无需投入大量时间、人力、资源成本,具有即开即用,按需付费,弹性扩容,方便管理等特点。向企业提供面向云端、虚拟和物理环境下的数据、平台、应用备份/恢复的云服务平台,可满足企业当前和未来的数据管理需要。
容灾主要应用于哪些场景及分层体现?
数据级容灾是指通过建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。在数据级容灾方式下,所建立的异地容灾中心可以简单地把它理解成一个远程的数据备份中心。数据级容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。
应用级容灾是在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生,这样就使系统所提供的服务是完整的、可靠的和安全的。应用级容灾生产中心和异地灾备中心之间的数据传输是采用异类的广域网传输方式;同时应用级容灾系统需要通过更多的软件来实现,可以使多种应用在灾难发生时可以进行快速切换,确保业务的连续性。
业务级容灾是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。其大部分内容是非IT系统(如电话、办公地点等),当大灾难发生后,原有的办公场所都会受到破坏,除了数据和应用的恢复,更需要一个备份的工作场所能够正常的开展业务。
RTO、RPO容灾参数的定义?
RTO (Recovery Time Objective) 恢复时间目标
RTO是指灾难发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持业务部门运作,业务恢复运营之时,此两点之间的时间。RTO可简单地描述为企业能容忍的恢复时间。
例如银行系统发生灾难导致业务停止,至少要在2h内恢复业务运营,那么银行系统的RTO就是2h。
RPO (Recovery Point Objective) 恢复点目标
RPO是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。RPO可简单地描述为企业能容忍的最大数据丢失量。
例如银行系统每天00:00进行数据备份,当天02:00发生灾难,那么银行系统的RPO就是2h。
CDP技术的实现?
CDP(continual data protection)连续数据保护,是一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。
CDP分为真CDP(True CDP)和准CDP (Near CDP)两类。
真CDP不间断地监控数据变化,生成瞬间快照,可以恢复到过去任意时间点,缺点是开销大。
准CDP持续的记录数据变化,按一定时间频率生成快照,优点是开销小,更实用。
容灾技术名词解释
容灾故障切换(Failover)
容灾故障切换是在灾难发生之后,将生产中心的业务切换到容灾站点运行,从而保障业务的连续性。
在出现灾难或者机房级故障的情况下,为了在规定的时间范围内,恢复服务,可能会出现RPO > 0的情况,即在该操作下,可能会出现数据丢失情况。
容灾故障回切(Failback)
容灾故障回切是在生产中心遭遇灾难,环境恢复之后,将容灾站点备份的数据恢复到生产中心上。
业务连续性计划(BCP)
业务连续性计划(**Business Continuity Plan**)是一套基于业务运行规律的管理要求和规章流程,使一个组织在突发事件面前能够迅速作出反应,以确保关键业务功能可以持续,而不造成业务中断或业务流程本质的改变。
业务连续性(**Business Continuity**)是指企业有应对风险、自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面。
1.高可用性(High availability) 。它是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。
2.连续操作(Continuous operations)。 它是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
3.灾难恢复(Disaster Recovery)。它是指当灾难破坏生产中心时,在不同的地点恢复数据的能力。
同时,上述三个部分不是相互孤立的,是相互关联,而且有交叉的。
灾难恢复计划(DRP)
灾难恢复计划(Disaster Recovery Plan)是应对信息系统可能遇到的各种灾难而制定的一套详尽、完整的信息系统恢复方案。
灾难恢复(Disaster recovery,也称灾备),指自然或人为灾害后,重新启用信息系统的数据、硬件及软件设备,恢复正常商业运作的过程。灾难恢复规划是涵盖面更广的业务连续规划的一部分,其核心即对企业或机构的灾难性风险做出评估、防范,特别是对关键性业务数据、流程予以及时记录、备份、保护。
区分业务连续性和灾难恢复是很必要的。严格地说,灾难恢复是恢复数据的能力,是业务连续性计划的一部分。
云市场的快速发展下,云容灾还需要满足哪些业务资源的备份容灾?
在多云市场中,容云灾需要满足各种有需求的iT资源备份容灾。例如,传统业务形态的主机、应用、数据库等IDC资源;云场景业务形态的对象存储、文件存储、块存储、数据库、容器等不同层面的IDC资源。
其他名词解释
3.1.互联网数据中心(IDC)
互联网数据中心(Internet Data Center,简称IDC)是指一种拥有完善的设备(包括高速互联网接入带宽、高性能局域网络、安全可靠的机房环境等)、专业化的管理、完善的应用服务平台。在这个平台基础上,IDC服务商为客户提供互联网基础平台服务(服务器托管、虚拟主机、邮件缓存、虚拟邮件等)以及各种增值服务(场地的租用服务、域名系统服务、负载均衡系统、数据库系统、数据备份服务等)。
3.2.对象存储
对象存储(Object-based Storage)是一种新的网络存储架构,基于对象存储技术的设备就是对象存储设备(Object-based Storage Device)简称OSD。
就像文件一样,对象包含数据,但是和文件不同的是,对象在一个层结构中不会再有层级结构。每个对象都在一个被称作存储池的扁平地址空间的同一级别里,一个对象不会属于另一个对象的下一级。文件和对象都有与它们所包含的数据相关的元数据,但是对象是以扩展元数据为特征的。每个对象都被分配一个唯一的标识符,允许一个服务器或者最终用户来检索对象,而不必知道数据的物理地址。这种方法对于在云计算环境中自动化和简化数据存储有帮助。
对象存储经常被比作在一家高级餐厅代客停车。当一个顾客需要代客停车时,他就把钥匙交给别人,换来一张收据。这个顾客不用知道他的车被停在哪,也不用知道在他用餐时服务员会把他的车移动多少次。在这个比喻中,一个存储对象的唯一标识符就代表顾客的收据。
对象存储同时兼具块存储直接访问磁盘特点及文件存储的分布式共享特点,解决了文件共享的难题,读写的速度也更快。
对象存储最常用的方案,就是多台服务器内置大容量硬盘,再装上对象存储软件,然后再额外配置几台服务器作为管理节点,安装上对象存储管理软件。管理节点可以管理其他服务器对外提供读写访问功能。
例如,主流的对象存储云服务有:腾讯云的对象存储(Cloud Object Storage,COS)分布式存储服务、阿里云的对象存储OSS(Object Storage Service)分布式存储服务。
3.3.文件存储
文件存储是指在指定某些文件进行存储时,首先会查找每个文件逻辑块,其次物理块,由于逻辑块是分散在物理块上,而物理块也是分散在不同扇区上。需要一层一 层往下查找,最后才完成整个文件复制。
文件级存储时比较费时间,效率不高,实时性不强,存储时间长,且增量备份时,单文件某一小部份修改,不会只备份修改部份,而整个文件都备份。
把存储介质上的数据组织成目录-子目录-文件这种形式的数据结构,用于从这个结构中寻找、添加、修改、删除文件的程序,以及用于维护这个结构的程序,组成的系统有一个专用的名字:文件系统(File System)。文件系统有很多,常见的有Windows的FAT/FAT32/NTFS,Linux的EXT2/EXT3/EXT4/XFS/BtrFS等。而在网络存储中,底层数据并非存储在本地的存储介质,而是另外一台服务器上,不同的客户端都可以用类似文件系统的方式访问这台服务器上的文件,这样的系统叫网络文件系统(Network File System),常见的网络文件系统有Windows网络的CIFS(也叫SMB)、类Unix系统网络的NFS等。而文件存储除了网络文件系统外,FTP、HTTP其实也算是文件存储的某种特殊实现,都是可以通过某个url来访问一个文件。
3.4.块存储
块存储是指物理块存储,效率高,实时性强,存储时间短,且增量备份时,只备份修改过的物理块。块存储不便于文件共享。
块级是指以扇区为基础,一个或连续的扇区组成一个块,也叫物理块。它是在文件系统与块设备(例如:磁盘驱动器)之间。
传统的块存储除了硬盘还有其它块设备,例如不同规格的软盘,各种规格的光盘,磁带等。
云平台上的块存储有腾讯云的云硬盘 CBS、阿里云的ESSD云盘等云产品。
3.5.容器
容器是一个标准化的软件单元,它将代码及其所有依赖关系打包,以便应用程序从一个计算环境可靠快速地运行到另一个计算环境。Docker容器镜像是一个轻量的独立的可执行的软件包。包含程序运行的时候所需的一切:代码,运行时间,系统工具,系统库和设置。
3.6.主机
主机是指计算机除去输入输出设备以外的主要机体部分。也是用于放置主板及其他主要部件的控制箱体(容器Mainframe)。通常包括 CPU、内存、主板、硬盘、光驱、电源、机箱、散热系统以及其他输入输出控制器和接口。
在网络技术中是关于发送与接收信息的终端设备。3.7.数据库
3.7.1.数据库介绍
数据库是存放数据的仓库。它的存储空间很大,可以存放百万条、千万条、上亿条数据。但是数据库并不是随意地将数据进行存放,是有一定的规则的,否则查询的效率会很低。当今世界是一个充满着数据的互联网世界,充斥着大量的数据。即这个互联网世界就是数据世界。数据的来源有很多,比如出行记录、消费记录、浏览的网页、发送的消息等等。除了文本类型的数据,图像、音乐、声音都是数据。
3.7.2.数据库分类
目前最常用的数据库模型主要是两种,即关系型数据库和非关系型数据库。
关系型数据库模型是把复杂的数据结构归结为简单的二元关系(即二维表格形式)。
例如:互联网市场主流的MySQL、传统企业主流的Oracle。
非关系型数据库也被成为NoSQL数据库,NOSQL的本意是“Not Olnly SQL” 指的是非关系型数据库,而不是“No SQL”的意思,因此,NoSQL的产生并不是要彻底地否定非关系型数据库,而是作为传统关系型数据库的一个有效补充。NOSQL数据库在特定的场景下可以发挥出难以想象的高效率和高性能。
例如Memcaced、Redis。