造成数据丢失破坏的原因不只有存储设备故障,还有软件Bug、错误操作、升级失败等,如果有备份系统,数据被破坏后,可快速恢复。
为了防止数据丢失、损坏等意外,将存储的数据,复制到其他存储设备上。备份的本质,就是存储数据的“复制”,目的是意外发生后的数据恢复。
备份的主要作用:保证数据的可靠性,将业务系统的数据复制到备份存储中
归档:将数据做永久保存,以便后续复查
备份是恢复的前提,恢复是备份的目的,无法恢复的备份是没有意义的
备份的基本模式:
完全备份:每次备份所有数据,备份时间长 恢复时间短,用于在数据安全性非常高的场景中使用
增量备份:第一次完全备份,后续备份只备份前一次的增量数据,如果以前未进行任何备份,则备份所有文件。备份时间段,恢复时间长。适用于数据量小场景使用。
差异备份:第一次完全备份,后续备份只备份完全备份的差异数据,如果以前从未进行任河备份,则备份所有文件。恢复时间长,容易出故障。
备份对比:
占用备份存储空间对比:完全备份>差异备份>增量备份
恢复速度快慢对比:完全(直接)>差异(完全+差异)>增量(完全+之前所有增量)
风险性对比:完全<差异<增量
备份的三要素:
BW:backup window 留给备份的时间长度
RPO:Recover Point Objective 最大数据丢失量,允许数据丢失的量,RPO值越小,表明丢失的数据越小。使用同步复制的方式同步数据时,实现RPO等于0。
RTO:Recover Time Objective 最长停机时间,允许数据停止工作的时间,RTO值越小,表明业务中断时间更短。
备份系统的组成:
备份管理节点:备份软件管理端
备份业务节点(介质服务器):连接备份存储
备份客户端:生产主机安装备份软件客户端Agent
备份介质:备份存储
备份网络:备份数据传输路径
备份组网:
LAN-Base:备份数据通过现有LAN网络(控制流、数据流都走LAN网络),由生产中心服务器读数据,由备份业务节点写入备份存储(数据通过LAN网络从生产主机传到备份业务节点)
LAN-Free:控制流走LAN网络,数据流走SAN网络,由生产中心服务器读出数据并写入备份存储(生产中心服务即做备份代理,又做备份业务节点,备份存储直接接入SAN网络)
Server-Free:控制流走LAN网络,数据流走SAN网络,由生产中心服务器读出数据并写入备份存储(备份业务节点接入生产中心SAN网络,备份代理将数据做快照,映射到备份业务节点)
备份技术:
CBT Changed Block Tracking 改变块跟踪:
内存位图:记录块是否发生变更,和存储块相对应,每个数据块对应1Bit,块发生变更后将对应位置1,每次备份后全部清零
CBT版本号:CBT文件中记录数据块变更情况的序号,采用4Byte记录,每次备份记录一个版本号,每个备份节点一个版本号
CBT文件:内存位图为1的版本号就是CBT文件,记录当前备份点、块的CBT版本号,CBT文件随版本号为本备份点版本号的数据块文件,一同传到备份存储,CBT文件由前一节点的CBT文件与内存位图计算得出(内存位图1对应的CBT文件位置,写入本次备份的版本号,其它位不变)
首次备份:
①备份所有数据的块
②生成CBT文件(有数据的块对应写入首版本号)并且备份
③生成全0内存位图
后续备份:
①备份内存位图1对应的数据块
②将CBT文件对应内存位图1的版本号更新,并且备份
③内存位图清零
恢复:
对比当前CBT文件与目标CBT文件,仅恢复有更改的块,根据目标点版本号找到对应块
场景:FusionSphere虚拟化存储存储类型,备份时自动开启CBT功能,在生产端不保留快照,对其存储空间占用较小,获取数据变更信息速率较快。
快照对比:
**
保留前一次的快照(源数据在某个时间点的一致性数据副本),与当前快照对比,备份变化的数据。
两个快照之间的差异对比,以卷地址的形式反映两者之间的数据差异,在增量备份的时候,仅备份存在数据差异卷地址上的数据。后续备份默认执行增量备份,通过对比生产端磁盘的前后两次快照获取前后两次备份之前的数据变更信息,从磁盘中取出有变更的数据进行备份。
场景:FusionSphere存储类型FusionStorage,存储设备的LUN。在生产端保留快照,对齐存储空间占用较大,获取数据变更信息速率较慢。
eBackup备份:
eBackup基于虚拟机/磁盘快照、CBT和快照对比技术,对虚拟化、公有云、私有云和混合云四种应用场景下的用户数据提供全面的保护,支持虚拟化场景下、虚拟机以及磁盘数据的备份恢复。目前只支持对虚拟机以及磁盘数据的备份和恢复,不支持对物理服务器、应用的备份和恢复。
可以部署在虚拟机或者物理机上面,虚拟机可以部署在Vmware和私有云上面,模板或光盘进行部署。
不支持IPV6地址。
eBackup Server:备份服务器(管理端),eBackup中有且只有一个备份服务器,同时具备代理功能。负责备份和恢复等任务的调度和监控,备份存储和生产系统的管理,并直接接收和相应用用户的请求。
eBackup Proxy:备份代理,连接备份存储,执行具体任务,负责接收备份服务器下发的备份和恢复等任务,将指下发给VRM、vCenter或存储设备。与生产系统和备份存储直接交互以执行任务。当备份业务较多、备份数据量较大时,可以规划多套备份代理,
每个Server可管理64个Proxy,第一个Proxy一般部署在Server上
特点:
分布式,可扩展(代理最多扩展到64个)
支持永久增量备份(首次一定是全量)
免客户端,免代理
使用数据重删技术,减小空间占用
组网:
网络平面:
①内部通信平面:Server————Proxy
②存储平面:由于eBackup网络配置要求,在FC-SAN作为备份存储的情况下,同样也需要为存储平面配置网卡和IP地址。
③备份管理平面:访问eBackup Web页面,Server对外提供服务
④生产管理平面:连接生产中心与备份中心的LAN
LAN-Base:
Lan-Base备份部署适合用于备份数据量小,对备份窗口没有特殊要求的场景,备份恢复数据的传输是以以太网为基础的,备份过程中各个代理把备份数据通过以太网传输到备份存储实现备份。缺点是网络传输压力大,当备份数据量大或备份频率高时,局域网的性能下降快,不适合高负荷的网络应用环境。
备份流程:
1、备份服务器通过前端LAN网络发送备份指令到备份代理
2、备份代理会向VRM下达备份指令,VRM会通知虚拟机所在CNA打快照,由VIMS指定VHD文件拍快照
3、CNA通知备份代理快照制作完毕,备份代理下载快照中的数据备份到备份存储中
4、备份结束后,删除快照合并
LAN-Free:
Lan-Free备份适用于备份数据量较大,对备份窗口要求比较严格的场景,不需要以太网,释放网络带宽,缺点是投资高,需要单独SAN网络。
备份流程:
1、备份服务器通过前端LAN网络发送备份指令到备份代理
2、备份代理将指令发送到生产端,若生产存储为虚拟化存储,VRM会通知虚拟机所在CNA打快照,若生产存储为FusionStorage,则由FusionStorage自己拍快照
3、备份代理挂载快照,将数据写入备份存储
4、备份结束后,删除快照合并
生产存储:FusionStorage仅支持LAN-Free,备份技术使用快照对比,其他场景全部使用快照对比
备份存储:必须要有文件系统,SAN、NFS、CIFS、S3
重复数据删除:
首先数据分块,然后对块进行相似性监测,重复数据删除,使用指针指向保留的副本