Morphoneme

备份与容灾的基本概念

发表时间:2022-06-16 09:19


备份与容灾的基本概念


开始本文之前,让我们先了解下面的概念

1.什么是数据备份?

数据备份是指针对应用数据一个或多个完整的拷贝,当应用数据出现物理失效戒是逡辑失效时,可以随时从备份数据集中恢复所需要的有效数据。其目的是为了在系统设备发生故障戒数据遭受破坏时保护数据,将应用系统遭受破坏的程度减到最小。(数据备份[广义]是唯一有效的数据保护方式


2.容灾的概念

容灾是指灾难发生时,在保证业务数据尽量少丢失的情冴下,保持业务的不间断地运行,从而降低因灾难导致的损失。


一.备份把整个系统或系统的某⼀部分数据从应⽤主机的硬盘或阵列复制到其它的存储介质,⼀旦出现故障,我们只要将“备胎”换上去就可以重新使⽤了。不过需要注意的是,备份并不能保证业务可以不停机运营,它更多解决的是意外宕机之后的数据恢复和找回问题,⽽不能预防各类停机事件。

   常见的备份类型

a完全备份 (对备份对象进行全部备份)。

b增量备份 (每次备份的对象是相对于上一次备份后新增加或修改的数据)

c差异备份 (每次备份的对象是相对于上一次完全备份后增加或修改过的数据)

d合成备份 (每次将增量戒差异备份数据不现存的全备数据重新组成一个全备份)



但是在平日我们的实际场景中,我们要区分几件事:

1磁盘阵列≠备份,磁盘阵列(RAID)使多个独立的硬盘通过不同方式组合成硬盘组,目的之一是提升磁盘的读写性能;其次是通过容错算法提供安全性保护。简单概括,磁盘阵列只能提供硬件容错,其中的数据只是孤本。

数据备份则是通过产生数据副本,幵将副本数据多版本保存在本地戒异地,在出现问题后可利用副本数据迚行恢复

2双机热备≠备份

通常,应用系统会采用双机热备,其本质是保障系统的高可用,但实际数据存储在共享存储中只有一份,数据仍是孤本,一旦发生数据丢失事件,则损失惨重。因此,双机热备只是解决RTO问题,并未解决RPO问题。

3存储镜像≠备份

通常,我们会采取镜像存储模式,其本质上是存储高可用,虽然可以防范存储硬件故障,但无法规避数据逻辑损坏,如人为删除或篡改,如果数据在主存储中被删除戒篡改,那么其数据状态会同步至镜像存储。因此,镜像存储看似有两份数据,但从逻辑角度分析,仍是孤本。


备份系统一般由以下几部分组成:

备份软件(NBU、TSM、AnyBackup、UnaDPM)

优秀的备份软件包括集中管理、自动操作、流量控制、重删、备份集优化、加密、校验等特殊功能,对于安全有效的数据备份是非常重要的。

备份网络

备份网络可以是LAN,也可以是SAN,或者是多种网络混合的形式。

备份设备(服务器、磁盘、磁带、VTL、光盘库)

备份设备分为备份主机和备份介质,备份主机是负责备份管理的。备份介质是备份数据的负载物,它的质量直接关系着备份数据的安全。

备份管理知识

一个好的备份系统,除了配置好的软硬件以外,更需要有良好的备份策略和管理机制来进行保证。对亍复杂的系统,必须根据各种应用和数据类型来分别制定具体的备份策略。但总体上来讲,一个好的备份策略,必须考虑多方面的因素


二,容灾的概念

容灾一般是指针对当生产系统,不能正常工作时,其业务可由容灾系统接替这些业务,继续进行正常的工作,但是容灾不能替换备份容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比如不小心把计费系统内的用户信息表删除了,同时容灾端的用户信息表也会被 完整地删除。

所以,备份是为了应对灾难来临时造成的数据丢失问题,容灾是为了在遭遇灾害时能保证信息系统继续正常运行,帮助企业实现业务连续性的目标。

实现业务连续性的技术手段通常包括以下两种:

高可用性(High Availability,简称“HA”)

高可用性指通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。业界的通行做法是采用群集系统 (Cluster) ,将各个主机系统、网络系统、存储设备(部分高可用系统包含存储设备的高可用)等通过各种手段有机地组成一个群体,共同对外提供服务。

通过创建群集系统(采用实现高可用性的软件)将冗余的高可用性的硬件组件和软件组件组合起来,以达到消除单点故障、减少设备意外发生时的宕机时间。一般说,高可用技术通过对网卡、CPU、内存、系统软件设置不同的可用性监测点,在这些节点发生故障时实现冗余切换,持续提供服务。

灾难恢复(Disaster Recovery,简称“DR”)

狭义的恢复 (Recovery) 定义是指重新创建生产系统应用或计算环境的过去操作状态,包含完全恢复和小颗粒恢复两种模式。

广义的灾难恢复 (DR) (国内通常简称为灾备或容灾)则属于业务连续性的技术层面。在用户服务中断后,需要快速调动各种资源,在异地重建信息技术服务平台(包括基础架构、通信、系统、应用及数据),灾难恢复也包括本地的恢复与重建。

目前,流行的灾备系统往往包括本地的 HA 集群和异地的 DR 数据中心。从故障角度,HA要处理单组件的故障导致负载在集群内的服务器之间的切换, DR 则是应对大规模的故障导致负载在数据中心之间做切换。

     

下面我们给容灾系统分一下类:

按容灾系统的应用分类:

a数据级容灾

• 数据同步或异步进程复制到容灾中心

• 投资少,但业务恢复时间长

b应用级容灾

• 在数据级容灾的基础上,在容灾中心构建一套相同的业务系统,

其主要保护应用系统、数据、网络通信系统

• 业务恢复时间短

c业务级容灾

• 保护整个业务流程,除IT系统外,更多涉及非IT技术外的办公、

业务处理等流程

• 实现技术要求高,难度大,投资多

按生产中心和容灾中心的距离分类:

a本地容灾

生产中心不容灾中心在同一建筑物内

可抵御软件故障、硬件故障等本地灾难

b近距离容灾

相距10~200km内

可抵御火灾、停电、建筑物倒塌等局部性灾难

c跨地域远距离容灾

相距200km以外

可抵御地震、洪水、海啸等大范围灾难

生产中心


下面我们着重看看容灾方案的类型:

1.双机热备:在双机热备份方式中,主服务器运行应用,备份服务器处于空闲状态,但实时监测主服务器的运行

状态。一但主服务器出现异常或故障,备份服务器立刻接管主服务器的应用。主要通过纯软件方式实现双机容错。

依据复制执行实体的不同,数据复制可分为基于主机的复制和基于存储设备的复制。基于主机的复制一般是由安装在主机中的软件插件来实施数据的复制,这会对主机系统的性能有所影响,典型的产品如VERITAS Storage Foundation,Rose HA等。

2.存储网关双活方案

由存储网关(虚拟化的存储管理平台)飞康 NSS ,EMC VPLEX,IBM V3500(V7000),Datacore,柏科等;

支持异构存储HA、高可用HA、秒级切换

数据零丢失

与主机OS、业务无关

3.存储控制器双活方案

存储设备的复制可以是由存储设备的控制器执行,EMC/NetApp/HP/HDS/华为/浪潮/IBM等;

高端企业级存储,采用多控制器架构冗余设计,具有极高的可靠性。

存储共同提供业务支撑服务,在任意一套存储出现严重故障(如断电等)无法工作时,业务系统能够继续运行,无须任何人工干预操作。在一套存储出现严重灾难时,单套存储仍可保证的业务的高效运行,实现RTO=0,RPO≈0的高可靠业务连续性方案和数据安全方案。

两套存储的配置完全相同,在一套存储故障时,剩余的单套存储仍可以提供相同的业务处理速度,不会降低服务水平。

4.虚拟化集群双活保护方案

行为与单个vSphere相同

延伸距离最大200KM,通常小于50KM

通过VMware HA与vMotion实现自动的DR保护

需要双活存储集群,如EMC的vPlex,NetApp的MetroCluster等

5.数据库容灾(Oracle Data Guard)

Oracle Data Guard

Data Guard 提供了一个有效的、广泛的灾难恢复及高可用性解决方案。 Data Guard 能确保没有数据丢失,即使面对无法预料的灾难。

Standby数据库,能用于其它任务如备份、报表、总结、和查询,从而减少了主数据库用于执行这些任务所需的工作负载,节省了宝贵的CPU 和I/O 循环。

提供了最大保护、最大可用性、和最大性能模式,以帮助企业平衡数据可用性与系统性能需求

6.数据库容灾(DSG RealSync)

数据库同步容灾解决方案在Central Database 端和Second central Database 端分别安装Agent 进程,Source 端的Agent 进程对如ORACLE 数据库日志进行监控,发现改变及时对目标数据库进行更新。

当应用系统在Data Source 端向数据库进行任何操作时时,这些信息都将在Redo Log 中保存, Agent 通过对实时获取的Log 日志进行分析,获得本次操作的交易指令和交易数据,然后将这些交易指令和交易数据经过格式转化生成DXF 数据格式,并实时通过网络传送到Data Target 系统。

Data Target 系统的Agent 接收数据库包,经过校验码检查,确认正确的数据库包后,调用Oracle 函数按照交易的先后顺序在Data Target 系统中执行该交易

      综上,我们简单介绍了备份和容灾的各自的定义,实际上,容灾的基础要基于备份。容灾也脱离不了备份。近年来,我国出台了多部法律法规,其中2017年6月1日起实施的《网络安全法》明文要求“保障网络数据的完整性、保密性、可用性”、“对重要系统和数据库进行容灾备份”等。数据的备份容灾已成为保障国家安全的基本要求和各类企事业信息化过程中必须履行的责任。