省院容灾备份建设方案 - 图文(2)

2019-03-03 21:19

概念和技术分析 容灾系统相关概念和技术分析

1.3 容灾系统的相关定义

从广义上讲,任何提高系统可用性的努力,都可称之为容灾。

本地容灾,就是主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续进行正常的工作。

异地容灾,是指在与生产机房有一定距离的异地建立与生产机房类似的信息平台(备份中心),并采用特定的技术将生产中心的数据传输到该备份中心,从而在生产中心发生较大的灾难如火灾或地震等,仍能对生产数据进行保护的容灾系统。

平时讲到的容灾,尤其是值得重视的容灾,一般都是指远程异地容灾。 一个容灾系统的实现可以采用不同的技术,而容灾系统的划分,由其最终要达到的效果来决定。从其对系统的保护程度来分,可以将容灾系统分为:数据容灾和应用容灾。

数据容灾,就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。

应用容灾,是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份)。建立这样一个系统是相对比较复杂的,不仅需要一份可用的数据复制,还要有包括网络、主机、应用、甚至IP等资源,以及各资源之间的良好协调。

衡量数据保护性能的指标

RTO

RTO,Recovery Time Objective,是指灾难发生后,从应用服务器系统业务停顿之刻开始到应用服务器恢复业务之时,此两点之间的时间段称为RTO,如下图所示。

3

概念和技术分析 RTO是衡量容灾方案恢复能力的指标。一般而言,RTO 时间越短,即意味要求在更短的时间内恢复至可使用状态。虽然从管理的角度而言,RTO 时间越短越好,但是,这同时也意味着需要投入大量的资金,购买更高性能的设备和高可用性软件,以及部署专用的高速网络。

RPO

RPO,Recovery Point Objective,是指从数据可用性而言,应用服务器恢复业务需要的数据的时间点,和发生灾难的时间点之间的时间段。换而言之,企业可以接受多长时间的数据丢失。如下图所示。

RPO是衡量灾备中心与生产中心数据一致性的指标。在同步方式下,RPO等于数据传输时延的时间,在异步方式下,RPO基本为异步传输数据排队的时间。实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据库与容灾备份数据库的SCN的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。

因此,在容灾系统中,不仅仅要求在异地有一份数据拷贝,同时必须保证异地数据的完整性、可用性。

容灾半径

容灾半径是衡量容灾方案所能承受的灾难影响范围的一个指标。不同灾难的影响范围是不同的,而距离也会影响到容灾技术的选择,如下图所示。

4

概念和技术分析 1.4 容灾方式等级划分

按照国际标准化组织的定义,容灾方式按投资成本与恢复所需时间的不同,划分为不同的等级,详细情况如下图所示:

业 务 恢 复Tier 6 - 零数据丢失 远程磁盘镜像与自动切换热专用远程热备份中心设 施 投 资Tier 5 - 两阶段确认Tier 4 - 批量/在线数据库镜像与日志Tier 3 电子链接Tier 2 - PTAM&热备份中心暖激活的备用中心温冷Tier 0 -无异地备份定时备份15分钟1-2小时6-12小时12-24小时24小时数天Tier 1 - PTAM永远不能恢 复 所 需 时 间

容灾方式等级划分示意图

Tier 0 - 没有异地数据:

Tier 1 - PTAM 运送访问方式(Pickup Truck Access Method): 数据介质转移(异地存放、安全保管、定期更新)。

Tier 2 - PTAM 运送访问方式 + 热备份中心(PTAM + Hot Site):

备用场地支持(异地介质存放、系统硬件网络可调)。

Tier 3 - 电子链接 Electronic Vaulting方式(远程备份):

电子传送和部分设备支持(网络传送、、磁盘镜像复制)。

Tier 4 - 批量/在线数据库镜像与日志:

电子传送和完整设备支持(网络传送、网络与系统就绪)。

Tier 5 – 两个中心之间的两阶段确认(数据实时备份即数据复制):

实时数据传送及完整设备支持(关键数据实时复制、网络系统就绪、人机切换)。

Tier 6 - 0 数据远程复制+自动切换(广域网集群):

数据零丢失和远程(在线实时镜像、作业动态分配、实时 无缝切换)。

5

概念和技术分析 采用哪一种容灾方式除了考虑实施成本外,还必需考虑应用系统对灾难恢复时间的容忍度、业务系统中数据改变的特点。

1.5 RTO/RPO与灾难恢复能力等级的关系

灾难恢复能力等级 1 2 3 4 5 6 2天以上 24小时以后 12小时以上 数小时至2天 数分钟至2天 数分钟 RTO 1天至7天 1天至7天 数小时至1天 数小时至1天 0至30分钟 0 RPO 1.6 容灾系统技术介绍

主流容灾系统有以下几种技术类型:数据的远程备份、数据的远程复制、基于数据库本身的容灾技术。

1.6.1 数据的远程备份

数据的远程集中备份是指各个生产站点的数据在灾备中心完成备份,这样可以在本地的主站点遭到灾难性的损坏以后,能够通过远端的备份进行数据的恢复,起到了灾难备份的作用。两个中心的数据实现异地备份,能够基本满足用户对数据安全性、可靠性的要求。

数据的远程备份可以使用在专网上使用备份软件做基于策略的备份方式(TIER3类型的容灾方式),也可以使用本地备份出库运送到灾备中心的方式(TIER1、2类型的容灾方式)。

该种方式的缺陷是:

? 人工成本高

6

概念和技术分析 ? 恢复时间漫长 ? 恢复可靠性无法保障

1.6.2 数据的远程复制

数据的远程复制根据时间性可以分为同步复制方式和异步复制方式。 同步复制方式

同步技术的优点是没有任何数据丢失,因为其原理是任何一个用于新增或更改数据的I/O操作都需要在两端(本地和异地)得到确认后方可结束。所以,当两地距离较远或数据传输链路不畅时,会对前端应用的性能造成影响。

异步复制方式

异步容灾技术的优点是对应用没有任何影响,但也有其不足,其不足在于,异地灾备中心的数据会相对滞后(秒级或分钟级)。因为在异步的工作方式下,本地的用于新增或更改数据的I/O操作在得到本地确认后即认为结束,然后再向异地进行传输。

数据的远程复制根据实现原理的不同可以分为基于硬件的复制方式、基于软件的复制方式和基于存储网络的复制方式。

基于硬件的复制方式(也称存储型远程容灾)

基于硬件的容灾原理是:基于高端阵列的技术,在光纤环境下,以同步的方式,以变更的数据块为单位复制到异地灾备中心的同品牌、高等级的阵列中,适合于近距离光纤环境的容灾。(可以做到Tier6级别容灾方式)

基于硬件的容灾技术对存储设备和复制链路有如下的要求:

? 使用基于硬件的容灾,则需从同一厂商处采购多套高端存储阵列。

7


省院容灾备份建设方案 - 图文(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:检测技术与信号处理

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: