存储级数据容灾方案模板 - 图文(2)

2019-03-28 22:08

方案设计

(4) 基于存储的远程数据复制容灾解决方案 ? 方案优点

? ? ? ?

智能存储远程数据复制,技术较成熟; 设备、软件投资费用低;

实施简便,应用系统仅需短时间停机; 不需要对应用、数据库重新安装调试;

? 方案缺点

? ?

根据用户的应用特点:建议使用基于存储的容灾方案。

只支持同一厂商同一系列存储; 不能实现应用的实时、自动切换;

2.3.9系统整体架构

本地灾备中心

服务器均采用原有服务器,所有服务器配置HBA卡,连接至用户现有光纤交换机;

新增存储加入SAN网络,存储空间可根据业务需求,自由划分给多套系统使用;

北京海量智能数据技术有限公司 6

方案设计

新增一台备份服务器,安装NBU服务端,新增一台HDS虚拟带库作为备份介质保存备份数据,实现SAN备份。

主数据中心和灾备中心之间通过高速光纤链路连接,为数据复制和备份提供了很好的链路基础。利用HDS 容灾管理软件TrueCopy实现磁盘阵列之间数据的复制。建立同城异地容灭系统,通过数据同步保证在总部运行中心出现重大灾难故障时,能启用灾备中心进行正常交易。

异地备份中心

容灾中心新增容灾服务器、容灾交换机,新增的HDS AMS 2100作为容灾存储设备,该备份中心只需要保存业务系统数据一份可用的备份。当本地机房瘫痪时,容灾服务器接管ERP及交易系统。

北京海量智能数据技术有限公司 7

方案设计

3. 灾备中心运行维护方案

3.1. 解决方案选择

保持业务持续性,恢复业务处理的方法可以包括与冷、温或热站点供应商签订商业合同、移动站点、镜像站点、与内部或外部机构签订互惠协议、与设备供应商签订服务水平协议(SLA)。另外,在制定系统恢复策略时应该考虑诸如独立磁盘冗余阵列(RAID)、自动故障切换、不间断电源(UPS)和镜像系统等技术。

业务持续性计划必须包括在比较长的期间在备用设施中恢复和执行系统运行的策略。通常,有三种备用站点可供选择:

? 由机构拥有或运行的专用站点

? 与内部或外部实体签订的互惠协议或协议备忘录 ? 商业租用设施

无论选择哪种类型的备用站点,设施必须能够支持应急计划中所定义的系统操作。三种站点类型可以根据运行的准备程度进行分类。这样的话,站点可以被确定为冷站点、温站点、热站点、移动站点和镜像站点。

根据BIA的结果和银联对业务持续性的要求,选择的解决方案可以描述为: (1)建立异地容灾中心将完全复制生产中心的数据,并实现两中心间的数据实时同步,其功能为:

a.正常工作状态下,灾备中心将配置为生产中心的完全数据复制,以保证当生产中心发生灾难时,数据的完整性。

b.当生产中心的存储系统及数据不可访问时,可以通过对备份数据中心的数据的访问。

(2)建立灾备中心,生产中心的数据将完全复制到灾备中心,允许存在一定的时间差,但应满足RPO和RTO要求。灾备中心配置有与生产中心架构相同的服务器系统,在生产中心无法运行的情况下接替生产中心的生产业务,实现对业务持续性的要求。

北京海量智能数据技术有限公司

8

方案设计

a.正常工作状态下,备份中心将配置为生产中心的数据复制源,以最大限度的不影响生产中心的主机和存储系统的性能。

b.当生产中心灾难发生时,灾备中心的完全复制数据将用于生产数据中心的数据同步,以保证当生产中心灾难发生时,灾备中心没有数据丢失;业务可以恢复运行。

3.2. 业务持续性策略

3.2.1. 日常运行状态

在没有任何异常情况发生的情况下,系统按照正常的运行状态运转,工作人员按照各自的岗位职责开展工作。定期将工作内容和工作结果向上级管理人员汇报并接受上级管理人员的监督和检查。

3.2.2. 切换流程

切换流程分计划内切换流程和计划外切换流程,首先讨论计划为切换流程。 1. 发现并确定灾难情况

运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。同时,网络维护室、系统维护室和安全管理室等其它部门应该将所发现的可能导致灾难的时间随时向运行保障室报告。

2. 通知负责恢复的人员

运行保障室按照预定程序通知业务持续管理小组的值班人员,值班人员需要监控事件的发展,必要时将向业务持续小组负责人通报。

当发生可能导致业务处理中心的情况后,需要通知以下人员: ? 信息中心主管

? 业务持续管理小组负责人 ? 业务持续行政小组负责人

? 负责维护发生以外事件的系统的部门负责人 3. 判断异常影响程度,启动BCP计划

北京海量智能数据技术有限公司

9

方案设计

启动BCP计划是业务持续管理小组和/或业务持续行政小组的职责。通常由业务持续管理小组和/或业务持续行政小组的负责人宣布BCP计划的启动。在被授权的组织会负责人确定需要启动灾备站点后,宣布BCP计划启动。

按照BCP所定义的工作内容,损害评估小组和灾难恢复小组开始工作。 4. 激活灾备站点

在通知恢复的人员过程中,灾备站点的值班人员必须被通知并立即投入工作,做好业务运行环境的检查等工作。关闭可能对恢复业务运行有影响的任何应用系统,做好恢复业务运行的准备。

在收到BCP启动的通知后,按照BCP所定义的操作流程,与生产中心陪着或独立执行业务恢复工作。

5. 发布公告

业务持续管理小组的相关成员按照BCP所定义的工作内容向外发布公告 6. 提供业务恢复所需的服务

在业务恢复以及业务在灾备站点运行期间,内部和外部的支持团队以及相关工作人员按照BCP所定义的工作内容为业务的持续运行服务。

对于计划内切换流程,其大部分内容与计划为流程相同,通常由通知负责恢复的人员开始,直到提供业务恢复所需的服务。计划内切换可能是由于演习或需要进行站点级的设备维护造成的,有很强的计划性,灾备站点人员应该提早完成恢复业务运行的准备工作,如所有工作人员到位等。

3.2.3. 非切换异常处理流程

切换流程用于处理不会导致业务切换的异常事件,如部分设备的损坏没有影响业务处理的正常运行,或备份中型和/或灾备中心发生异常等。虽然这些异常事件不会对业务的运行造成直接影响,但是使系统整体的稳定性降低,业务运行的风险加大了,而且这样的事件大量存在,应该引起足够的重视。初步计划的非切换异常处理流程如下:

1. 发现并确定灾难情况

运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。

北京海量智能数据技术有限公司

10


存储级数据容灾方案模板 - 图文(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:烟草行业用工分配制度改革总体要求是

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: