EMC容灾技术和业务连续性服务方案

  1 需求

  某保险公司(以下简称客户)向EMC公司提出建立容灾方案的想法,由于客户对容灾技术了解不多,因此此方案是根据其异地存在办公设施的条件提出异地容灾的初步设想。容灾技术和方案的设计极其复杂,客户不能提供具体需求的情况较为普遍。了解客户的初步设想后,EMC公司根据以往经过多次验证的经验和成熟的业务连续性服务集成方法论,帮助客户从评估现有服务水平入手,定义业务需求,调研高可用性和恢复技术,设计基础架构,进行技术测试和实施,开发业务连续性技术,实施容灾测试演习,建立更新与维护制度,建立资源管理、改进与考评体系,使容灾方案真正做到"养兵千日,用兵一时"。

  2方案

  EMC在业务连续性服务方面有着一套完整的实施方法论,称作业务连续性服务集成方法论(Business Continuity Solution Integration,简称BCSI)。它是EMC通过对多年实施业务连续性和容灾服务的所积累的经验进行总结和提炼,开发出来的业务连续性实施方法论模型,该实施方法在全球众多相关项目中广为使用并得到验证。这一方法论,包括规划(Plan)、建立(Build)、和管理(Manage)三个阶段、十个步骤的咨询和技术服务。限于篇幅,在此不容赘述。

  根据客户的容灾地点的选择考虑范围,EMC针对生产站点和容灾站点之间的距离推荐三种技术方案:

  第一类:北京、成都,距离在1000公里以上

  EMC推荐使用SRDF SAR单跳数据复制方案,该方案对于链路的带宽没有具体要求,可以满足任何链路带宽和RPO需求。

  第二类:南京、杭州、苏州等地,距离在3个小时车程以内

  EMC推荐使用SRDF异步数据复制方案,如果链路带宽允许的话,可以考虑对最关键的业务数据实施同步复制保护。如果链路带宽比较低,也可以考虑SRDF SAR单跳数据复制模式。

  第三类:同城(外高桥、张江、漕河径)

  EMC推荐使用SRDF同步数据复制方案,根据灾备地点和目前生产中心的之间的物理距离,我们建议在同城的模式下,可以采用SRDF同步方式,对核心业务数据采用同步保护模式。

  2.1 同城同步方案

  方案优势:

  同步模式可以确保两边核心业务数据的完全一致,而且在回切(Fail Back)时,可以透明的回切,无需等待灾备端数据的回拷完毕。换句话讲,用户无需任何专门的停机时间,即可完成生产中心的启动,真正实现用户业务系统的连续性。这是其它厂商无法实现的功能。用户可以利用该功能,非常轻松的实现灾备演练和日常计划性停机维护等工作。结合本地数据复制软件TimeFinder,用户可以克隆生产数据或对生产数据执行快照。用户可以将该份数据作为开发、测试的源数据或数据仓库系统的数据挖掘和抽样等功能。另外,用户可以在灾备端对灾备磁盘执行同样的功能,克隆数据可以作为灾备演练的环境。快照数据可以作为链路中断等故障时,需要数据再同步时,可以对灾备数据实现二次保护。

  在本地生产中心配置虚拟磁盘库,可以将每日的数据备份直接备份至磁盘库,然后利用备份软件将备份数据自动克隆至灾备中心的磁带库,实现磁带数据的异地保留。同时,基于磁盘备份可以大大提高备份和恢复效率,极大缩短日常的备份窗口。

  2.2城域容灾

  根据灾备地点和目前生产中心的之间的物理距离,我们建议在城域的模式下,对核心业务数据采用同步/异步保护模式。如果站点距离在一百公里之内,而且链路仍然采用光纤链路的话,考虑光纤信号的时延问题,可以对部分核心业务数据采用同步数据模式,其他数据采用异步模式。如果采用基于IP的数据链路,则最好采用异步方式。

  方案优势:

  同步模式可以确保两边核心业务数据的完全一致,而且在回切(Fail Back)时,可以透明的回切,无需等待灾备端数据的回拷完毕。换句话讲,用户无需任何专门的停机时间,即可完成生产中心的启动,真正实现用户业务系统的连续性。这是其它厂商无法实现的功能。用户可以利用该功能,非常轻松的实现灾备演练和日常计划性停机维护等工作。

  异步模式可以节约带宽的开销和不会对应用系统的性能造成任何的影响。当应用系统由于业务高峰出现性能下降的情况,可以将同步模式切换到异步模式,彻底消除数据复制对性能的影响。可以利用DMX系列内置压缩和负载均衡的GigaE卡,支持IP链路,降低用户的链路投资。异步模式可以确保用户的RPO时间维持在30秒钟之内,提高用户系统的业务连续性。同时,SRDF异步能够根据链路利用状况,自动缩短RPO的时间,换言之,也就是最大限度利用线路的带宽。

  结合本地数据复制软件TimeFinder,用户可以克隆生产数据或对生产数据执行快照。用户可以将该份数据作为开发、测试的源数据或数据仓库系统的数据挖掘和抽样等功能。另外,用户可以在灾备端对灾备磁盘执行同样的功能,克隆数据可以作为灾备演练的环境。快照数据可以作为链路中断等故障时,需要数据再同步时,可以对灾备数据实现二次保护。

  2.3 异地容灾

  由于考虑到异地之间的距离比较长,用户租用高带宽的链路成本很高,我们建议采用 EMC特有的Single HOP(单跳)的方式,可以满足用户在超常距离和有限带宽条件下的RPO和RTO指标。EMCSingle HOP方案主要是利用了SRDF SAR和TimeFinder相结合,实现生产变更数据的批量复制。

  技术描述:首先用户需要在生产端配置需要复制数据容量两倍的存储空间,其中一块为日常的生产数据,另一块为生产数据的镜像(业务连续性卷BCV)。我们假设用户的RPO为20分钟,每二十分钟由生产数据将变化量复制到本地的镜像磁盘(业务连续性卷BCV),复制完毕后,再利用 SRDF自适应复制功能,将该数据通过链路复制到远端,该数据可以在20分钟的复制周期内传送完毕。当然,如果数据无法在20分钟内传送完毕,下一个复制周期可以自动延长,完全取决于数据复制量的大小和带宽。所以,该方案非常适合用户超长距离和低带宽的环境。

  在该方案中,灾备端必须配置TimeFinder软件,它可以保证在每个复制周期的开始之前,对灾备端的数据提供保护,确保在复制期间由于线路不稳定等故障时,可以确保上一个复制周期数据的完整性和一致性。

  3 容灾演习规划和实施

  EMC业务连续性服务集成方法论将整个客户服务过程分为规划(Plan)、建立(Build)、和管理(Manage)三个阶段,并细化为以下十个步骤:

  1. 评估当前的服务水平

  2. 定义业务需求

  3. 评估可用性和恢复技术

  4. 基础架构设计

  5. 实施规划

  6. 测试及实施

  7. 开发恢复及切换计划

  8. 集成测试和演习

  9. 业务连续性更新

  10. 资源管理、改进及衡量

  其中,EMC最具特色的容灾演习。EMC是目前业界唯一一家真正能够提供容灾演习的厂商。在本方案中,EMC将协助客户制定容灾演习计划,实施容灾桌面演练,并参与、协助和指导真实容灾演习。

  具体内容包括:

  协助制定容灾演习规划。

  编写演习计划并提供模板。

  协助并指导应急计划的编写。

  参与并指导一次真实容灾演习,对容灾演习进行监督和记录。

  发现演习中不符合规范的问题,并提出改进建议。

  发现演习中不完善的问题,并提出对BCP的相应的修改建议。

  编写演习报告并进行汇报。

  4 总结

  EMC在容灾方面拥有业界最广泛、最深入的技术和最强的产品阵容。EMC拥有多年实施业务连续性和容灾服务的经验积累,在此基础上开发出来的业务连续性实施方法论模型,业已在全球众多相关项目中广为使用并得到验证。

  另外,EMC方案的特点是注重项目管理。项目管理是项目成功的最关键环节之一,对于本项目的两个最重要的工作内容之一(另外,最重要的内容是项目方案回顾和详细方案设计),我们的项目管理团队,根据客户的灾备总体设计业务目标和技术方案,根据项目的进展安排,制订详细的项目管理计划,通过沟通等项目管理技术手段,保证项目能够按照我们的预定目标执行,在规定的时间内,保质保量地完成客户的灾备项目。由于篇幅有限,本方案删去大量内容,还请谅解。

时间: 2024-09-15 05:46:48

EMC容灾技术和业务连续性服务方案的相关文章

灾难恢复与业务连续性服务方案

※服务方案概述 中金公司为客户提供灾难恢复所需的IT设备系统和业务恢复工作/生活环境,供客户在中金灾难备份中心进行灾难演练和灾难恢复时使用. ※服务目标 一旦客户生产中心发生灾难,客户利用备份数据,使用中金灾难备份中心的IT设备进行灾难恢复,实现业务持续运作的目标. ※服务内容: ☉灾难恢复系统提供服务 ☉业务恢复工作环境提供服务 ☉业务恢复人员生活环境提供服务 ☉灾难演练服务 ☉灾难恢复服务 ☉制订http://www.aliyun.com/zixun/aggregation/13807.ht

利用灾备自动化技术兼顾业务连续性与灾难恢复

本文摘要:自己的数据中心停止运行或建筑受到破坏时如何保持正常运营?这样的话题令人不悦,而相关的问题更是难以解答.同样烦人的还有如何评估当前薄弱或无效的数据保护方案的实际整体成本问题.通过引入自动化技术,企业则可以有效的解决上述的两大难题,为BCDR做好妥当规划. 行业中似乎一直对业务连续性 (BC) 和灾难恢复 (DR) 流程之间的差别有所混淆.企业们常常使用其中一个术语来指代另一个所描述的动作.许多企业在这两个方面或其中之一上有所欠缺,从而导致了灾难性的结果.谁也不想有灾难,没有企业愿意面临这

灾备故障上了红头文件,容灾技术到底哪家强?

昨天上午,中国银监会下发的关于"数据库文件损坏风险提示"的文件图片在朋友圈和大部分IT微信群里刷屏了.这是继2014年7月1日宁夏银行核心系统数据库出现故障,导致该行(含异地分支机构)存取款.转账支付.借记卡.网上银行.ATM和POS业务全部中断之后,又一家城市商业银行爆出的灾备故障,数据库容灾问题一时被推到了风口浪尖.事件回放  根据<中国银监会办公厅关于数据库文件损坏风险提示的通知>中描述:2015年5月8日,某城市商业银行核心系统使用的甲骨文数据库系统发生故障,数据库

各保险公司陆续完成基本容灾系统的IT基础架构建设

为提高IT系统的可靠性,IT系统的容灾建设已相当普遍.随着许多企业实施业务系统大集中,针对IT系统的高可靠性和容灾能力的需求日渐突出.对于保险公司来说,其数据的安全性以及业务的连续运营的要求更高.虽然各保险公司十分重视灾备系统的建设,陆续完成了基本容灾系统的IT基础架构建设,但如果没有相应的灾难恢复计划,也没有针对灾难发生后的应对.决策.详细的灾难恢复步骤,容灾系统将难以发挥真正功效.保险业越发展,数据"保险"越重要.相信在保监会的政策支持和引导下,越来越多的保险公司终将为核心业务数据

灾备行业关于数据保护与容灾备份的常识

谈灾备,就会细谈数据保护与容灾备份.然而,相关的概念经常有人混淆.我们搜集和参考公开资料进行初步梳理. 一.数据保护 在云与大数据时代,海量增长的数据容量,给数据的存储和保护带来新的挑战,从传统熟悉的IT架构到以云架构.虚拟化.超融合为代表的技术升级迭代,使得数据保护的技术手段也要加速. 1.数据保护的重要性 数据是企业重要的生产资料,关键数据的丢失可能会给企业致命一击.比如在911事件中,Bank NewYork在数月后因数据的丢失被迫破产清盘. 为什么后果如此严重?因为数据是计算机系统存在的

容灾备份的等级和技术 保护企业数据

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾.地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作.容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能.

TechTarget中国举办“企业容灾体系建设”技术沙龙

专注于企业级IT领域的网络媒体TechTarget中国(www.TechTarget.com.cn)于近日成功举办"如何构建全方位容灾体系"技术沙龙,邀请行业中立专家.用户以及容灾技术爱好者共同探讨企业容灾体系建设问题,为IT专业人士及管理决策人员打造自由开放的技术交流平台. 从TechTarget 2012年企业IT业务优先程度调查结果中我们可以明显的感觉到,企业CIO对容灾的重视程度正在不断加强.44%的受访用户表示,在未来一年内容灾将是企业存储技术及解决方案部署的"高优

双数据中心容灾模式的构建

内容提要:数据容灾问题是政府.企业等部门信息化建设过程中面临的一个具有重要理论和现实意义的研究课题.为实现容灾的建设需要在容灾相关技术.业务系统需求分析.容灾的总体方案设计及系统实现等进行设计与研究.本文根据新疆国税业务数据处理的现状以及将来容灾建设的目标,详细阐述了容灾的概念.技术要点,重点对新疆国税的业务数据处理进行分析,提出了具体的容灾解决方案,同时,给出了测试实例. 关键词:双数据中心 容灾 RPO RTO 随着税务系统信息化建设的不断深入,按照"一体化建设"原则,税务系统业务

大话存储系列19——数据容灾

数据备份系统只能保证数据被安全地复制了一份,但是一旦生产系统发生故障,比如服务器磁盘损坏致使数据无法读写.主板损坏造成直接无法开机或者机房火灾等意外事件,我们必须将备份的数据尽快地恢复到生产系统中继续生产,这个动作就叫做容灾. 容灾可以分为四个级别: 数据级容灾:也就是只考虑将生产站点的数据如何同步 到远程站点即可. 与应用结合的数据级容灾:也就是可以保证对应应用程序数据一致性的数据同步,以及可感知应用层数据结构的.有选择的同步部分关键重要数据的数据容灾: 应用级容灾:也就是灾难发生时,不仅可以