使用云基础灾难恢复方案前要考虑的五个问题

继一系列企业所关注的业务类技术(包括CRM、ERP及协作等)之后,云计算又将自身势力范围推向灾难恢复方案领域。对于终端用户而言,这无疑是个好消息。价格的大幅回落不仅让过去不敢做非份之想的小型企业也有了筹备灾难恢复机制的能力,也给企业用户带来了更加丰富的方案选项。

然而云绝不是万能的,而且对于很多企业,云基础灾难恢复其实无法满足甚至完全偏离了需求轨道。

为了帮助大家制定出一套与企业目标相匹配的云战略,请认真考虑以下五个问题:

1.哪些数据在灾难过后需要首先恢复?

随着CIO们对灾难恢复机制的进一步关注,此类规划不可避免地与大数据搭上了关系。如今员工们指尖所操作并保存下来的数据达到了前所未有的规模——PC机磁盘、移动设备、廉价的U盘加上以Dropbox为代表的线上存储都成为人们囤积信息的方案——而与之相应,存储功能的单位成本则变得越来越低。2000年时每GB的存储成本还需要接近10美元,如今则已经低于10美分。成本低了大家自然也就轻松了,管它有用没用,保存了再说。

在大数据时代下,我们显然无法对每一个字节进行备份与恢复,至少不会在灾难发生后第一时间这么干。毕竟数据的重要性有所不同,全面恢复既浪费时间又毫无必要。对于建筑企业Graniterock公司而言,让企业资源规划(简称ERP)软件尽快恢复正常才是他们遭遇故障后的当务之急。ERP能帮助他们派遣运力、将卡车分配到像机场这样优先级别最高的建筑工地,以确保司机师傅能够在混凝土凝固前将其运送到指定地点。

这家公司原先使用的是由甲骨文提供的本地ERP解决方案,然而对于Graniterock那过于袖珍的IT团队而言,本地方案所带来的维护与管理负担实在难以消化。有鉴于此,Graniterock公司果断转而使用来自Velocity的托管型ERP方案。云基础ERP系统所带来的最大优势在于将灾难恢复变成一种功能,而不像过去那样需要当作一个漫长、繁琐且消耗大量资源的特殊项目。

“ERP是我们的业务重心,但我们也希望今后能在业务中使用更多辅助类应用,”Graniterock公司CIO Steve Snodgrass表示。该公司最近刚刚将原先使用的多供应商存储环境(来自EMC、NetApp、Data Domain及Buffalo四家)更换为由Nimble Storage一家提供的SAN方案。

截至目前,Nibmle SAN采取的是仍然是本地备份机制,但运营经理Ken Schipper希望企业能尽快拥有自己的在线灾难恢复方案。只有能够涵盖Exchange、虚拟机及各数据库的方案才能称得上真正的灾难恢复机制。

2.企业所在地可能遭遇的灾难属于哪种情况?

当公司转身云基础存储方案时,所在区域的重要性往往没有得到足够的重视。如果大家在选择数据恢复服务时没有考虑到所在地的特殊性,那么像卡里里娜或是福岛这样的重大事故将令灾难恢复机制形同虚设。

“很多技术人士对灾难恢复方案中的‘灾难’属性认识不足,他们忽略了在很多情况下,企业员工需要撤离基础设施甚至公司所在地。人们总是把希望寄托在云服务供应商那边,但事实上如果不付钱,根本没人会上门为大家解决难题,”来自IDC分析公司合作伙伴、一家位于普鲁士王市业务连续性企业的美国注册业务持续专家Ginnie Stouffer指出。

“卡特里娜在这方面是个值得大家借鉴的绝佳实例,”她补充道。“许多企业意识到了异地备份的重要性,但却把异地数据中心选在了新奥尔良。不少愚蠢的银行甚至批准了这类项目,但我们了解事情的走向、也深知这么做的危害。”

举例来说,Graniterock公司的总部设在加州沃森维尔市,即圣何塞南部约45分钟车程。这里是地震的高发区域,但凡关注新闻的人应该都有所了解。事实上,沃森维尔的本地IT基础设施与Velocity在西雅图创建的数据存储中心都面临着地震频发的问题。也许一场地震不可能同时摧毁两个区域,但一系列与火山活动有关的地震则可能持续袭来、最终令该公司设置的异地备份方案化为乌有。

没错,这种情况发生的概率极低,但卡特里娜和福岛县的核泄露不也同样是低概率事件么?灾难恢复防的就是低概率事件,大家必须清醒地认识这一点。

“现在我们以实时方式将Velocity西雅图数据中心内的信息传输到丹佛,”Snodgrass指出。“将数据存储在低风险区域能够有效提高关键性信息的安全性。”

那会不会有一场影响范围极其广泛的自然灾害同时席卷圣何塞、西雅图与丹佛?嗯,当然有可能。但我们估计要导致如此规模的灾难,至少也得是外星人入侵或者僵尸大爆发之类的世界级事件了。到那时候Snodgrass早就逃命去了,哪还管你什么数据恢复。

3.您部署的是灾难恢复机制抑或仅仅是数据复制?

人们印象中的很多服务项目及供应商支持方案并不是真正的灾难恢复机制,而仅仅称得上数据复制服务。数据复制确实能起到一定作用,但却无法向终端用户提供整套基础设施的镜像生成能力。用户能做的只是获得经过复制的数据,却无法保证与数据搭配的系统仍然保存完好。

操作系统、应用程序与用户设定就不在复制内容之列。一旦灾难发生,数据根本无法在服务器与数据库重新创建完成之后得到恢复,这也就意味着企业需要承受更长的停机时间与更大的舆论压力。

数据复制对于企业的正常运营而言当然很重要,不过更重要的是技术人员得清醒地意识到这绝不是灾难恢复机制的全部内容。不过随着HTML 5以及基于浏览器、无需存储的Nirvana方案的最终出台,相信数据复制必将真正有能力接过灾难恢复的大旗。

但在此之前,请大家先别盲目乐观,把现有灾难恢复机制落实到位才是正途。

4.所有保障规划顺利实施的补充工具都准备好了吗?

云基础数据复制之所以在人气方面远超云基础灾难恢复,其中一大重要原因在于通过公共互联网传输灾难恢复所需要的规模化数据实在太过昂贵,这需要企业花大价钱购置MPLS连接才有可能实现。正是出于成本的考量,大多数企业才仍然选择在物理层面实现灾难恢复,采用磁带等效果不好但更为廉价的解决方案。

对于真正有能力服务于企业的云基础灾难恢复机制而言,光靠存储与镜像功能还远远不够。即使大家将应用程序交由云服务供应商托管,也仍然无法保证它能够有效完成数据镜像生成及跨区域传输工作。

我们怎样才能在不耗尽基础设施资源的前提下把如此海量的数据通过互联网进行传输?许多企业已经发现,以CDN或WAN优化为代表的补充型技术对于灾难恢复工作的顺利完成有着不可或缺的重要意义。

“多年来我们一直在向客户提供WAN优化服务,但说实话这方面成本还是偏高,”OpSource公司全球渠道与合作高级副总裁Jon Beck表示,这是一家专门提供云计算及托管管理服务的企业。传统WAN优化方案要求在每套基础设施、多数办公地点及其它远程站点当中安装硬件设备,由此带来的成本无疑令人难以接受。

为了帮助客户降低成本并为更广泛的消费群体提供数据复制与灾难恢复业务,OpSource公司对来自Aryaka的WAN优化方案针对云环境进行了调整。“在OpSource公司,我们对于SaaS模式充满信心,而Aryaka公司只是众多遵循SaaS模式提供WAN优化服务的供应商之一,”Beck表示。经过悉心调教,目前所有服务于OpSource及其客户的灾难恢复方案都开始根据实际使用情况计费,而不再需要投入高昂的前期设备采购成本。

5.针对脱机业务筹备一套B计划

即使是最完美的灾难应对方案也无法保证在真正的灾难面前保障万全。对于Graniterock公司而言,企业所拥有的大量建筑运力能够在灾难发生后帮助管理者及时清理现场、组织重建。但他们要如何组织起这项工作?

“如果灾难降临,而公司所在地的WAN已经无法正常使用,那么异地数据备份就根本不可能发挥作用,”Snodgrass指出。

尽管Graniterock公司早就已经在开展网上计费及在线支付业务,但他们仍然在手头上保留了大量纸质票据以备不时之需。他们准备了大量纸质发车通知及验证票据,这样在网络服务无法使用的情况下工程人员就能以人工形式规划及指派复杂的混凝土运送工作。

(责任编辑:施柏鹏)

时间: 2024-10-23 06:26:20

使用云基础灾难恢复方案前要考虑的五个问题的相关文章

甲骨文扩充面向企业云基础架构Oracle优化方案

北京,2012年6月26日--甲骨文http://www.aliyun.com/zixun/aggregation/17539.html">公司宣布,为面向企业云基础架构的Oracle优化解决方案(Oracle Optimized Solution for Enterprise Cloud Infrastructure)推出新的SPARC/Oracle Solaris选件,以扩展甲骨文的云产品线. 目前有很多客户想对基于SPARC的现有基础架构进行升级.合并和虚拟化,而面向企业云基础架构的

GDS携云灾备方案参加第十届灾备论坛 助力大数据价值挖掘

ZDNet至顶网服务器频道 05月28日 新闻消息:5月26日-27日,第十届中国灾难恢复行业高层论坛在贵州举行,作为国内灾备服务的领军企业和开创者,以及国家灾备标准的制定者,万国数据(GDS)副总裁刘东红于论坛上做了题为<大数据时代下的灾备建设和管理体系>,介绍了大数据时代下的灾备需求.国家灾备体系现状.企业灾备体系建设和管理要点,并展示了GDS云灾备解决方案.在大数据时代背景下,该解决方案将帮助用户高效.低成本地建立安全.可靠的灾难恢复体系,保证数据的安全性.可用性.完整性. 万国数据副总

同程容器云平台网络方案演进

本文讲的是同程容器云平台网络方案演进[编者的话]同程旅游PaaS平台是从2014年开始搭建的,到现在已经持续发展了三个年头.规模从原来的几百个容器到现在上万个容器.在容器调度上从原来的手动操作到现在的自动伸缩与扩容,在宿主机部署密度上从原来的十几个容器到现在上百个容器--我们的PaaS云平台在三年间进行了3次大版本的迭代.本文主要介绍同程旅游PaaS云平台在持续集成和持续部署方面,基于Docker对网络方案的选型及应用,以及随着业务需求的增加而经历的网络方案变更过程. [3 天烧脑式基于Dock

小银行青睐基于云的灾难恢复服务

许多银行正开始使用云计算服务来满足其技术要求中一个很关键.很敏感的方面:灾难恢复. 依赖云计算的银行可以在由第三方管理的服务器上租用空间,而不是在组织内部管理服务器硬件.云计算服务有望为银行节省资金.缩短恢复时间,但是到目前为止,迟迟没有得到采用,规模较小的银行在充当开路先锋. John O'Brien是南卡罗来纳州哥伦比亚市康加里州立银行(Congaree State Bank)主管信息技术的执行副总裁,他说:"我们与灾难恢复有关的IT成本有望削减一半,恢复时间也有望缩短至三分之一."

中企通信创新“云+安全”综合方案持续发力垂直企业市场

2017年3月(北京) - 中企网络通信技术有限公司(以下简称"中企通信")宣布,将在2017年以创新的"云+安全"综合方案持续发力垂直企业市场,并结合多个合作伙伴推出大数据.物联网.网络虚拟化等增值服务,深挖产业需求,包括零售.汽车.服装.医疗.金融.地产等板块的标杆型企业,进一步满足客户突破性发展与转型的需求. 中企通信公司信息科技及安全服务部高级副总裁邝伟基表示,"中企通信作为国内ICT领域的供应商,凭借创新思维开启智慧新时代.我们时刻紧贴市场趋势及

《云计算:原理与范式》一1.5 云基础设施管理

1.5 云基础设施管理 在构建云基础设施时,IaaS供应商面临的一个关键挑战是从整体上管理物理资源和虚拟资源,即服务器.存储.网络[43].必须快速和动态地为应用提供资源的方式进行资源的编排[7].负责此业务流程的软件工具称为虚拟基础设施管理器(Virtual Infrastructure Manager,VIM)[7].这种类型的软件与传统的操作系统类似,不过它并不与单独的计算机打交道,而是聚合了多台计算机资源,为用户和应用提供了一个统一视图.术语"云操作系统"也涉及了VIM[43]

主要的云基础架构管理产品提供相似的核心特性

云管理是个热门话题,热门到每一家新兴公司和老牌厂商都提供用来管理云计算环境的某种工具.有监控工具,有配置工具,还有介于两者之间的工具.市面上自然还有雾件(vaporware),想理清头绪并非易事. 如果你部署的云是相当静态的环境,或者不是关键任务环境,那么可能不需要动态配置系统.这种情况下,产品内置的用于添加/变更/移除资源的标准工具也许绰绰有余. 几家供应商拥有专门为云计算管理设计的产品(VMware.OpenQRM.CloudKick和Managed Methods),另外还有像BMC.惠普

快速架设OpenStack云基础平台

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://chenguang.blog.51cto.com/350944/968169 通常在linux下手工安装openstack比较麻烦,StackOps是一个可以快速安装的Openstack解决方案,首先我们下载StackOps的iso文件(stackops-0.5-b1312-d20120510.iso实际上是一个基于Ubuntu10.04,http://pan.baidu.com

云配给就是指在云基础架构上部署和管理IT资源的过程

本文作者详细介绍了一种配给性能测试方法,您可以使用它判断出现配给性能滞后的位置. 本文描述了一种配给性能测试方法,您可以使用它判断哪些位置出现云计算配给性能滞后.该配给性能测试的目的是: 从用户角度以端到端的方式测量总的配给时间. 当同时存在多个配给时,判断配给时间的趋势. 将整个配给时间分解为几个部分,从而判断哪些组件和步骤占用的性能开销最多. 当系统中有许多配给请求时,获得组件级别的排队信息,从而帮助找出瓶颈. 让我们了解一些云配给的基础知识. 云配给的基础知识 云配给是指在云基础架构上部署