可以肯定地说,服务器虚拟化对今天实施灾难恢复(DR)的方式有很大影响。将虚拟机(VM)复制到远程站点或云,当发生故障时将生产系统切换到保存的虚拟机副本上,这已经改变了我们通常认为的灾难恢复方式。
灾难恢复即服务(DRaaS)供应商已经接纳了这一技术,推出基于云的应用快速恢复。对许多组织来说,这是一个福音,因为这种方法可以比传统的将数据复制到灾备站点花费少得多,并提供同样快速的恢复时间。这一切听起来很不错,但在选择基于云的灾难恢复方案之前,有一些担忧你必须预先知道。
尽管云灾难恢复能提供很多好处,但它仍然是一个新兴技术。根据Forrester Research的2014年报告显示,从云灾难恢复发布之日起,19%的受访者已经采用这种方案,另有22%准备采用。企业选用基于云的灾难恢复主要有以下三大好处:
- 以更低的成本获得更好的功能
- 更容易,更便宜的测试
- 合同方式更灵活
报告解释说,成本之所以能够保持低位是因为用户通常只需要在云存储容量上产生花费。计算资源只有在发生灾难或测试的情况下才需要支付。测试也可在不中断业务的情况下进行,这让用户可以更频繁地进行演练。这是一个巨大的优势,因为对于传统的灾难恢复测试,这历来是个痛点。而相较于传统的灾难恢复外包模式,合同设置比较受限,且期限较长,相比之下云灾难恢复的合约设置更加灵活,有些服务甚至不以时间作为合同约束因素。
根据你的具体需求,有无数方法可以帮助你实现基于云的灾难恢复,但各种可选项基本可以划分为两大类:业务连续性/灾难恢复(BC/ DR)服务和灾难恢复的云托管(Cloud DR hosting)方式。当然这种划分不是固定不变的,但对于考量基于云的灾难恢复,这是很好的出发点。
业务连续性/灾难恢复(BC/DR)服务
有一些受控灾难恢复服务提供商提供基于云的灾难恢复,大多采用混合云的方式,即把现场备份的数据再复制到云存储中。这种方案使得在数据丢失或损坏的情况下快速还原,而远端副本只是在服务器宕机或整个数据中心中断的情况下才使用。
有些云灾难恢复提供商是大型企业,在全球范围内拥有数据中心并提供各种各样的BC/ DR服务。 比如SunGard的Availability Services和IBM的Business Continuity and Resiliency Services(BCRS)就是这种类型的典型例子。将业务拓展到云灾难恢复,以此来扩大自己的服务组合,对于这些公司来说,是自然而然,毫不奇怪的一步。其他一些提供商,例如Axcient、Barracuda Networks、EVault、惠普、IBM、iland和Rackspace,也都提供了各自不同的云灾难恢复服务/方案。
规模较小的云服务提供商也与备份软件供应商合作,共同提供基于云的灾难恢复。例如Asigra,通过渠道专门销售其备份软件,并通过其虚拟灾难恢复功能为用户提供 “即时恢复”。此功能允许用户配置对他们的虚拟机进行备份,从而在备份操作完成后,最新的副本也会保存在服务提供商的云中。许多备份软件供应商与管理服务提供商(MSP)结成合作伙伴关系,提供从虚拟机备份中运行应用程序的功能。此类产品的一些例子包括CommVault的Simpana,赛门铁克的 NetBackup以及Veeam的Backup & Replication。
BC/ DR服务通常按照付费订阅的方式收费,并根据存储的数据量及消耗的计算资源量,用户还需要支付一笔固定费用。各家服务因供应商的不同而异,而且在很多情况下,可以根据企业的具体需求进行定制。例如,有些客户可能需要更健壮的自助服务选项,而另一些则更多地依赖管理服务提供商的专业知识。在选择合适的云灾难恢复提供商时,很重要的一点就是要衡量你的IT的优势和劣势。此外,云提供商所能提供的服务水平可能相差很大——稍后我们将探讨这个话题。
灾难恢复的云托管
灾难恢复的云托管类似传统托管,企业无需购买和维护额外的场外硬件。换句话说,用户需要负责管理将生产数据复制到云,以及执行恢复任务。与上面详细介绍的BC/ DR服务模式相比,这种模式下服务提供商的角色比较有限。
主要的基础设施即服务(IaaS)提供商像亚马逊,谷歌和微软都提供灾难恢复的云托管业务。以亚马逊为例,提供三种不同层次的灾难恢复云托管:
- 备份和恢复。用户将数据(使用支持亚马逊作为备份目标的备份软件)备份到亚马逊的S3存储。在发生故障情况下,用户可以使用Amazon Machine Images(AMIS)在EC2中启动应用。AMI可以与操作系统和应用程序栈的适当部件进行合理配置。这是最便宜的选择方案,但需要的恢复时间也最长。
- 快速恢复指示灯。与上述情况类似,但你的系统中最关键的核心要素已在AWS中配置。当需要进行恢复的时候,你可以围绕这些关键核心快速配置起一个全面的生产环境。
- 热备份。在这种情况下,一个具备完全功能的环境的缩小版本始终运行在云中。热备份方式对指示灯方式下的元素和准备进行了扩展。由于一些服务始终在运行,这进一步减少了恢复时间。 这种类型的灾难恢复云托管可能只对拥有内部员工可以远程管理这些流程的大型企业具有吸引力。小规模公司由于内部BC/ DR的经验有限或者完全没有的,只能依赖云提供商的专业知识。
云灾难恢复所面对的挑战
尽管云灾难恢复能够带来诸多好处,但你也应该了解它所面对的一系列挑战。
其中最重要的一件事情是,根据Dragon Slayer咨询公司的Marc Staimer,你要知道不是所有的云灾难恢复服务提供商都是一样的。对于较小的云服务供应商尤其如此,他说。 “巨头拥有资源。像IBM和Sungard这样的公司有经验和能力长期提供DRaaS,”Staimer说。 “小型云提供商可能有技术,但人力资源是它们最大的限制。”
Toigo Partners International的Jon Toigo也表达了相同的担忧。 “你在乞求服务提供商的怜悯,”他说。 “他们到底有多么敏捷?你的供应商必须非常熟悉你的应用以及如何使它们启动并正常运行。这绝不像听起来那样容易。这不是即插即用”。
Staimer指出,较小的云提供商对于一些要求按天提供云灾难恢复服务的客户可能会好一些。 “但是当出现一个区域性灾难时会发生什么?”他问。 “如果灾难是广泛的,他们能够一次处理多少客户的需求?”
除了关于人员配备方面的质疑,云服务提供商的计算资源也常常被夸大。你的提供商是否具有足够的计算资源以应对他的所有客户的应用程序在同一时间需要启动? “人们很少去检查这些东西,”Toigo说。
选择灾难恢复云托管的路线并自行管理自己的一切,可以避免这些问题。但是,如上所述,这需要企业内部具备相关的技能和资源,而许多选择云托管方案的公司其实并不具备。
如果你选择与管理服务提供商签署合约,请做足功课。Staimer和Toigo都建议你向可能的云灾难恢复提供商问尽可能多的问题。 “确保你可以做测试。确保你的用户能够获取数据,了解该供应商可以并发处理多少个用户请求。与他们讨论参考资料。与多个供应商都进行洽谈,”Staimer说。 “另外,你需要把服务水平协议(SLA)写进合约。”
Toigo最后的一番建议是关于“对价格谨慎”。 “在许多情况下,较小的云服务提供商是从大型云供应商例如微软,谷歌和亚马逊租借空间,”他说。 “现在,价格战使得云计算和存储的成本都在下降。而当它结束时,预计价格将会走高了。”
他接着说,了解你的退出策略是很重要的,尤其是当成本开始走高,你需要退出服务的时候。 “如何拿回你的数据?”他说。 “Dternity使用磁带。其他云提供商也有使用磁带的。云提供商是否能够导出你的所有数据到磁带,这一点也是值得考虑的。”
本文作者:Julian
来源:51CTO