为了避免启用灾难恢复安全网络,应为数据中心构建IT业务连续性规划。然而在开始之前,我们要先权衡一下使用托管与云端两种方式的利弊。
灾难恢复应该被看做是最终的安全网络措施。因为公司IT平台停机的每一秒,都会损失相应的利润。由于业务连续性能够保证公司在IT平台遇到问题时仍可正常工作,应该考虑成为建设的目标,而不是仅仅缩短停机时间就可以。
当我们构建IT业务连续性规划时,可以从托管和云平台两种截然不同的方法入手。
托管方法解决业务连续性挑战
托管的问题在于公司仍需持有全部的硬件,需要时在内部进行替换。如果你为自家的数据中心中选择内部平台,一般采用“N+M”的冗余策略:即对于每N件设备,旧有M件数量的设备冗余,以备其中任何设备出现问题时进行替换。然而,这意味着,公司要在设备上花一大笔资金来以防万一。这可能将成本延伸至许可证、维护、供电以及占地等方面。更重要的是,该方法仅能应对低级别的设备故障,而业务连续性的保障则是需要将工作负载从一个平台切换至另一个平台来实现的。
对于站点级别的业务连续性,公司不得不在不同的设施中支付备份镜像站点的成本,同时还要面对运行维护远距离的同步挑战。像这样,应用托管方式建立一整套的IT业务连续性规划的成本是相当高的。
应用云端方法应注意服务等级协议
由于硬件是在云端部署的非自家设施,服务等级协议(Service-Level Agreement,SLA)就成为了关键。云供应商会在服务等级协议内说明,他们将承诺提供哪种等级的业务连续性。
考虑到云平台是在多个用户间所共享的,架构优良的云平台会将任何设备故障的情况考虑进来,它允许N+M的模式扩展到更大的设备范围。然而,如果供应商偷工减料只在像光纤通道控制器固定区域或者广域网连接器区域内实施N件备份设备的策略的话,云端将出现很多故障。
因此,当和供应商进行谈判,并打算在云端构建IT业务连续性规划时,确保包括冷却、无间断电源供应以及其他辅助电源供应系统等平台的方方面面都已经准备了适合并可用的冗余。
冷镜像vs.热镜像
同样需要和云供应商研讨确定的是远距离IT业务连续性规划。高性价比的方法是为所需要备份的应用程序创建进行,以备主站点出现问题时立即替换。对于优先级较高的工作负载,使用远程站点已经事先准备好并运行的热镜像更加适合。对于次要的工作负载,当主站点遇到问题时立即启动至可以运行的状态——即使用冷镜像的方法即可。
热镜像还是相对昂贵,因为很难说主站点哪里会出问题,其本质上是主站点的完全备份。当工作负载从主站点切换到备份站点时,由于云端资源的弹性,将获取几乎所有的资源而没有保留。
冷镜像的运营成本较低。不仅存储成本相对低廉,并且在在双方事先确认的服务等级协议中会说明系统将以何种速度启动,需要哪些资源,才能将业务恢复到正常工作的水准。
尽管冷镜像是备份和恢复用得比较多的方法,在数据已经镜像同步的情况下,现代云平台能够在很短的时间内重新启动镜像,将服务恢复到原有状态。相比于尝试从数据备份中恢复所有内容的方法要便利得多,真正的问题在于如何缩短恢复点目标和恢复时间目标间的时间。
当构建IT业务连续性规划时,相比于托管方法,云端平台能够提供更为灵活、性价比更高的方案。不过,许多托管供应商合作伙伴能够提供一种混合的可行方案。
本文转自d1net(转载)