【WatchStor独家译稿】当灾难发生的时候,IT部门最好是有所准备的,因为业务依赖于管理业务的信息和技术。然而对于中型企业来说,规划和配置灾难恢复一直都是具有争议的话题。大型企业有专门的灾难恢复系统来挑选,小型企业往往可以通过特有的措施来应对灾难,而中型企业就身处于夹缝之中——既买不起庞大的灾难恢复系统,离线磁带又不能满足他们的需求。
不管卡特里娜飓风或者最近让服务器中断工作的停电事故是否还让我们印象深刻,CEO们都越来越关注灾难恢复问题。在我们的研究调查中,79%的中型企业表示他们已经制定了业务连续性计划;42%企业的技术层还没有意识到可能阻碍灾难恢复规划的因素。然而,众多企业在恢复速度方面也各不相同:35%的企业表示他们在几天时间就可以恢复正常运作;28%的企业可能需要几周的时间。
中型企业要想加强对灾难的准备措施,就应该采用那些能够彻底改变他们灾难恢复现状的新技术,而且还需要花时间分类应用和管理恢复流程。基本问题是,哪些应用是业务运行必需的、企业能够承担多少数据的丢失以及能够接受多长的等待恢复时间。
例如,一个CAD系统可能对一家企业来说非常重要,但是在发生洪水或者龙卷风的时候,夜间磁带备份或者每星期一次的服务器重建就已经足够工程师恢复任何丢失的工作。在发生局部灾难的时候,他们完全不必为无法找回最近的设计资料而担心。区域因素也能起到不同的作用,如果一家公司在不同地区设置分支机构,那么他们更倾向于选择站点之间的数据复制,虽然灾难事故的发生会降低他们整体的生产率,但是几乎没有任何信息的丢失。
关键的管理措施
有两个需要规划的关键数据,一个是恢复点目标(或称RPO),另一个是恢复时间目标(或称RTO)。RPO指的是业务系统所能容忍的数据丢失量。在上面我们举的那个CAD例子里,也许丢失了大约一天的数据量,因为备份只是在晚上进行的。对于一个电子邮件系统,企业也许能接受的是一个小时的数据量,而对于一个交易处理系统,丢失任何数据都是不能接受的。
恢复时间目标指的是所能容忍的业务停止服务的最长时间。也许让那个CAD系统停止工作一个星期没什么事,但是电子邮件系统就不行了。在这里,系统本身的RTO和其中数据的RTO是不同的。如果电子邮件系统正在运行——2/3的企业在他们的灾难计划中都仍有通信——即使没有后端的电子邮件文件,员工也可能会丢失已经完成了的有效工作。交易处理系统则需要在几分钟之内恢复运转。
IT部门不能凭空决定系统的RPO或者RTO,他们需要对用户进行调查研究,就中断时间和丢失数据的价值咨询负责相关业务的经理以及高管。当部署一个应用的时候,不仅仅需要考虑它的备份策略,还必须考虑设定不同的RPO和RTO。例如,一个RPO和RTO值较低的交易处理型电子商务系统最理想的是选择托管,这样就有冗余的因特网和能源网络连接、发电器以及适当的安全性,而这些项目都是许多中型企业数据中心无法独立承担的。一些中型企业,尤其是位于旧金山和Gulf Coast等地区,都是使用托管设备来满足他们数据中心需求,然后使用他们的本地站点来实施灾难恢复备份。
如果企业希望将RPO从几小时减少到几分钟,他们他们需要实时地将写入请求复制到他们灾难恢复站点的副本库中。现在市场中有很多可供选择的复制产品,每款产品都是以在成本、带宽需求、RPO以及易于管理性之间取得最佳平衡为目的设计的。现在最常见的三种数据复制方法是:同步、异步和快照。
同步复制系统是先对每个写入请求进行复制,然后将副本发送到主数据站点以及二级数据站点中,他们需要等待交易完毕才能完成两个站点的写入。这么做可以将RPO降低为零,但是成本是很高的,而且如果设计不得当的话,这种产品将可能会大大削弱应用的性能。一般只有大型企业机构会采用这种系统,而且使用的是暗光纤或者其他高性能网络。
异步复制也可以将RPO降低为零,不过这种方法不需要等待每个写入请求在本地或者远程数据中心的通过。另外还需要管理和优化方面的技巧将带宽利用将至最低。
快照复制则是在存储层级实施的,是在一定的时间间隔内传输被修改的数据块。这种系统占用的带宽更少,而且不需要应用识别功能。虽然基于SAN的系统是数据复制的最理想选择,但它的成本是大多数中型企业不能接受的。
中型企业越来越青睐基于主机或者基于应用的复制策略以及基于服务器虚拟化的系统。不仅价格更低,而且虚拟化技术能够大大减少启动灾难恢复站点所需的时间和设备。【WatchStor独家译稿未经许可禁止转载,合作伙伴请注明文章出处为WatchStor.com】
作者:WatchStor编译
来源:51CTO