数据中心灾难恢复的最佳实践

如今,数据中心运营商每天都在为数据中心的高可用性感到烦恼,全天候工作以确保100%的正常运行时间。他们部署冗余设施以最大限度地降低风险,严格规划和测试以确保连续性运行,并采取预防措施保护其基础设施免受环境威胁。但是,即使是最好的计划和准备措施也会在自然灾难或突发事故中出错。

事实上,在某些极端情况下,先进的规划和准备工作依然无能为力,而灾后恢复成为确保企业在重建数据中心业务的同时保持功能的重要组成部分。

在任何灾难情况下,时间都是至关重要的,因此数据中心工作人员需要知道在事件发生后的几分钟、几小时和几天采取适当的行动。

工作人员的安全首先是最重要的因素,因此一旦确定所有人员都是安全的,就应该开始执行以下恢复活动:

  • 主动监控所有关键设备以寻找隐藏的问题 - 查看直接受到灾难事件影响或暴露于灾难事件的设备,如发电机,机油和过滤器等。例如,在恢复工作可能需要几天甚至几周的情况下,对于监测燃料供应和了解发电机在没有备用柴油的情况下运行多长时间至关重要。在自然灾害紧急情况下,医院,急救人员和其他公共安全组织必须首先获得燃料供应,无论数据中心是否有没有燃料供应合同。
  • 在指定的时间段内增加现场巡查 - 这将有助于工作人员发现任何缺陷,如漏水或设施损害。确保每位员工都有合作伙伴提供支持和帮助也很重要。
  • 确保员工轮岗,减轻现场员工的压力 - 为了给员工提供足够的休息时间,企业可以考虑从其他没有受到影响的数据中心招聘员工或委托第三方供应商进行部分恢复工作。
  • 建立通信协议,提供关键更新和现场反馈 - 在验证所有区域和系统后,定期举行简报会,向工作人员和管理层通报任何数据中心或现场影响。在灾难恢复情况下,从CIO到每个工作人员人都可以发挥作用,因此,所有参与方都必须及时了解正在发生的事情。
  • 监视输入电源- 由于为数据中心的提供电力的电网可能受到影响,数据中心电力将会中断或质量下降,所以与电力公司联系以了解合理的安全时间非常重要,在电网供电正常时,数据中心关闭备用的发电机。并重新接入电网。
  • 应用经验教训 -只要时间允许,立即开始编写和记录经验教训和最佳实践,为下一步活动做好准备。

尽管自然灾害是不可避免的风险,但通过正确的灾难恢复计划,数据中心运营商可以将这些灾难性事件的影响降至最低,从而快速安全地恢复运营。

原文发布时间为:2017-11-13

本文作者:苏楠

时间: 2024-09-20 04:29:58

数据中心灾难恢复的最佳实践的相关文章

免费制冷:数据中心节能系统最佳实践

利用节能系统配合免费冷却方法来降低能源开销,一直是数据中心的热点话题.任何时间,如果可以关掉空调单元或减少冷水机组的使用,可以减少服务 器所产生的热量,这不仅能降低运营开销,还可以延长冷却设备的使用寿命,降低损耗.North American Access Technologies,是一家经营数据中心设计与咨询业务公司,Julius Neudorfer是其首席技术官,将给我们介绍一些关于数据中心节能系统最佳实践的内容. 问题:节能系统与"免费冷却"对企业级数据中心的远景是怎样的? Ju

现代数据中心需要保持最佳实践

安全和数据中心专家近日在新加坡举行的DCD峰会上表示,数据中心行业不应该像以前那样构建安全性,但应该加强游戏规则,并注意数字基础设施所面临的最新威胁. 独立顾问KaVinWong说:"如果数据中心的UPS和冷水机组的数字控制遭到黑客的破坏,那么数据中心就可能受到挟持."由于对机械和电气系统的控制,攻击者就会发出威胁断电的勒索要求黄.先生在"关键任务基础设施和信息通信技术系统安全安全"峰会期间进行了小组讨论,借鉴了他在过去十年中为东南亚地区的托管经验提供帮助. 数据是

数据中心灾难恢复托管?两大问题必须看清

任何有关数据中心灾难恢复的讨论几乎都会涉及到异地设施的问题.企业在灾难恢复设施的选择面很广,从传统的,非全权托管,到完全基于云的全权托管.实际取决于业务具体需求和能力.作为灾难恢复的增值项,需要更加重视灾难恢复需求.合规性以及持续测试. IT规划中最具挑战性和复杂度的方面是准备应对数据中心和业务处理不可避免的灾害.传统的灾难恢复方法,如远程备份和复制,任然可以发挥作用,但IT组织现在开始向外寻找更好的方式来应对基础设施遭受严重破坏的情况.主机托管已经成为有吸引力的选择之一,因为企业基本上可以复制

数据中心灾难恢复手册

看到了一篇关于数据中心恢复相关的文章,转载至此,虽然没有非常详细的解释原理和相关的操作说明,但看看还是有些认识的. 原文链接: 数据中心灾难恢复说明  PDF版本下载:  数据中心灾难恢复手册

亲历火灾:数据中心灾难恢复启示录

作者注:该故事基于真实事件.每个细节都来自我的学生和我获得的一手事实. 凌晨三点,我的手机收到一封告警.自从我们安装了新的数据中心基础设施管理系统后,每晚我都能收到十倍以上的告警,但都不是很严重的问题.但这次不同,我们主数据中心的温度虽然都在ASHRAE的允许温度范围内--但高于公司运营限制,而且还在不断上升. 财务部门在有人确定既定标准与设计之前就决定了我们新数据中心的预算,我们不得不经常削减其中的灾难恢复策略.我曾坚持要求额外的空调以及模块化的不间断电源系统(UPS)冗余.除了这些,设计师认

数据中心管理的最佳方案

数据中心基础设施管理(DCIM)有助于规划公司的基础设施及改进数据中心的管理.但是,DCIM也可能导致IT部门与设备部门之间缺乏协调.在本文中,将了解如何帮助这两个团队积极有效的沟通.配合,通过使用不同的DCIM产品和工具成功地管理数据中心.这是获得处理数据中心管理及目前不断变化的服务器技术问题的最优方法. 使用DCIM工具数据中心管理 顾名思义,数据中心基础设施管理(DCIM)能够帮助企业.公司对数据中心进行有效管理.可当你如果询问数据中心不同部门的工作人员,"基础设施"是什么,都包

备份和恢复数据的4个最佳实践

保护和访问企业数据,对于每个或大或小的现代企业来说,都是需要优先考虑一个问题.根据调查机构的研究,2016年的数据泄露事件与2015年同期相比增长了16%.这一上升趋势一直在发展变化.随着数据泄露事件每年的上涨,保存不可替代的数据应该是企业的一个优先事项.几乎每个人都知道,有必要采取安全措施来保护敏感数据,这是必不可少的措施.然而,许多组织无法备份他们的信息,并保护那些与原来的数据相同的安全级别的数据备份.没有备份,企业将会争先恐后地恢复重要的数据,保护消费者和客户的数据,并防止数据泄露或数据丢

低烟无卤阻燃线缆,数据中心布线的最佳选择

数据中心布线有很多值得我们学习的地方,这里我们主要介绍数据中心布线中可选择的材料的一种,低烟无卤阻燃线缆.它是数据中心布线一个很好的选择.随着科技的发展,各行各业正在如火如荼地规划和建设数据中心.综合布线作为数据中心布线的基础设施引起了用户的重视.在数据中心布线进行综合布线考虑的要点除了高带宽高可靠之外,还有很重要的一点就是防火.火灾发生最初的五到十分钟内是避难的最佳时间,逃生的必要条件是确保视线清晰和延迟燃烧. 但是,目前全球大部分的线缆均含卤素,因为添加卤素可以增强外皮的阻燃性能.该类线缆在

通信行业北京移动数据中心UPS电源应用实践

项目背景: "建首强之网,创优质服务,向http://www.aliyun.com/zixun/aggregation/38599.html">世界一流通信企业迈进"是北京移动通讯有限责任公司的企业目标!作为中国移动集团公司首批规划的4个IDC中心之一,北京移动数据中心是中国移动最重要的"数据集散地"之一,是中国移动集团"数据业务及企业精品工程示范基地".经过数年的努力,一共建设了8个重要IDC核心节点,机房建设面积一共是4万平米