防止数据中心停机需要采取什么措施

日前,据调研机构对于数据中心的运营调查报告中表示,某些数据中心宕机事件本不应该发生。而其宕机的主要原因并不是由于恶劣天气、计划外维护、甚至电网故障等因素导致,相反,这是一些组织糟糕的计划和维护不当造成的。从航空公司到互联网巨头,这些主要的用户和企业都已经成为了停机中断事件的受害者,并且也深刻感受到这些可以预防的数据中心中断事件的影响。然而不幸的是,这种情况并不少见。

数据中心行业厂商通过对欧洲各国IT和数据中心管理人员的调查表明:27%的受访者表示在过去的三个月遭遇过长时间的中断,对组织业务产生了不利的影响。绝大多数受访者(82%)认为大多数关键业务流程依赖于IT服务,74%的受访者表示数据中心的健康状况直接影响到IT服务的质量。组织业务主要取决于IT服务和IT设备依赖于数据中心的功能。事实上,四分之一以上的数据中心遭受长时间的中断事件表明在行业层面上有些方法措施是错误的。

(1) 事先规划防止电力供应中断

正如关键业务流程依赖IT服务一样,数据中心本身也必须提供弹性以保持业务运行。它是任何企业风险管理战略中的核心资产。

工作人员的失误,备用发电机没有启动,惊慌失措的决定等这些错误都可以通过正确的流程和完善的电力系统设计来防止。然而,组织往往并没有遵循数据中心电力管理的黄金法则:行动获得结果和产生后果需要采取行动。

组织需要灾难恢复流程,并明确规定在重新启动数据中心时应采取哪些步骤。在数据中心停机中断的情况下,工作人员可能处于忙碌紧张状态,并面临恢复正常服务的压力。毕竟,工作人员的主要目标是尽可能快地恢复正常运营。因此,灾难恢复流程有助于避免延长停电时间。

(2) 提高工作人员的技能

实际上,数据中心缺乏电源管理意识和理解是一个常见的问题。参与调查的数据中心专业人员中有三分之二的人表明对电力保障没有充分的信心。而在组织在能够掌握电源管理(从UPS维护到电池检查)之前,可能会有更多的与电源相关的停电事件发生。

但是,工作人员的技能对于提高电源可用性有着至关重要的作用。许多组织发现,无论是在能源效率设计、持续管理消费,或快速有效地处理与电力有关的故障,以避免和减轻停电方面,都很难招募和保留相关的专业人员或人才。

(3) 更新升级基础设施

除了提高技能和保障电力之外,数据中心基础设施本身经常需要更新升级,以满足企业对其效率,可靠性和灵活性的期望。在这个调查中,大约一半受访者表示,他们的核心IT基础架构需要加强,而近三分之二的受访者表示需要加强电力和冷却等方面的设施。

电源管理越来越成为一种软件定义的活动。鉴于工作人员的技能方面的差距,软件可以通过IT人员熟悉的仪表板来提供电源管理选项,以弥合IT部门和电源之间的鸿沟,从而更轻松地进行管理,并实现电力基础设施管理的自动化。采用这种技术可以减少或消除数据中心的停机时间。

行业厂商已经向数据中心的虚拟化环境方向发展。IT和数据中心的专业人员如今已经非常熟悉使用虚拟化技术来维护硬件。那么为什么不使用同样的原则呢?所有的配电设计和相关的弹性软件工具必须与主要虚拟化供应商的产品相兼容,促进基础设施的未来发展。这种方法将使数据中心专业人员可以持续地维护系统,从而减少基础设施陈旧过时的风险。

更好的准备和灾难恢复过程可能会阻止许多中断事件的发生。数据中心行业用户必须从这些事件中吸取教训,并采取必要的措施。因此,为了减少数据中心的中断事件,有效实施电源管理是一个必备措施。

原文发布时间为:2017-11-06

本文作者:苏楠

时间: 2024-10-31 15:24:11

防止数据中心停机需要采取什么措施的相关文章

避免数据中心停机:运用适当的电源设计和调试

数据中心的中断问题持续困扰着IT人员.执行数据中心调试或审计,拥有坚实的电源设计,以保护您的组织免受宕机影响. 在其他众多知名公司之上的美联航.达美航空和西南航空公司-最近遭受了主数据中心的中断.而他们的过于公开的关机处理又给IT管理人员的问题清单上增加了另一项烦恼. 据报道,许多这些数据中心的事故是由于电力故障引起的,这并没有很出乎意料.根据Uptime Institute的研究,发动机发电机系统是数据中心主要的电力来源,应采用公用事业电力作为经济的选择.然而,公用事业电力中断"并不被认为是一

低碳数据中心的能源效率优化措施

今天,数据中心管理人员需要密切关注能源成本.根据行业数据中心调查,97%的受访者表示,非常重要的是减少能源使用,87%的人说的主要目标是降低成本.研究还发现,高达70%的数据中心能源使用的是空气冷却处理,因此提高了散热效率,降低成本是至关重要的.因此我 "建议"几个经验得出的降低能耗提高冷却效率的措施. "你会惊奇地发现,几个简单的步骤,你可以节省和降低能耗." "在这里,我们提供以下建议给决策者们达到低碳数据中心的优化措施:将所有现有的数据中心IT设备效

数据中心停机中断真的是无法回避的现实吗?

最近几个星期以来,我们已经陆续听到了不少关于数据中心中断事故影响到一些具有较高知名度的美国企业的报道,包括华尔街日报.纽约证券交易所和美国联合航空公司在一周内均受到不同程度的影响.尽管想要百分百的防止每一次停机中断事件的发生是不可能的,但这些被媒体高度宣传的问题可能会花费大量的资金成本,并会显著影响到客户如何看待一家企业,进而影响到企业形象和声誉.为此,我们特地采访了业界的专家们,向他们咨询了一系列的问题:包括企业应该做些什么工作,以便能够维持高水平的正常运行时间?导致停机中断的原因都包括了哪些

高效数据中心的六大绿色节能措施

和一两年前相比,很多数据中心的运营者们如今也并未热衷于"绿色"这个词.这当然不是说他们已经抛弃了旨在提升能源效率,更好地利用IT资源的各种项目,因为这些项目既可以削减运营成本,又能减少对环境的影响. 市场咨询公司451集团在考察了被大批组织和机构所接受的可降低数据中心运营成本的六种绿色实践之后,发布了一份内容全面的报告:<高效节能的数据中心实践>.其中的一些实践做法,如进行数据中心的全面规划,寻找可替代传统制冷系统的方案等可能早已被大家所熟知;其他做法,如采用直流供电和预制

避免数据中心的停机 节省真金白银!

随着大量数据应用和业务量的激增,对大多数企业来说数据中心安全运行至关重要.然而,大多数企业低估了维护数据中心安全运行的重要性.据统计,数据中心的停机一分钟平均损失将超过8800美元. 那么,数据中心停机的原因是什么?又该如何避免这么此类事件发生呢? 以下是数据中心停机的一些最主要的原因: UPS系统故障.如果企业投资建设数据中心,就必然要构建可靠的UPS供电系统,虽然其名为"不间断",但并不能保证百分之百的可靠性,无论采用什么类型的UPS,仍然有可能发生短时间(10秒以内)或长时间(超

小型数据中心规划和设计原则

一.小型数据中心的定义 数据中心(Data Center)是大范围协作的特定设备网络,用来在Internet网络基础设施上加速信息的传递.又可以细分为企业级数据中心.其他数据中心等. 企业数据中心(Enterprise Data Center, EDC)通过实现统一的数据定义与命名规范.集中的数据环境,从而达到数据共享与利用的目标.企业数据中心按规模划分为部门级数据中心.企业级数据中心.互联网数据中心以及主机托管数据中心等.其中互联网数据中心(Internet Data Center, IDC)

全方位解剖数据中心设施规划和IT运营清单

在数据中心供应商和设施类型方面作出正确选择,才不会在今后因为服务能力不足和各种错误付出高昂的学费. 无论你是希望将你的数据中心外包,迁移到新的设施,还是计划进行升级,你都应该在计划付诸行动之前用心进行反复的审查. 这里提供了一份独立于供应商的数据中心审查清单,让你可以在签约之前对候选的主机或托管供应商进行公证的评估--如果你的业务依赖于这些供应商的服务器.存储.网络等设施,你就更应该看看这份清单.这份清单也可以作为标准模板,用于评估你现在的运维状况,以及用作内部数据中心的新设计参考. 在你对设施

《思科绿色数据中心建设与管理》——1.2 绿色化的原因

1.2 绿色化的原因 思科绿色数据中心建设与管理一家关注环境且通过实际行动证明其关注环境的公司会拥有值得尊敬的社会意识.然而,在竞争激烈的市场中,许多只是希望"做对自己有好处的事"的商业组织是无法实践绿色方法的.实现绿色必须评估它对公司的影响,特别是对公司关键方面的影响. 实现绿色数据中心要求进行更细致的审查,因为这些设施在业务正常运营方面起到了至关重要的作用.考虑一个绿色数据中心时的相关因素包括以下几个. 功能和可用性之间的平衡:绿色数据中心的容量(如电源.冷却和连接性)比起其他服务

如何降低数据中心宕机事件的影响

大多数人在生活或工作领域中都不希望出现连接中断的情况,尤其是在以数字生活方式为主的今天,所以数据中心基础设施变得越来越重要.对于许多消费者来说,他们希望自己的数字产品和服务能保持正常工作,所以当发生宕机事件时,他们就会开始抱怨甚至投诉. 以最近的航空数据中心宕机事件为例,如美国达美航空.西南航空和英国航空公司,由于一个简单的电气故障或不当的维修程序,导致服务器遭到灾难性损坏,航空公司损失数亿美元,数以万计的乘客被滞留在全球各地的机场. 这些大规模的宕机事件总能成为新闻头条,而且数据中心宕机事件比