IDC数据中心这些隐患您是否知道

这份数据中心灾难报告由两部分构成,该报告完全基于现实经验。在报告的第一部分中(详见《亲历火灾:数据中心灾难恢复启示录》),管理人员一直工作到下午三点,研究如何预防电气火灾,最后决定在数据中心中添加一个声音报警和两个分解总线。通过这份灾难恢复报告我们可以发现故障点以及如何避免云灾难。

整整花费了一天喝半个晚上时间才在DR站点恢复了IR操作运营,而这也仅仅是针对最高级别的优先系统。有了便携式空调设备、临时通信和小型不间断供电设备,我们就可以恢复手机通讯。需要花费几个星期的时间才能替换大型交换机烧毁的部件,但是,我们还是需要了解哪里出现了故障,以便杜绝再次发生此类事故。

以下使我们所发现的六个故障点,然后我们在灾难恢复报告中做了记录。

隐患点一:空调设备

尽管我们配备了多个空调设备,但是这些设备都公用一个接线总机。只有两个冗余单元和一组不间断供电设备(简称UPS)室单元的电源是分开的,设计师认为这种思路是合乎逻辑的,但是,实际上这是否定了备用的想法。我们还未能够正确设置总断路器上的跳闸电流,工程师们和承包商还没有调整好断路器。因此,当一台空调设备遇到问题时,主断路器就会跳闸现象,而不是单个支路断路器跳闸,这样会造成80%的冷却资源浪费。红外线扫描可以在接线总机中完成,但是只有一部分空调设备能够运行。未达到满载,设备也不会温度过高,因此,在测试过程中,我们也不会发现连接松动的现象。

第二个连线总机跟第一个连线总机一样,在同一个电器柜中,这样做的目的是满足财务预算,因此,两条电源总线是彼此相邻的状态。当一个发生爆炸时,也会同样引爆第二个,然后我们就什么也没有了。

隐患点二:数据中心设计

在灾难恢复报告中,我们所要检查的另外一个项目就是数据中心设计。因为,一台发电机要供整个大楼使用,转换开关设置在地下室、接线总机的上方。并没有感知到即将发生的电源故障,但是被毁坏的接线总机却会阻止我们。共用一个发电机,我们本应该设置多个自动交换机提供数据中心内数据转换。用这种方式,如果将电源引入到数据中心中,且建筑内其他设备未受影响,那么,发电机便会开始工作,数据中心也会恢复紧急电源的使用。

我们反对电气室与数据中心相邻过近,因为,我们不希望电气涉及到计算环境中。我们曾忽视了这一点。电气室空调设备运行正常,数据中心中设备停止运行,此时,电气室会产生正压。当门打开时,爆炸所产生的热量和烟雾会随之发散。

隐患点三:烟雾探测器的问题

早期的预警烟雾探测器会立即识别危险,而且还可以控制气体灭火,虽然其设置方式并非正确。因此,发现危险源时该探测器并不是发出警报,而是根据它感应到的烟雾,触发其释放气体的功能。烟雾颗粒同样可以污染其他正常运行设备的过滤器。唯一一个好消息是,与两个备用设备一样,电气室内的空调设备都在同一个电路上,因此,可以继续运行。没有制冷设备,UPS会迅速升温,然后关闭之前的计算机房。UPS应该走旁路,维护主机电源,但是,测试中我们却发现,旁路连接出现错误。只有一台空调设备,受到损害的可能性非常大。

隐患点四:优先等级

UPS可以通过网络进行按序服务关系,但是,由于存在优先等级问题,这个想法一直也没有实现。我们还了解到,其实并不需要Emergency Power Off按钮,因此,也不会存在“高架活动地板”,不需要使用任何限制。工程师们指出了该行业一些非常危险的按钮,“因为每一个数据中心都会有一个危险按钮,”但是其中并不包含任何防护按钮,防止其被过早使用。

数据中心管理人员将会面临无数个挑战任务。我们要学会如何能够将这些实际过程中会接触到的任务进行优先等级排列。

隐患点五:DCIM报警

当我问到,数据中心基础设施管理(简称DCIM)工具会提醒我主要警告,但是唯一的局限就是ASHRAE的允许温度,这个温度限制高于数据中心的实际冷却温度。由于冷却温度的设定是建立在之前的推荐温度值的基础上,而且要比推荐温度更低,因此,在还未出发报警之前就已经宣告失败了,我们还需要花费很多时间来进行救灾抢修。

DCIM还会显示出,我们所设置的10个空调设备中有8个都宣布设置失败,同时也陈述了失败的原因和影响因素,我们没有为DCIM系统购买机械设备模块,因此,当冷却单元装置失灵时并没有发出警告提示。这一点也会被记录到灾难恢复报告中。

隐患点六:缺乏训练和标准

实际工作中,我们需要进行多次DCIM培训,GUI非常复杂,会提供许多详细的数据,使我们辨识起来非常困难。我们尝试重新对GUI进行修订,这样,我们可以看得更加清晰明了,但是,其可配置性却非常低。

IT应该包含在重要系统的选择范围内,在购买之前,进行同类测试,明确如何衡量其他软件。

我们非常清楚地知道,这并不属于III级事故,正规认证将会披露这些漏洞。公司避免了许多承包备份和DR站点所引起的麻烦,因此,开发和测试计划的失败原因在于我们自己。作为灾难恢复报告中的一部分,我们花费了许多时间、非常认真的审阅了DR站点合同,并且根据审阅过程中发现的问题提出了一些改善建议。在制定DR计划时,我们也获得了一些帮助,通过转接操作,现在我们可以一年进行两次测验工作。

本文转自d1net(转载)

时间: 2024-09-29 18:29:06

IDC数据中心这些隐患您是否知道的相关文章

如何建设IDC数据中心机房?看完你就明白了!

Internet Data Center互联网数据中心,简称IDC数据中心,它是传统的数据中心与Internet的结合,它除了具有传统的数据中心所具有的特点外,如数据集中.主机运行可靠等,还应具有访问方式的变化.要做到7x24服务.反应速度快等. IDC是一个提供资源外包服务的基地,它应具有非常好的机房环境.安全保证.网络带宽.主机的数量和主机的性能.大的存储数据空间.软件环境以及优秀的服务性能.设计集建筑.结构.电气.暖通空调.给排水.消防.网络.智能化等多个专业技术于一体,应具有"良好的安全

《运维工程师成长之路》一1.1 寻找IDC数据中心

1.1 寻找IDC数据中心 1.1.1 调研IDC准备 小鑫是一个刚刚大学毕业的学生,虽然在校期间管理过校园网,但在运维方面的经验很少,对北京的IDC情况也不是很清楚.于是迷茫的他只好上网搜索相关的IDC资料,可是搜索出来的结果却令小鑫失望,大多数都是广告性质的推广,看不出机房真实的情况.无奈小鑫只好一页一页地浏览,突然看到一个机房介绍的网址链接,打开链接发现是一本名为<高性能网站构建实战>的图书的内容简介.这本书的内容还真不少,包含一套完整的标准网站架构中所使用的应用.小鑫心想这本书正适合自

《运维工程师成长之路》——第1章 企业互联网根基之IDC的选择1.1 寻找IDC数据中心

第1章 企业互联网根基之IDC的选择 "小鑫啊,因为最近公司的业务正式上线,所以我们需要有个高质量的IDC.你去调研一下,然后这个月定下来." "好的,我去看看".小鑫回复了主管就开始IDC的调研. 1.1 寻找IDC数据中心 1.1.1 调研IDC准备 小鑫是一个刚刚大学毕业的学生,虽然在校期间管理过校园网,但在运维方面的经验很少,对北京的IDC情况也不是很清楚.于是迷茫的他只好上网搜索相关的IDC资料,可是搜索出来的结果却令小鑫失望,大多数都是广告性质的推广,看

解除数据中心安全隐患“千金良方!”

摘要:在数据中心运维的过程当中,对于运维以及管理人员最大的"杯具"莫过于突然断电.事实表明,在数据机房,突然停机导致的后果将不堪设想! 据了解,一些大型数据中心有时会因为仅仅短时的突然停机导致不可估量的巨大损失,长时间的断电更是严重影响到企业的正常运转.面对如此情况,一些数据中心管理以及技术人员,也在不断努力寻求新方法,以克服停机威胁.实践证明,对支持数据中心不间断电源-UPS蓄电池进行实施维护是减少以上风险的最佳方式之一. UPS和电池维护是实现最佳性能和电池投资回报的两大重要因素,

从预置数据中心迁移至IDC数据中心的七大关键因素

在数据中心多年的发展进程中,发展已经不可避免地来到拐点(转折点),是购买数据中心还是租赁数据中心?该如何选择呢?业界人士不得不审慎思考.分析利弊,考虑是自建数据中心,自己维护,还是将其外包. (备注:拐点(转折点),又称反曲点,在数学上指改变曲线向上或向下方向的点,直观地说拐点是使切线穿越曲线的点(即曲线的凹凸分界点).若该曲线图形的函数在拐点有二阶导数,则二阶导数在拐点处异号(由正变负或由负变正)或不存在.) 说到数据中心,要么是在自建数据中心,并维护,要么是从某IDC那里租用空间.IDC的优

山西移动IDC数据中心名列全国前茅

近日,在工信部发展司的指导下,中国数据中心产业联盟在"中国数据中心产业发展大会(第六届)"上,发布了2016年度全国优秀数据中心的评定结果.我公司武洛街数据中心凭借不断创新的运营体系.优秀的机房建设标准.完善的运维服务体系和成熟的客户解决方案,在全国96个IDC数据中心中脱颖而出,被评为全国"2015-2016年度优秀数据中心".全集团有三家公司获此殊荣. 此次评选,是我公司IDC数据中心首次迈出集团,参与由政府主导的全国范围内的IDC数据中心评比活动,也是首次与全

浅析:IDC数据中心对服务器的需求变化

据IDC预测,到2012年中国的数据中心数量将以复合年增长1.3%的速度达到54万个.其中小型数据中心将是市场主流,而中型数据中心和http://www.aliyun.com/zixun/aggregation/15530.html">大型企业级数据中心的增长速度将高于平均增长率.面对这样的增长速度,数据中心服务器的选型至关重要. IDC数据中心从功能看可分:部门级数据中心.企业级数据中心.互联网数据中心以及主机托管数据中心等.从规模看可分:面积小于200平米的是微型及小型数据中心,500

IDC数据中心基础设施优化的五大趋势

[天极网服务器频道1月115.html">26日消息]随着云计算和大数据的发展,IDC数据中心建设迎来建设高潮.不过在数据中心建设过程中存在很多问题,这里汇总一下数据中心基础设施优化的五大趋势. 软件定义和虚拟化 过去的一年中,软件定义技术成为潮流,诸如http://www.aliyun.com/zixun/aggregation/13868.html">软件定义网络.软件定义存储.软件定义数据中心等.通过建立底层硬件的抽象层API,企业可以减少硬件的管理数量和提高管理效率

全面了解IDC数据中心

数据中心(Internet Data Center,简称IDC)机房设计集建筑.结构.电气.暖通空调.给排水.消防.网络.智能化等多个专业技术于一体.IDC机房应具有"良好的安全性能,可靠而且不能间断"的特点. 数据中心的等级分为A级.B级和C级: A级为容错型 B级为冗余型 C级为基本型 一般情况下: 基本上银行系统的机房多按A级标准做; 政府部门及企业根据客户要求按照B级来设计; 事业单位及教育部门可根据C级设计. 机房其功能间比较详细划分的话,大概的功能间划分为:设备区域和辅助区