掉电是数据中心无法抹去的痛

电源对于数据中心的重要性就好比心脏对人类的重要程度,没有电源的持续供电数据中心就无法运转。当数据中心的设备出现自动断电、关机、电源故障等相关不良现象时,统称为掉电故障。掉电给数据中心带来的损失将非常严重,数据中心可能直接会停止运转,所有的应用系统都无法继续运行。比如2016年6月大连电信枢纽机房因市电故障,设备突然闪断,并造成部分线路短路,变压器受损引起跳闸,导致核心设备出现故障。掉电造成大连市区、旅顺地区移动网用户手机通话、短信等功能无法正常使用;2015年11月山西证券就因为数据中心机房掉电,股市行情交易系统中断,导致很多股民无法进行交易,损失严重;2012年10月恰逢凡客诚品五周年纪念日,机房掉电导致凡客诚品出现访问故障,网站长时间没有交易,损失不少收入;2011年11月天津塘沽的一个运营商核心机房掉电,导致遨游、豌豆荚、新浪邮箱等多个服务中断,等等。这类数据中心掉电导致业务中断的案例数不胜数,还有很多,在此不一一列举。没有人希望数据中心掉电,掉电已经成为了数据中心的心腹大患,因为不知道掉电会什么时候发生,会在哪些设备发生,掉电发生前没有任何先兆,这让数据中心对于掉电问题素手无策。掉电已经成为数据中心无法抹去的痛,面对掉电问题,很多时候都素手无策。

掉电不仅导致正在运行的业务有损失,还会带来其它很多方面的负面影响。首先掉电对电子设备有很大危害,当正在运行着的设备,突然输入没有供电了,设备里的所有电容器件都要进行放电。如果是彻底断电还好,如果是频繁上下电,或者供电质量不好有波动,这类情况最容易造成设备内部具有电容属性的器件故障,减少设备的使用寿命;其次掉电对于电子设备内部使用的内存类存储器件有影响,内存器件正在读写过程中,突然掉电,内存颗粒反复上下电,质量不好的内存条容易出现损坏,进而导致在来电时,设备初始化过不了而无法正常启动,设备出现故障;第三掉电容易造成应用软件系统出现运行异常。比如:掉电对LINUX系统服务器的危害。LINUX文件系统包含各种有日志功能的EXT3、REISERFS、JFS等,这些日志文件系统,都敌不过掉电的打击。常用的EXT3和REISERFS文件系统,当遭遇到突然掉电,系统再次开机时,时常发生无法自举故障,需手动FSCK才行。

还有对ORACLE数据库也有损害,掉电会导致ORACLE部分控制文件坏、REDOLOG坏、Rollback Segment坏、数据文件坏等,当重新供电时,ORACLE数据库无法正常启动,运行异常。造成这些应用系统异常的根本原因是在发生掉电时,这些应用软件的数据没有及时备份起来,如果在掉电发生后,设备能延迟工作几分钟,将重要的数据保留完整,就不至于发生这类的故障。第四断电仅仅是掉电故障的一个原因,很多时候并不是因为没有供电而导致的掉电,掉电的含义要宽广得多。比如设备故障引起供电线路的短路,产生了超大的电流,击穿了保险盒开关,导致这路供电设备均掉电;供电电源遇到了过压、过温等保护,电源自动进入保护而不再工作,这样也会导致设备掉电;有时设备上某些重要电压没有产生而造成欠压保护引起的掉电,通常表现为上电即断,无法用万用表测量相关电压。总之,掉电给数据中心及其设备造成的影响是多方面的,要适当做一些防护措施避免数据中心频繁发生掉电故障。

很多时候,数据中心发生掉电故障多为人为操作导致的。有时在进行电力施工时,误将供电电缆搞断了,引起了掉电。有时在进行设备供电线路调整时,不小心接错导致断路或短路,从而引起部分设备掉电,这类人为掉电故障屡见不鲜,教训深刻。所以,数据中心首要任务就是要将人管理起来,制定严格和详细的操作规范,避免出现低级的人为掉电故障;数据中心还要有冗余供电,根据自己的财力情况,在不同级别的设备供电上做冗余供电,因为只采用一路市电给数据中心所有设备供电,万一市电故障,整个数据中心就会停转。

所以最好引入两路不同的市电,并且对核心设备要有UPS、蓄电池或者备份电源,这样当市电真的故障时,采用备份电源也可以保证数据中心继续运行数个小时,等市电恢复供电,再将设备供电输入切到市电上,要周期性检查这些备份供电系统的剩余容量,平时备份电源是待命状态,而要使用的时候,供电容量一定要确保,不能在关键时刻掉链子;要周期性对数据中心的供电安全进行评估,全面核查供电中的安全可靠性,及时发现日常维护中所不能发现的问题。同时制定供电应急预案,明确发生掉电故障时的处理流程、操作人员、操作步骤与厂商支撑等方面要求,在实际应对掉电事件时,就能做到“手中有粮,心中不慌”。要保持数据中心内部良好的温湿度环境,避免电子设备产生静电、腐蚀、过压、过流等故障,这些都可能引发设备掉电故障。虽然我们无法预知掉电故障何时会出现,但我们可以提前做一些防护工作,避免掉电出现,万一发生了掉电,也有完整的应急预案,确保数据中心业务不受掉电影响。

掉电是数据中心无法抹去的痛,曾给数据中心带来很多次惨痛的教训。经过以上的说明,可以看到掉电故障虽可怕,但通过制定一些防护方案是可以大为减少掉电发生频率的。即使发生了,也有通过提前部署好的冗余供电系统来避免给数据中心业务造成损害。

本文作者:harbor

来源:51CTO

时间: 2024-08-31 09:25:47

掉电是数据中心无法抹去的痛的相关文章

永不掉电的数据中心 减轻电源路径问题

电源对数据中心的重要性就好比心脏对人类的重要程度,虽然数据中心设计时可以选择不同的级别和冗余水平,但从来没有人希望数据中心掉电.不管是只有单一UPS的小型数据中心,还是具有完全冗余能力的大型数据中心,停电是不可避免的.下面是一些可以减轻电源路径问题的办法. 电源路径:成本vs可接受的风险 数据中心设计通常是由成本和可接受的风险因素推动的,Uptime协会的1-4层要求无需再做解释,它也远远超出了电源话题,但最基本的电源路径是简单的N设计(或1级),即没有冗余,电源路径中的每个组件都是一个单点故障

外语不好已经是许多人心中永远无法抹去的痛

外语不好已经是许多人心中永远无法抹去的痛.读不懂的英文书.听不懂的日语.看不懂的韩剧.别说到国外旅游.就是想窜到外文网站去买几个超值的电子商品也没有勇气.翻译,特别是如同声传译般的实时翻译成了许多高喊"不学A BC"的中国人的心里底气. 另一方面,翻译,却是一个"苦逼"的行业,整天埋头苦翻,眼花缭乱还错误一堆."小作坊"式的企业,除了几台电脑基本牛津字典,再也没有值钱的家当.翻译市场还停留在杂乱无序.同质化竞争的状况,行业资源分散,孤岛现象严重.

嵌入式-at24c里面的东西掉电数据不丢失主要是写保护起作用吗

问题描述 at24c里面的东西掉电数据不丢失主要是写保护起作用吗 我只是网65533地址写入一个u16的数据,掉电重启数据怎么没了呢 解决方案 at24c是EEPROM,如果你不对它重新编程,数据不会丢失. 看看你对它的写入本身有没有问题. 解决方案二: 不是写保护,写的时候直接就存储进去了,就跟你电脑里的磁盘一样,掉电丢失可能是你没有写进去 解决方案三: At24C04 解决方案四: for(i = 218;i <223;i++) //想存储器中写入256个数据 { IIC_write_dat

走在数据中心能源危机前面:推荐MAID技术

能源效率最近受到了极大的关注.一些人认为这是一件很好的"绿色"事情.有些人明白这能获得很大的金融好处.但是,对于存储和网络行业的人们来说,这是一件更紧迫的事情.我们正处在能源危机的边缘.这个危机将从根本上影响我们专业人员的生活. 考虑一下这些问题: ·据美国环保局最近的报告称,数据中心每年的能源消费量占整个美国能源消费量的1.5%以上. ·IDC报告称,数据中心每年的电费超过了33亿美元. ·数据中心的冷却成本现在已经超过了租赁数据中心场地的成本.例如,一个10万平方英尺的数据中心每年

高环境温度数据中心成为未来发展趋势

12月中旬,国际研究小组在英国的一份专业杂志上发布了有关碳排放的最新研究结果:尽管因为受到经济活动减缓的影响,2008年到2009年的二氧化碳排放量比往年有所降低,但到了2010年后又开始了大幅度回升,已达到5.9%的历史最高涨幅.据了解,2010年大气中的二氧化碳含量已经到达了80万年来的最高值--而这之中,数据中心的碳排放量所占的比例已经不容忽视.调查结果显示,数据中心能耗已经占到了全球一年能耗的2%.而由于云计算的迅速热门,全球各地的数据中心也开始如火如荼地建设起来,那么关于如何降低数据中

如何给数据中心供配电

数据中心里的所有设备都需要电来驱动,数据中心正常运转离不开电,电对于数据中心极其重要.电是从哪里来呢?有的数据中心可能自己有发电厂,也有的数据中心依靠市电,有的数据中心可能自己利用自然能发电.总之,不管采用哪种方式,获得供电才能让数据中心运转起来.电有了,怎么使用又是一个大问题,数据中心里多则上万台设备,一起运转起来耗电量是非常大的,自然不是简单地接上插座就可以用了,数据中心内部要设计一套完善的配电系统,外来的电接入配电系统,经过配电系统转换分配到数据中心各个用电设备上,配电系统就是数据中心里的

以高效节能为使命 绿色数据中心势在必行

随着云计算的发展,数据中心的建设呈现向大型化发展的趋势,数据中心的数量也在迅猛增加,仅在我国数据中心的总量就已经超过了40万个.而数据中心的电力消耗相当惊人,比如对一个建设规模为2000个机架的数据中心来说,按照每个机架功率平均3kW计算,加上数据中心的空调.新风.照明.其他电力能耗,对一个PUE为2的数据中心而言,电费为1.05亿元. PUE(Power Usage Effectiveness,电能利用效率)是国内外数据中心普遍接受和采用的一种衡量数据中心基础设施能效的综合指标,国外先进的数据

数据中心供电方式详解

电对于数据中心设备来讲,就像汽油对汽车一样,汽车没有油就无法开动,数据中心没有电就无法运转,所以电对于数据中心设备来说是最重要的.学过电工基础的都知道,电主要分为交流电.直流电以及高压直流电.交流供电是电网供电最普遍的方式,但是这种供电方式却不是高效的.由于交流电在每个时刻它的相位和大小都在变化,这样交流电就可以实现变压,而直流是不能变压的,交流电在传输时可以升压,使得在传输中损耗减小.通过变压又可能有多种电压的输出,比如:24V.48V.220V等,供各种设备使用,这样就使得交流电成为电网中最

延长数据中心设备使用年限?这些策略来助攻

当你的数据中心面临空间.供能或散热不足的问题--或三者都存在问题时--你有麻烦的事需要考虑了.当你的业务在未来若干年还有很大可能要继续扩展,或当你的公司已经开始讨论最终将一些计算需求转移到云或托管网站时,数据中心的升级问题将变得更具挑战.这些升级的决策都是至关重要,没有一个是可以仓促对待的.总的来说,公司在这方面做出的选择都将是昂贵的--无论是以经费支出还是运维效能衡量都是如此. 但是,一方面公司要规划其长远的数据中心策略,另一方面IT部分仍然要面对短期的任务:保持数据中心运行,切实可靠的满足用