真实案例:数据中心能效治理经验分享

  2005年,太平洋国家实验室(Pacific Northwest National Laboratory,简称PHHL)的数据中心已经到了最危急的时刻。

  意外停电几乎每周就发生一次,每次都害得数据中心停电几小时。那时组织不断地买机架服务器,结果数量越来越多。因为计算资源数量暴增,机架服务器在那时比较便宜——按数据中心服务经理Ralph Wescott的话说是这样。结果到了2005年,机房的容量已经达到临界点了。

  Wescott说:“组织买了服务器,就直接丢给我安装,但是机房已经没有空间了,电力和冷却的容量也不够用。如果再装一台服务器,恐怕机房得瘫痪。”

  Wescott和PNNL开始着手进行一项计划:在不打破预算的前提下,好好翻新一下数据中心。以后三年的每个季度,数据中心小组会花上一个周末,把机房关掉,淘汰掉一批旧的服务器,扔掉地板下交缠的网线,然后换成更高效更强大的服务器,这些服务器都是用天花板上更加简洁的布线方式连接。这样的新配置释放了地板下的空间,以便进行更高效的制冷。

  结果怎样?PNNL以前在500个服务器上运行500个应用,现在150个服务器就能带起800个应用。

  分析公司IDC的程序主管Joseph Pucciarelli说,在经济紧张的士气,对付这样的IT计划需要勒紧钱包。“这种情况很常见,公司只会给你刚刚够用的资金,他们只想着问题能差不多解决就行。”

  在这次PNNL从危机中脱险的事件中,我们学到了五点:

  1、积极计划,不要消极应对。Wescott首先需要解决的问题是纠正数据中心小组的习惯,因为他们总是在各个小问题发生了之后才一个个做出反应,而不是观察系统的问题,然后做计划,构建一个耐用的设备系统。除了500个服务器,他们的数据中心还有33000条线缆来给这些服务器通电、连网,或者连接安全系统。

  他说:“由我们决定数据中心的形态和容量该是怎么样。”

  小组推断出,当前的轨道结构导致了3000个应用程序分别运行在各自服务器上,这种情况持续了十年。如今该数据中心81%的应用都虚拟化了(还有17%的">服务器虚拟化),Wescott计划向90%的应用程序虚拟化迈进。

  Joseph Pucciarelli认为,公司若想增加容量,应当关注三个地方:减少物理服务器的数量;在虚拟系统运行应用来减少电力要求;使用更高效的制冷系统并改善配电。

  “这是一个典型的三部曲,这样就能升级数据中心。”

  Pucciarelli见过很多公司把大约50个服务器换成2到3个更大容量的系统,并且使用虚拟化来运行应用。

  2、通过测量能耗来管理。Wescott建议管理者们需要想办法监控数据中心的状态,但是通常他们没有正确的工具。在作出计划改变之前,PNNL没有测量数据中心能效的方法,等到停电了之后,才发现这些能源问题。

  “如果电源中的安培数太多了,那我只能靠触摸来感觉断路开关,如果热的话就有问题。所以还是得有监控工具。”

  现在PNNL在每四个机柜的低、中、高处放上传感器,来创建一个3D的机房热量图。这样Wescott就能根据数据改变制冷方针,提升总体温度,对需要制冷的地方供冷。

  “这下就能省下很多钱了,我的空调也会减少耗损。”Wescott说道,他还补充说,现在制冷方面能效估计比以前提升40%。

  3、一小步一小步地进行。Wescott认为,首要的问题是从根本上重新配置数据中心,同时又不打断正常运行。公司的经理建议小步进行,减少停电的可能,但是同时又把问题抛给了手下。

  “我给了管理层两种提议,”他说:“一种是我们把关掉数据中心,整顿七天,然后从头开始;另一种就是每个季度的某个周末,我们都停电整修一次。”

  最后他们选了第二种提议,他们小组打算先替换一排服务器。在第一个周末三天的时间内,一个30人的团队花了14个小时,把数据中心里面的一排服务器机架都替换完了,并测试了新的配置。Wescott发现数据中心的可靠性和稳定性马上提升了。

  如果管理层不同意这样做,放弃了计划暂停这样的正确方法,恐怕就会带来突发的故障事件。Wescott打比方说:“你不能在船航行的时候修理底部,但如果不修的话船就要沉。”

  所以答案显而易见。

  4、为了长远利益,做好暂时损失的准备。管理层不能因为一时的花费而放弃长远的利益。

  Wescott的小组为了减少制冷系统的能源要求,于是估计了waterside economizer(利用水和外面的温度来冷却服务器的机架的仪器)。他们发现使用环绕制冷系统在长久上看要更加省电,而waterside economizer的制冷花费要比预算多10%。Wescott只好和供应商沟通,把花费减少到预算以内。

  5、找到你不知道的地方。在翻新数据中心的过程中,管理员需要知道哪些地方能源没有消耗或者很少。其中常见的问题是数据中心里存在“流氓服务器”和“幽灵服务器”。

  所谓幽灵服务器,就是配置好了但是一直没使用的服务器。他们仍然吃能源,却不为数据中心工作。而流氓服务器则是一些人私下放在自己办公室里的服务器,绕开了数据中心人员的约束。

  Wescott说,这样的服务器会浪费能源预算。

  “本来得在晚上关掉的空调,却被流氓服务器利用而彻夜开着。”

  经过整顿,数据中心的能效有了较大进步。自从Wescott开始翻新设备之后,在数据中心只发生过一次意外断电,那是因为天气极热,冷却系统故障。Wescott知道,他的任务还将继续。

(作者:来源:TT博客责任编辑:许京杨)

时间: 2024-10-26 04:14:26

真实案例:数据中心能效治理经验分享的相关文章

零距离:施耐德谢卫刚谈数据中心能效管理

2011年1月10日,第六届中国IDC产业年度大典在京举行,施耐德电气IT事业部大中华区战略市场总监谢卫刚代表全球能效管理专家施耐德电气在会上作了有关云计算数据中心规划的想法和思路方面的精彩演讲,并在会后接受天极网服务器频道记者的专访,解析数据中心概念.分析施耐德提升数据中心能效的策略.云数据中心规划和未来数据中心的发展趋势,等等.服务器频道为网友献上本期<零距离>,施耐德电气谢卫刚总监为网友解读数据中心能效管理专场.                            [施耐德电气IT事业

数据中心能效标准正式发布

9月20日,国家标准<数据中心 资源利用 第3部分:电能能效要求和测量方法>正式发布.标准号为GB/T 32910.3-2016.该标准是在国家标准化管理委员会和工业和信息化部的共同指导下,由全国信标委信息技术与可持续发展分技术委员会具体归口管理,由中国电子技术标准化研究院牵头,在国家机关事务管理局.国家能源局.清华大学.武汉大学.国家发改委能源研究所.国家电网信息通信分公司.中国移动.浪潮.华为.科计通等几十家单位和部门历时3年的编制验证最终制定完成. 该标准对电能使用效率(EEUE)的测量

天地云箱鼎助《数据中心能效评测指南》发布

中云网独家报道 3月16日,"云计算发展与政策论坛"第二次高端会议暨成果发布会在北京举行,会上,在工业和信息化部.国家发改委等部门的指导下,天地云箱联合国内三大运营商,以及阿里巴巴.百度.华为.盛大.中金数据等企业共同发布了<数据中心能效评测指南>.北京云基地副董事长滕拉强.天地云箱COO符全出席了本次发布会. 论坛现场 发布会现场合影 当前我国各类数据中心总量约43万个,可容纳服务嚣共约500万台,其中经营数据中心机房9211,面积约88万平米,机柜数月17.7万个,可容

美拟研究提高数据中心能效

美国能源部高级研究项目局(ARPA-E)日前宣布,将投资2500万美元,通过创新来提高数据中心的能源效率.其设立的"提高数据中心能效光波集成技术网络(ENLITENED)"项目计划通过数据通信网络设计和通信方法的创新,来降低数据中心的能耗,使其能源效率翻倍. 互联网的爆炸式增长导致信息通信技术部门能耗急剧增加.最新一份报告显示,美国数据中心所耗电能超过纽约市全部居民用电量的两倍,而这一数字在8年后可能还会翻倍.提高数据中心能效有许多方法,但目前数据中心设备间传输信息所使用的金属连接线大

五种简单易行的改善数据中心能效方法

本文将为大家简单介绍五种简单易行的改善数据中心能效方法的相关内容,以下是文章的详细内容,有兴趣的读者不妨看看此篇文章,希望能为各位读者带来些许的收获. 有时,http://www.aliyun.com/zixun/aggregation/7432.html">解决问题最简单的办法也是最容易让人忽视的办法,而且成本也不是很高.以下就是5个简单易行而且成本低廉的改善数据中心能效和降低能耗的方法. 达拉斯数据中心设计公司Digital Realty Trust的工程副总裁Jim Smith说:&

数据中心能效的重要要素丨潜热与显热

谈起数据中心的PUE值,一直是很多数据中心管理者很关心的话题,大家都知道数据中心是高耗能的产业,管理好能效就相当于控制了数据中心的支出成本,但如何才能有效的控制数据中心的能耗呢? 说起影响数据中心能耗的主要因素,那肯定是热量,数据中心有大量的IT设备在运行,其中会散发出大量的热,这些热量就需要同等的携带着同等冷量的介质相互抵消.所以首先我们先了解什么是热?热有哪几种? 物体在加热或冷却过程中,温度升高或降低而不改变其原有相态所需吸收或放出的热量,称为"显热".它能使人们有明显的冷热变化

CenturyLink公司致力于实现数据中心能效目标

CenturyLink公司自愿加入美国能源部的一个计划.该计划旨在促进建筑更有效地使用能源的投资,并致力于提高其整个美国的数据中心产品组合25%的能效. 总部位于路易斯安那州门罗的CenturyLink公司通过其庞大的数据中心的投资组合来提高效率,以改善去年以来的效率,尽管该公司也可能出售其部分或全部数据中心.CenturyLink公司管理层一直在评估替代其数据中心品的可能性. CenturyLink公司全球数据中心的能源效率主管比尔·加斯特表示,未来投资组合的所有权的不确定性并没有影响该公司从

数据中心能效管理最常见的五个要点

全球大约有475万台正在运行,管理和升级的服务器日常的使用率不高.这些处在闲置状态的服务器需要耗费207亿美元维持运营,额外还要再花费37亿美元用于能源支出.也就是说每年花费在闲置服务器硬件日常维护,管理,能耗和制冷方面的费用大约为214亿美元.这笔费用大致等同于阿波罗登月计划的支出. 有效管理能源能为数据中心节约40%甚至更多的能源支出.想象一下一座数据中心每平方英尺所消耗的能源是办公建筑平均能耗的10倍到100倍,在某些情况下最高能耗甚至占到企业温室气体排放量的40%,就很清楚管理数据中心的

气流遏制系统对数据中心能效和温度的影响

较高的能源成本和激增的数据中心能耗已迫使数据中心专家开始重新思考其数据中心制冷的策略.如EYP Mission Critical公司的Bruce Myatt所言,"冷热气流的隔离是当今新建和改建数据中心可以采用的最具前景的节能增效措施之一".除了能效方面的优势外,气流遏制系统可以使众多IT设备进风口温度保持一致,从而消除在未采用气流遏制系统的传统数据中心架构中经常出现的局部热点. 一.气流遏制系统介绍 我们首先了解一下常用的冷热通道气流遏制系统.值得注意的是部署通道气流遏制系统首先要求