管理超大规模数据中心的五个实用经验

数据中心扩大规模时,大多数IT团队会寻求这样一种管理控制台:能够提供一种直观、全面的视图,从而简化日常的管理任务。IT团队在管理超大规模的数据中心时,还学会了寻找这样一种控制台:可以调用如今的数据中心平台带来的细粒度数据。这包括每一个服务器、机架或整屋子计算设备的实时用电情况和温度。

第一个经验:别忽视了“小”数据。

整合能源管理中间件的管理控制台可以把这些数据中心的数据点聚合到一览无遗的热相图和电力图,并将用于趋势分析和容量规划的所有数据记入日志。之后可以充分利用这些数据,用于各种削减成本的实践。比如说,数据中心的团队可以根据实际的耗电情况,更高效地配置机架。要是不了解实时模式,数据中心团队就只好依赖电源额定功率和静态的实验室测试。

一种示例性的使用场合表明了实时监控与静态计算之间的重大区别。配置4000瓦电量的机架时,传统的计算方法导致数据中心团队为每个机架安装大约10台服务器。(在这个例子中,服务器电源额定功率为650瓦,实验室测试表明400瓦对预期的配置而言是个稳妥的数值。)

同样这个团队对耗电量执行实时监控后发现,服务器的用电量很少超过250瓦。了解这个情况后,团队将为机架配置的服务器数量增加到16台,计算容量增加了 60%。万一任何某一个机架中的服务器带来的需求让总耗电量超过机架阈值,以免造成破坏,数据中心团队同时为每个机架采取了保护性的电量封顶,这会在下面的第五个经验中作更详细的解释。

第二个经验:消除幽灵服务器。

一旦数据中心团队有能力监控实时耗电情况,评估工作负载在整个数据中心的分配状况就成了一项简单的工作。很容易发现通常未得到充分利用的服务器和机架。经过一段时间后,数据中心管理人员就能确定可以合并或精简哪些服务器。幽灵服务器是上了电但处于闲置状态的系统,可以让它们处于节省电力的睡眠模式。可以采取诸如此类的节能措施,避免能源浪费,因而可以缩短用电预算。实际情况表明,如果处理好幽灵服务器,无论规模大小,普通的数据中心可以将预算缩减15%到20%。

第三个经验:选择软件而不是硬件。

超大规模运营常常横跨分布在不同地区的多个数据中心,这样一来远程管理显得至关重要,以确保服务的日常连续性。当前的全球经济气候让许多企业和机构面临同样的情形,IT部门在设法高效地管理多个站点,又不必将人手增加一倍,或将时间浪费在奔波于多个地方。

远程键盘、视频和鼠标(KVM)技术在过去几十年有了长足发展,可帮助IT部门与时俱进,但硬件KVM解决方案因而变得日益复杂起来。为了避免管理管理覆盖系统(management overlay)本身,许多世界上最庞大、最复杂的基础设施的操作人员在采用软件KVM解决方案,最近还在采用虚拟化的KVM解决方案。

即便对普通的数据中心而言,节省的成本也会迅速积少成多。IT团队应该把任何现有的KVM切换器和适配器的成本以及相关的许可费(切换器软件、带内许可证和带外许可证等)加起来。一套典型的硬件KVM切换解决方案其成本通常如下:切换器超过50万美元,切换器软件要12.5万美元,带内和带外节点许可证另外要50万美元。连适配器也有可能超过25万美元。另外,软件KVM解决方案可以避免100多万美元的硬件KVM成本。

第四个经验:适当调高温度。

世界上一些规模最大的数据中心在监控和管理能源及热量模式方面有着多年的丰富经验,它们率先采用了提高环境温度的运营模式。发布的数字表明,将数据中心的环境温度调高1°C,就可以让数据中心电费减少2%。

适当调高数据中心的环境温度后,经常检查局部热点,并实时监控数据中心设备,这一步很重要。一旦有效的监控实时到位,就可以逐步调整工作温度,并且对照预算和容量规划来评估节省了多少成本。

第五个经验:别让你的机架温度过高。

由于企业期望以及要求IT部门识别和避免原本会干扰关键业务运营的故障,已在超大规模数据中心证实切实可行的任何主动管理方法都应该予以评估,看看有没有可能适用于规模较小的数据中心。过高的工作温度会给硬件带来毁灭性后果,所以要密切关注这会给设备正常运行时间和生命周期带来怎样的影响,这点很要紧。

Hadoop 等许多HPC集群添置了冗余和动态负载均衡机制,以便遇到故障后可以顺畅恢复。有助于尽量降低超大规模能源需求的同一套基本的监控、警报和自动化控制机制也能帮助规模较小的数据中心识别和消除局部热点;而从长远来看,局部热点会给设备的健康状况带来不利影响。电源和温度方面采取统一的做法还有助于在数据中心保持更一致的环境,这最终可以避免损坏设备的温度突增和电力尖峰。

除了环境控制外,IT团队还可以充分利用最前沿的能源管理解决方案,它们提供了电力封顶功能。如果设置电力阈值,就能随心所欲地配置机架,又不用担心电力尖峰这个风险。在一些地区,电力封顶对保护数据中心避免有干扰、不可靠的电源起到了重要的作用。

向前看齐

幸好,大多数数据中心在相比超大数据中心和超大规模计算环境风险低得多的规模下运行。不过,任何规模的数据中心都应该将减少能源成本、避免服务中断视作一个优先事项。如果采用成熟可靠的方法,并充分利用整个数据中心中的所有实时数据,IT和设施部门就可以效仿超大规模数据中心,只需要投入比较少的前期成本和精力,就能获得重大回报。

作者:何妍 

来源:51CTO

时间: 2024-08-01 22:25:12

管理超大规模数据中心的五个实用经验的相关文章

管理远程数据中心资源的五个最佳实践

如今的现代IT基础设施已从一种本地化环境演变成一种分布式数据中心架构.管理员能够利用更好的远程托管服务,帮助自己扩大现有环境,并完成更多与业务有关的IT任务.企业组织在利用云技术和专用的广域网链路,帮助自己扩大现有数据中心,并使用外部资源,用于灾难恢复.扩建.额外的用户工作负载,或者甚至测试和开发. 这些资源可供使用时,人们往往会用完资源.如果环境是本地环境,管理和监控数据中心里面的现有资源可能更容易. 然而,如果有分支机构或其他远程环境也需要监控,该如何是好?要牢记的一个要点是,资源始终是有限

带你了解超大规模数据中心究竟有何不同?

本文是作者Mary Branscombe在参观完微软公司位于华盛顿州昆西的超大规模数据中心之后所撰写的一篇手记,从文中,我们可以看出云数据中心在过去的十年中究竟走了多远. 一处超大规模的云数据中心看起来与一般的企业级数据中心是不同的,甚至与一家大型的托管服务提供商也是不同的.他们所面临的问题不同于您企业数据中心所面临的问题.而您企业数据中心所采用的各种方法:包括从如何选择一处数据中心站点,到如何管理电源,再到服务器的运行使用寿命该有多久都与您企业的数据中心是不同的. 如果您企业正在考虑采用一款混

超大规模数据中心究竟有何不同?

本文是作者Mary Branscombe在参观完微软公司位于华盛顿州昆西的超大规模数据中心之后所撰写的一篇手记,从文中,我们可以看出云数据中心在过去的十年中究竟走了多远. 一处超大规模的云数据中心看起来与一般的企业级数据中心是不同的,甚至与一家大型的托管服务提供商也是不同的.他们所面临的问题不同于您企业数据中心所面临的问题.而您企业数据中心所采用的各种方法:包括从如何选择一处数据中心站点,到如何管理电源,再到服务器的运行使用寿命该有多久都与您企业的数据中心是不同的. 如果您企业正在考虑采用一款混

IDC:超大规模数据中心服务器出货量增长推动市场收入上扬6.3%

根据IDC的全球服务器市场季度追踪报告显示,2017年第二季度全球服务器市场收入同比增长6.3%达到157亿美元.整个服务器市场在经历了因为等待英特尔发布Skylake处理器而导致多个放缓的季度之后开始反弹.尽管来自云服务提供商的需求推动着整体市场的表现,但是服务器市场的很多其他领域仍然停滞不前.第二季度全球服务器市场出货量同比增长1.9%达到245万台. 批量出货服务器的收入增长8.3%达到129亿美元,中端服务器收入增长19.6%达到15亿美元.高端系统的收入同比下滑18.9%达到13亿美元

云计算推动超大规模数据中心发展与应用

本文讲的是云计算推动超大规模数据中心发展与应用,从计算演变的历史我们可以发现,大约每隔15 年左右,IT 产业就会进行一次变革性的转变.不同技术力量相互碰撞和倾轧,并最终产生出一种能改变整个产业生态的革命力量.每个计算时代都会有自己独领风骚的技术.当前,云计算对IT 产业的影响无疑是巨大和深远的,云计算由于自身的灵活性和易扩张性,正在促进IT快速的演变,使得现在的IT生态系统更具挑战性,企业如果不能适应这样的变化就会被淘汰. 上周我有幸主持了一个云计算会议(Cloud Connect confe

简化未来软件定义数据中心的五件事

如今,越来越多的组织正在评估和实施软件定义的数据中心管理(SDDC)功能,以提高灵活性和利用率.该技术正在快速发展,而软件定义的管理代表着大多数组织的未来.根据调查机构Gartner预测,到2020年,"SDDC的编程能力将被全球75%的2000强企业认为是一个寻求实现DevOps方法和混合云模式要求." 就像在数据中心的每一个重大转变一样,SDDC的过渡将更加进化.因此,如今作出的决定将促进或是进化的障碍,无论组织是否已经开始实施SDDC或刚刚开始评估其潜力. 软件定义管理的挑战之一

嵌入式数据中心有望胜过超大规模数据中心?

据一份新的调研报告声称,超大规模数据中心似乎不可阻挡的发展势头可能会有所遏制,至少在大都市区是这样. 市场调研公司451 Research近日发布了一份报告,题为<无所不在的IT迎来下一波浪潮:嵌入式数据中心>.据该报告声称,数据中心行业的下一大变化可能是会出现一波微型模块化数据中心(MMDC),这种数据中心嵌入在写字楼等其他楼宇.由于电力.房地产和IT预算等资源变得更稀缺,MMDC这种新模式有望将数据中心瘦身成易于管理的单元. 隔壁房间的数据中心 这家调研公司预测,下一个发展阶段将会是围绕公

思科:60%超大规模数据中心将部署SDN/NFV解决方案

思科认为,未来五年内,预计全球大约将有近60%的超大规模数据中心会部署SDN/NFV解决方案. 思科在"思科全球云指数"报告中称,由于运营商正在努力提高效率,到2020年,数据中心内44%的流量将由SDN/NFV平台支持,而2015年则为23%. 软件定义网络(SDN)和网络功能虚拟化(NFV)正在帮助压缩数据中心架构并简化流量. 全球超大规模数据中心将从2015年的259个增长到2020年的485个.在未来五年内,超大规模数据中心的流量预计将增长五倍.这些基础设施将占数据中心安装的服

Fusion-io: 全闪存超大规模数据中心时代的到来

 闪存比笨拙的磁盘驱动更能高效地优化性能,这一点如今已经很少有人质疑.然而,闪存的价格却使许多企业仅将其部署在处理关键应用程序和数据库的企业服务器上. 在2013年,由于闪存设备每千兆售价降至3.89美元(约25元人民币)以下,除了关键任务应用程序之外,互联网企业目前也可考虑利用闪存来驱动超大规模数据中心. 面向超大规模数据中心的闪存 既然现在闪存设备性能可靠又价格合理,那整个数据中心都可以部署,互联网企业也终于能够全面利用闪存所带来的应用加速能力,而这原先通常是只留给企业客户的.一些网络和云技