监测系统是数据中心的一面镜子

监控功能是数据中心的重要组成部分,通过监控系统可以对数据中心整体运行情况有全面的了解,并进行有效控制与管理。虽然无人值守数据中心、软件定义数据中心等新的概念涌现出来,但只是将控制权交给了机器,系统中依然需要对数据中心监控,采集各种运行参数,提供给控制中心,所以监控系统要完成数据采集、分析处理、存储、展示、使用户能实时掌握数据中心的基础设施运行情况。由于数据中心自身大规模高动态的特点,监测数据中心收集也面临着一些挑战,要不断丰富监测手段,采集到能够真实反映数据中心运行状态的数据,而不是获取假象。

 

数据中心要做好监测,需要具备三个特性:实时性,数据中心监测数据应当被实时地收集到,以便于数据中心及时地控制管理,这个实时性包括周期性轮询采集数据的时间,这个轮询周期越短实时性越高,周期越短,单次采集的数据不宜过大,还有部分数据是靠各种运行设备实时上报。可扩展性,在整个生命周期中,数据中心不可能一成不变,而且随着业务量的扩大,也有不断扩容的需求。监测数据收集系统应该方便调整,为现有的或是增加的新设备添加新的监测指标,根据数据中心变化,不断调整监测系统,不要让监测系统成为了摆设。智能性,监测系统不是采集完数据就了事,要具备数据分析能力,还要将采集的无效数据过滤掉,利用大树法则获得最有效的数据。比如采集机柜环境温度,在一个机房里会有成百个机柜,每个机柜温度不可能相同,有的差别甚至很大,这时就不能以点盖面,需要多采集不同机柜温度,同时反复多次采集,根据采集的数据再增加一些权重算法,从而计算得出合理数据。

 

数据中心内部各种系统很多,这也使得监测系统非常庞大,监测系统的设计异常复杂。以一个普通数据中心的监测系统来说,要包括供配电监控、环境空调监控、安防监控、运行数据监控、屏显中心、管理监控等等,可靠性越高的数据中心,监测系统越完善,监测的项目非常繁多。在表1里,列举了供配电监控的部分内容。

 

 

通过对供配电的监控,及时了解数据中心供电系统的运行情况,一旦市电发生断电,可以及时切换到蓄电池或者备用发电机组上,避免业务长时间中断。也可以将监测数据发到运行数据中心,由运维人员根据数据进行工作部署。在表2里,列举了空调环境监控主要内容。

 

 

通过对空调环境的监控,及时了解数据中心制冷情况,内部运行环境情况,为运行设备提供良好的运行环境,避免过冷或过热的环境影响到运行设备的使用寿命。数据中心里设备产生的热量非常大,需要空调及时将热空气排出去,否则对数据中心危害很大,甚至可能引发火灾事件,这方面已经有过历史教训。一个封闭性很好的数据中心机房,空调停转半小时,部分设备就可能出现宕机情况,有些设备自动保护不够好,持续的高温就可能造成线路短路,产生火花,引发火灾。拥有全面的空调监控系统,就可以避免这种情况发生。

 

在表3里,列举了数据中心屏显中心监测主要内容,一个往往是有个巨大的会议大厅,前面有一幅超大的屏幕,上面会显示各种各样的数据,这些数据代表了各个系统和业务的运转情况,一旦有故障可以及时地在屏幕上显示出来。屏显中心的所有数据都采集各个监测系统。一般屏显中心也是各路领导经常光顾的地方,通过屏显中心了解整个数据中心的运行状况以及数据中心的各种运行设施。

 

 

还有一个监测系统非常重要,就是管理监控,这主要是对数据中心进行有效管理时做参考。在表4里,列举了管理监控涉及的主要内容,这部分一般是由管理人员来控制,对数据中心进行全面管理,不仅仅业务层面,还有人员的培训、考核、考勤等等。

 

 

除了以上这些监测指标,还有消防、安防、日志管理、视频监控、门禁系统、账号管理等等,数据中心需要监测的内容非常多,上面只是将最为关键的部分拿出来做了介绍。这些监测系统涉及很多专业技术,有些设计还非常复杂,需要由专业团队才能完成部署,做一套完整的数据中心监测系统难度不亚于建造数据中心本身。一个数据中心监测系统做得好坏也直接决定了这个数据中心的运营水平。所以如果要对数据中心进行评价,监测系统往往是被考察的重要部分,这是数据中心水平的直接体现。

 

数据中心监测的根本目标是用尽可能少的运营成本获得尽可能高的系统可用性。高可用性是数据中心水平表现最为重要的标准,而监测系统就像高可用性管理的一双眼镜,有了它整个数据中心运行情况才能一目了然,高可用性的目标才具备实现的管理基础。

本文转自d1net(转载)

时间: 2024-07-31 02:14:48

监测系统是数据中心的一面镜子的相关文章

节能高效的数据中心多模UPS系统

随着政府部门和企业面临降低数据中心运营成本和相关能源使用的压力,不间断电源(UPS)生产制造商对其技术与产品进行了设计改进,以提高运营效率. 数据中心行业组织如绿色网格协会强烈建议企业使用新的多模式UPS系统技术,使其运行效率达到98%到99%,取代运行效率为93%至95%传统的单模式UPS.目前,大约50%的大型UPS系统制造商采用具有快速传输逻辑的多模技术.这种类型的UPS很可能在未来五年内得到显著增长. 什么是多模UPS系统? 多模UPS系统为数据中心运营商提供了在两种运行模式之间进行选择

数据中心超高效冷冻水系统的优化

数据中心冷却设计的主要目标一直是通过冗余实现备份的可靠性.最重要的是,冷却设备必须维持关键环境条件下的精确的温度和湿度--不管其是如何通过现有的冷却系统策略来实现的.这导致了不必要的能源消耗使用.在这方面,没有任何其他地方要比CRAC(计算机房空调)更加明显的了,该CRAC单元继续采用控制策略,其中冷却.加湿和再热系统彼此斗争,以维持关键的环境条件,而不考虑这样做所消耗的能量的量.当在CRAC单元的部分负载操作下供应全部气流时,浪费了更多的能量.即使内置了电子换向EC风扇技术,风扇通常在旁路或手

克莱门特公司在俄罗斯一个数据中心安装其新型冷却系统

日前,欧洲知名制冷厂商克莱门特公司在俄罗斯一个新建的数据中心安装部署了其冷却系统.这个位于雅罗斯拉夫尔数据中心达到了UptimeInstitute的TierIII级可靠性水平.该数据中心设施是一个大型综合楼,建筑面积为32.3万平方英尺,总占地面积为7公顷. 这个数据中项目心2012年初动工,并于2015年12月建成,成为俄罗斯获得国际TierIII级认证的最大的一个数据中心. 俄罗斯的数据中心市场每年都以25%左右的速度增长,而当地凉爽的气候以及国家的数据主权法律的最新变化成为了其增长的主要因

全面了解数据中心绝热冷却系统

数据中心和高温并没有必然的关联,但是否过热要视情况而定.在不远的将来,数据中心的温度将维持在25至30摄氏度(77至86华氏度),实际上也有数据中心运行在ASHRAE(美国采暖.制冷.和空调工程师学会)建议的更高温度--高达35摄氏度(95华氏度)--在这种温度下,CRAC(计算机房空气调节器)负载并不高,却仍需浪费能源在数据中心内移动大量空气. 有很多处于高温气候环境下的数据中心外部温度往往超出了ASHRAE指导的可实施自由冷却的温度.但是,CRAC是这些高温气候区域数据中心的唯一选择吗?在投

“一体化”国家数据中心启航,SinoBBD带头落地

2016年10月9日下午,中央政治局集体学习 "实施网络强国战略"时,习近平总书记在重要讲话中明确提出加快"建设全国一体化的国家大数据中心,推进技术融合.业务融合.数据融合,实现跨层级.跨地域.跨系统.跨部门.跨业务的协同管理和服务"的要求. 过去一年,这一国家战略得到了业界的广泛关注,在各级领导政府的积极推动和企业的配合下,"一体化"国家大数据中心的建设也正式起航了.近日,"加快大数据中心一体化进程·2017北京峰会"在京成

高效数据中心的10大关键要素

由于云计算和虚拟化等新技术的出现,数据中心的演变可能将其转变为一个非常不同的环境.然而,任何数据中心都需要某些基本要素才能顺利和成功地运作.无论您企业的数据中心是步入式机柜(walk-in closet)还是飞机式机架(airplane hanger),或者甚至是在浮式驳船上(有传言称Google正在构建),这些要素都是适用的: 1.环境控制 标准化和可预测的环境是任何高质量运营的数据中心的基石.其不仅仅是保持数据中心操作环境的冷却和适当的湿度水平(根据维基百科,推荐的数据中心操作环境温度范围是

创建数据中心监控方案的最佳实践方案

本文中,我们将略过关于IT更新的一系列统计数据和趋势的简介,而把关注焦点聚焦于您的数据中心的监控实践方案. 我曾经有幸能够有机会与各种类型的数据中心环境合作过.是的,这些数据中心的环境类型都各有不同.一些数据中心采用电源HPC工作负载,而其他数据中心则使用云工作负载.然后,还有一些数据中心充当了存储孤岛和存储库,以及一些数据中心是私有的托管合作伙伴.每家企业组织都可能有不同类型的要求,设备和布局. 然而,现代数据中心的关键属性需要匹配最佳的监测机制.以下,我将为广大读者朋友们介绍一些这方面的最佳

提高数据中心效率、可用性和容量的五项最佳实践方案

数据中心可以说是任何企业中最具活力和最为关键的操作之一.近年来,随着数据中心的密度和容量呈现稳步增长,其复杂性和安全风险也在不断增加,资源日趋紧张,进一步为其相关设备的性能带来了不良的影响.根据一项针对数据中心行业的停机中断研究结果显示,数据中心的任何类型的停机中断的平均成本为389,879欧元,而部分的停机中断的平均成本为199,103欧元.完全停机中断的成本超过524,464欧元.鉴于停机中断的成本如此之高,使得IT容量的可用性通常是评估数据中心的最重要的指标.然而,在今天,数据中心还必须同

一个绿色数据中心是如何练就的?

--专访数据中心能效专家Roger R.Schmidt博士 在IBM工作了35年的Roger R.Schmidt博士拥有超过三十年IBM大型计算机散热设计及工程管理经验,如今,他不仅是IBM研究院院士.IBM技术研究院成员,还是美国国家工程院成员,以及美国机械工程师协会(ASME)资深会员.近日,Roger现身"2012 IBM智慧云数据中心高峰论坛",向中国的IT人士介绍IBM在提高数据中心能效方面最新的研究成果.会后,记者也有幸采访了这位数据中心能效领域的技术"大拿&qu