数据中心运维管理经验39条

1、空调与机房错层设计,可以有效防止漏水。

2、机房蓄电池的使用环境温度非常重要,25度是最佳值。

3、要注意电池的生产批次,讲究其一致性,不同批次的产品性能会有略微差异。所以在采购蓄电池时,可以每组同批次的多买2节电池,放入系统中作为电池组的热备份,当今后某节电池出现问题时,可以及时顶上。

4、要建CMDB,如果没有建立CMDB库,那么一定要建立一本简单的台帐,EXECL表就可以。

5、数据中心没有突发事件,所有事件的发生都应做到预案化。所以要不断的去完善应急预案,要通过头脑风暴去设计不同的应急场景。应急管理工作永远都是在不停的丰富和优化。

6、强调日常工作中预案管理的重要性。

7、应急演练不要总安排在工作日白天,因为白天往往是人力资源最完整的时候,我们演练的一个重要目的是要提高基础值班人员的响应速度和处理能力,这个初始速度非常重要,很多灾难如果响应及时,处理得当,完全可以减轻损失。

8、设备采购谈判时一定要谈好今后的维保,至少3年。

9、空调系统如果采用全水冷的方式,那么一定要考虑水压问题,也一定要确保所在区域不会计划性停水。

10、为保证供水压力,可以考虑单独铺设水管。

11、ATS要放在母联的下面……

12、PS并机, 4台并机比较可靠,超过4台可靠性就会下降。

13、UPS放电时间要有控制,建议不要超过其剩余容量的30%。

14、UPS间要放备用工具箱,发电机间要有应急照明,主要设备旁要张贴应急处理手册和故障恢复流程。

15、 UPS中的逆变与旁路要求同步,同步频率范围要依据负载来定,要以最小范围来调。

16、 UPS调试时,旁路与逆变的转换要多转几次。

17、 隔离变压器的作用之一可以使0地电压降低,对设备提供保护。

18、UPS输出切换到旁路的时候,要注意同步灯有没有亮,同步灯亮就不能强行切换,否则会造成输出断电。

19、3相不平衡会导致0地电压变大,所以基础设施管理人员一定要严格把握,不能随便乱加负载。(三相不平衡会导致中线电流变大,当大于相线电流时,就会加大零地电压)

20、先算出电流再选择线缆。

21、 电池放电到欠压告警,可以估算出电池的实际可支撑时间。

22、 电池接线,要注意铜和铅不要直接接确,不然会互相腐蚀,增加电阻,影响电池的放电电压。

23、UPS至少每半年要检修一次,要关注UPS风扇,电离和电容都要重点关注。

24、STS要求2路供电的相位和频率范围一致,如果来自不同的变电站,可能存在相位、频率不一致的情况,极端情况下,会造成未端STS无法自动切换。

25、 空调外机要做好标识,尤其是风冷外机,要与内机一一对应,以提高故障判断和处理的效率。

26、要重视监控数据的分析,风机、压缩机的运行电流数据可以预判设备的健康情况。

27、机房内的温度检测可以同时放在冷通道和热通道,但监控应以回风温度为准,所以温度探测仪要放在回风通道的上方。

28、 空调的加热装置不能随意关闭,系统的自带功能不要人为随意干预。

29、 空调选型时,要选同尺寸内功率最大的。

30、 空调外机清洗要注意安全使用高压水枪,不能从侧面冲洗。

31、制冷剂、机油不同品牌不能混用,否则易造成压缩机故障。

32、每台空调内机的支路一定要装阀门,利于检修,给水的阀门一定要做好标识。

33、 制冷剂发生泄漏,不要第一时间去抢修,要让其散发完整,以减少对人体的损害。

34、冷池的顶板起落最好要带有阻泥,防止突然降落对人身造成伤害。

35、 发电机启动时要注意空调的瞬时启动电流,其会导致发电机启动失败,最好设置延时,软启动。

36、UPS、消防要做到只监不控,否则风险太大。

37、以后可以考虑引入智能列头柜。

38、储能、储油类系统(如电池、柴油发电机)要当心其二次、三次灾害,七氟丙烷是一次性灭火,而不是持续性灭火,遇上电池火灾,效果不一定很好。

39、柴油发电机灭火,可以考虑高压油雾灭火系统。

排风、通风或抽风系统的用电不要接入机房内的配电系统,要独立,防止机房起火停电后,因排烟、抽风不能用而延缓系统修复速度。

作者:佚名

来源:51CTO

时间: 2024-08-26 20:46:37

数据中心运维管理经验39条的相关文章

数据中心运维需要的三大认证

数据中心的好与差需要有个衡量的标准,这可不是靠"老王卖瓜自卖自夸"就可以了.所以随着数据中心行业发展的成熟,出现了一些第三方的数据中心认证标准,这些标准按照自己的评价标准对世界各地的数据中心进行评估,得出评级.很多数据中心参与到这些认证中来,主要还是要提升自己的知名度,以便吸引更多的客户将业务放到自己的数据中心来.同时,这些第三方评估机构随着评估水平的高低,受认可程度也不同.数据中心领域其实并不缺少标准,包括国际标准.行业标准以及国际标准有很多,但是这些标准并不完全统一,而且有的标准更

优云软件叶帅:“互联网+”时代的云数据中心运维思辨(二)

2017中国开源产业峰会暨中国国际软件博览会分论坛,优云软件叶帅在开源云计算技术创新论坛发表了<"互联网+"时代的云数据中心运维思辨>的主题演讲,本文根据演讲内容整理而成. 无论是稳态还是敏态,大家关注的内容最终的目标并不会发生变化,最终的目标都是保证当前的数据.业务或者用户能够得到一个比较好的系统体验,是不是说随着云环境或者容器对象的引入,当前的IT对象或者IT服务就能够得到持续的比较好的体验呢?其实往往不是这样的. 随着业务系统或者整个IT架构发生一个复杂的变化,要管理

简述数据中心运维知识体系架构

数据中心要正常运转,离不开大量的运维工作.运维的工作需要很多专业技术人才,要做好数据中心的运维需要掌握多学科.多门类的专业技能,运维的工作不强调人才对一门技术有多专.有深度,但要有广度.出于成本的考虑,数据中心不可能聘入所有专业知识领域的人才,需要的是通用人才.如何才能成为一名优秀的数据中心运维专家呢?本文就来说一说运维工作所需的知识体系架构,根据这个知识体系架构,对自己弱势的部分有针对性地学习,很快就能成为一名数据中心运维专家. 数据中心运维知识可以分为三大部分:运维技术.测试和开发和运维管理

高效数据中心运维团队的7个习惯

何运行一个庞杂的机房,进行无数的主动和被动的操作,同时避免错误导致的数据中心故障? 以终为始 以终为始是一种以结果为导向的思维方式,提示人们在做事情前要先明确做事情的最终目的,也就是"不忘初心,方得始终".数据中心的终极目标是支持业务系统的不间断运行.在接手一个数据中心的运维任务之前,我们首先需要明确业务连续性目标,然后才能制定相应的运维策略. 以人为本 70%的数据中心故障是由人为造成的.与此同时,即使有最先进的监控系统,数据中心内无论主动保养操作,还是应急反应,都还需要依赖于人员的

数据中心运维人的中年危机

数据中心属于年轻人的行业,紧随科技前进的步伐,在数据中心里从事技术运维的人普遍年龄较轻,一般在30岁以下,尤其是一些技术操作人员都很年轻,这是由这个行业的发展特点所决定的.数据中心里技术更新换代很快,很多人跟随不上这样的节凑慢慢也就被淘汰了,还有一些就是仅掌握了初级操作水平的人员,这些工作替代性强,新手往往几个月就可以上手,这样的工作自然不需要经验丰富的老员工,与其为老员工支付高工资,不如用年轻员工,这样人力成本大为降低,工作基本也不会受到影响.在富士康的经营中,我们看到其永远都处于缺人,不断招

数据中心运维——消防安全“四个能力”

数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力". 数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力".消防安全"四个能力"是公安部构筑社会消防安全"防火墙"工程提出的,即: 1.提高社会单位

数据中心运维从零开始

运维是数据中心里最为重要的工作部分,不过如果和朋友说起自己是干运维的,总会让人听起来感觉有点低级,很多人会想到专科技校.蓝翔电脑培训出来的都是搞这个的.不错,数据中心运维也需要大量这方面的初级人才,完成一些基本的重复性的操作类运维工作,但这只是运维很小的一部分内容.希尔顿是开饭店的,路边也有很多开饭店的,而人家希尔顿开的是五星级酒店,而且是在全球各地开,同样是开饭店的,却有大不同,没有任何可比性.所以,不要一对别人说自己是搞运维的,就觉得比搞金融.互联网.计算机的低一等,运维的工作里也有做得高大

ITIL在数据中心运维中的应用

随着数据中心建设规模越来越大,运维的工作变得十分重要.运维的工作效率与好坏在一定程度上决定了数据中心的整体水平.数据中心运维工作涉及两大方面:一是确保数据中心的稳定性而对数据中心各个环节进行维护;二是当数据中心内出现问题时,能够及时定位并且解决,以缩短故障时间.前一个是基础,后一个是关键.这就像当兵打仗,俗话说"养兵千日,用在一时",平时对数据中心各个方面进行了精心的检查和熟悉,对整个数据中心状况了如指掌,那在数据中心发生故障时,才能迅速找到痛点,明确故障原因,并采取恢复措施.一个数据

数据中心运维工程师必备技能

运维的工作是数据中心里最为重要的一部分工作,在整个数据中心的生命周期里,持续时间最长,拥有一批高水平的运维工程师是数据中心长期稳定运行的法宝.虽然数据中心的运行故障不可避免,但通过有效运维,可以大幅降低故障发生的频率,并在出现故障的时能够有效及时地恢复业务.在这些过程中,运维工程师的水平起到了至关重要的作用.作为数据中心里的一名运维工程师,应该掌握哪些技能,才能在工作中游刃有余.要知道数据中心里有很多设备,而作为一名运维工程师不可能,也没有必要全部掌握,要懂得应该掌握哪些技能,一些基本命令和重要