数据中心运维管理人员不可不知的工作职责

随着互联网、信息化产业的不断发展,作为各种信息载体的数据中心发挥着越来越重要的作用。因此保证数据中心的安全运行变得尤为关键,数据中心运维管理工作也变得越来越复杂,技术难度不断被加大。本文主要介绍数据中心运维工作者所应具备的工作职责。

1安全运行

保障系统和设备的正常运行;消防系统的完好;具备防水防火、防鼠措施;健全安全出入管理规定;保持机房清洁;建立供应商联系方式;工具和备件管理;事故应急流程和人员安全应急流程制定等。

2可连续性管理

a.保证所有基础设施设备正常运行

b.特别要注意发电机状态和自动启动功能、油料储备情况和供应条件、ATS状态和转换功能、电池状态和剩余能量、最高功率密度机架温度变化情况,以及预计市电掉电所导致的制冷设备停止运行后的继续运行时间等;

c.注意可维护性和可快速可修复性检查,包括所有设备的维护和修复空间、运输通道畅通、工具和设备备件状况等。

3文章管理

完整的文档时候起运维、故障诊断及优化改造的基础,包括基础设施的全套规划设计相关文档、系统最近一次改造的图纸、全套设备的清单及相关文档、设备保修及保养资料、机房自动操作系统的逻辑图及说明文档、维护日志及相关数据、故障分析及处理过程报告。

4容量管理

应有新增IT设备的安装及下线的工作流程;预测机房空间、电力、制冷的能力与IT需求的关系;关注高密度负载与IT部门保持良好沟通;对于IT需求制定6~36个月的预测;当机房不能满足IT增长的需求时,提前制定扩容或者新建数据中心的计划。

5变更管理

系统扩容预计任何对于设备状态的变更都要事先进行可行性和风险分析,并提出扩容和更改方案,并有完备的事前审核及告知流程、变更窗口审核及告知流程,以及事后的事件报告。

6节能运行

应了解并记录数据中心在不同工况及不同外界气候条件下的能耗情况,从中发现趋势,通过调整制冷设备参数设置、封堵所有可能的漏风口、调整或关闭不必要的出风口、安装盲板、改进气流组织等手段,保证冷空气最佳使用效率;根据负载量调整供电和制冷设备的冗余度以便提高设备容量利用率。

7事故处理

对于突发性故障,要有事故过程和状况记录,组织专家评审并提供事故原因报告,事后提出系统修复方案报告。

8应急演练

主要针对系统可连续性做定期演练,关闭市电输入,考察发电机状态和自启动功能、燃油储备量和消耗量、ATS转换功能、电池备用时间、UPS状态转换不停电供电功能、制冷设备再启动功能、高密度IT机架温度变化情况。

数据中心机房运维管理工作责任重大,运维人员应当了解自己工作的职责。熟悉自己日常的工作流程,时刻关注机房的温度和安全问题,通过优质的维护和管理,让机房发挥出更大的价值。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-08-01 02:14:35

数据中心运维管理人员不可不知的工作职责的相关文章

CIO:云计算数据中心运维管理要点

云计算运维管理的要点云计算在运维管理中其所涵盖的范围非常广泛,其中主要包括了对环境管理.网络管理.软件管理.设备管理.日常操作管理.用户密码管理以及员工管理等多个方面.要良好实现以上的管理目标,则应着重从云计算运维管理中的运行监控.安全性管理和自动化处理这三个要点出发. 运行监控 云计算的运维管理应从数据中心的日常监控人手,对日常维护管理.事件管理.变更管理以及应急预案管理等进行全方位的日常监控,以提前发现问题并消除隐患.通过对云计算良好的运行监控,从而实现对各个系统服务的统一管理,以及对各服务

云计算数据中心运维管理要点

在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个.也是历时最长的一个阶段.数据中心运维管理就是:为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划.组织.协调与控制,是信息系统服务有关各项管理工作的总称.数据中心运维管理主要肩负起以下重要目标:合规性.可用性.经济性.服务性等四大目标. 由于云计算的要求弹性.灵活快速扩展.降低运维成本.自动化资源监控.多租户环境等特性除基于ITIL的常规数据中心运维管理理念之外,以下运维管理方面的内容,也

施耐德电气推新版数据中心运维管理平台

http://www.aliyun.com/zixun/aggregation/33721.html">2014年5月28日,全球能效管理专家施耐德电气近日宣布推出数据中心运维管理平台StruxureWare 7.4版,该款产品提供全新功能和访问可操作智能的通道,在整个数据中心生命周期内有效实现高可用性和高能效间的完美平衡.作为施耐德电气数据中心基础设施管理(DCIM)解决方案StruxureWare数据中心的一部分,数据中心运维管理平台StruxureWare 7.4版能够优化数据中心管

中联数据承接全球最大的天然水冷数据中心 运维管理服务项目

2017年4月1日,中联数据集团成功中标东江湖数据中心(全球最大的天然水冷数据中心)基础设施运维外包服务项目,未来将致力服务于东江湖数据中心打造全球最低PUE值的领军数据中心. 东江湖大数据中心是由湖南云巢信息科技有限公司和湖南省电信合作投资建设的大型专业数据中心. 东江湖数据中心位于郴州市资兴市东江湾,占地面积30亩,建筑面积3.76万平方米,包括三栋主机楼.办公区域.配套建设空调冷冻站.变配电站.给排水.暖通.道路等附属设施.三期总共建设10000个机架,电力负荷设计60MW.其中第一期建设

当前数据中心运维管理工作中存在的问题

教据中心建设作为一种战略投入基本上已经形成共识,但是在巨额的投入后仍面临着种种问题与风险,面临着数据量急速膨胀,场地严重不足,运营成本高昂.能耗大.安垒性差,业务连续能力低等一系列挑战. 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个.也是历时最长的一个阶段.数据中心运维管理就是为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划.组织.协调与控制,是信息系统服务有关各项管理工作的总称.对于很多数据中心来说,保障和提高数据中心运维管理绩效

数据中心运维——消防安全“四个能力”

数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力". 数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力".消防安全"四个能力"是公安部构筑社会消防安全"防火墙"工程提出的,即: 1.提高社会单位

与呼叫中心整合的运维管理平台解决方案

前言 近十年来,数据中心的建设也经历了传统的分散式数据中心向大集中数据中心.云数据中心阶段发展,而数据中心在不同发展阶段的技术特性与管理特性也决定了数据中心运营管理模式的变迁,尤其是在数据中心的运维服务管理方面. 传统的数据中心运维管理核心是IT安全运行保障,提出了著名的"四不原则"--业务不停.网络不断.系统不瘫.数据不丢,这一核心理念在数据中心安全生产过程中起到了非常重要的作用,并且是数据中心运营初期阶段最主要的成效评价依据.而"两地三中心"为代表的大集中式数据

运维侠客行杭州站沙龙回顾 | 云时代下的运维管理实践(附干货下载)

我们处在一个巨变的时代,在云计算.大数据和物联网等新技术.新理念不断更新的大背景下,企业同时面临着数字化和"互联网+"转型的双重挑战,企业对于"稳态IT"和"敏态IT"都提出了强烈的需求,如何推进双态环境下的技术演进变成全行业共同面临的难题. 在这样一个"时空交错"中,优云软件推出了一个名为:"运维侠客行"的线下沙龙品牌,杭州作为首站,活动当天汇聚了来自不同行业和企业的运维从业人员,其中有几十年的运维老兵,

美国力登: 数据中心运维效率已成服务关键

无论你是对服务器发挥虚拟化的最大功效感兴趣正浓,还是为自行建立云计算中心忙碌,永远不要忘记一件事情:"让数据中心的基础架构管理变的简便易行,这样会使你从更低的运营成本中获取更多的商业价值".但由于传统的管理方式已经不能适用当前数据中心高密度设备的需要,同时由于安全和效率的兼顾,远程管理已经成为了建立数据中心必须考虑的要务之一. 设备明显增多 管理员忙于"穿梭" 随着网络.机房设备的快速增容,传统的数据中心运维管理极有可能落入了"业务快速发展与管理服务滞后&