新型数据中心运维要保证哪三项重点?

随着云计算与大数据技术的快速发展,数据中心的扩容建设进入了高峰期,但是并不是所有人都了解数据中心保障正常运行的安全考量,运维保障自然成为重点。

三项硬指标缺一不可

首先,为什么要建数据中心?简单点说,其主要承担的角色即是数据的归宿地以及传输站,最早的微型数据中心暂且不探讨,我们不妨来看看新型数据中心的挑战。

新型数据中心运维颇具挑战

按照笔者的理解,新型数据中心,应是集合计算、存储及网络资源高度融合,各种IT设备虚拟化程度较高、实现模块化、自动化并具备较高绿色节能程度的新型数据中心。

由于新型数据中心承载大量的数据应用与运行,它的安全运行相较于传统意义上的数据中心而言,运维服务支撑体系目标主要集中在:安全性、系统负载以及TCO三个主要方面:

第一,安全性一定要达到桌面标准,即领导要通过,客户要审核,管理要严格。例如强电管理、防火防盗,运维人员要做到24小时应急保障,场地系统一旦出现问题,要在第一时间做到解决,并提供应急备案;

第二,新型数据中心的IT负载做到科学分配,保证做到并行双系统运作,为“风、火、水、电”的基础工作提供保障,掉不掉电,就看运维保障过不过关。值得强调的是,数据中心73%的故障不是设备本身,而是人的不专业,所以,一套专业而智能运维管理系统必不可少;

第三,运行成本要达标,要知道数据中心最大成本是电,举个例子,一万平数据中心,其建设成本是2到3个亿,但是它消耗的每年的电力成本是建设成本的20%-35%,4到5年之后,电力的消耗成本相当于新建一个数据中心,所以,当你看到这组数据的时候是不是吃了一惊?绿色节能无疑是新型数据中心的运行的关键。

如何做到以上三点?首先是人员管理体系的建立,其次是软件平台体系的完善升级。从现实情况来讲,目前国内数据中心领域,人员管理是最难的,因为没有那么多专业的人材,流程管理体系相对来也并不是想象般成熟,重点即在流程体系管理建立方面。

SLM落地离不开DCIM

众所周知,数据中心运维服务从纵向角度而言,需要集合强电系统,暖通系统,弱电监控系统三大应用领域的服务协作,而从流程上看,需要从规划、设计、实施、验证、运行维护、升级改造六大环节在SLM中环环相扣。

作为SLM(Service Level Management)前半部分,规划、设计、实施三大环节已经在国内的产业链发展中业已成熟,并形成了国家既定的行业标准,形态清晰。

但重点在于,鉴于数据中心发展业态维护层与运营层仍然面临着人材短缺局面,加上对于场地及维护的标准亟待提高,运行管理的水平低迷现状亟待扭转,这就要求对于验证、运行维护、升级改造的后半程服务发挥丰富的支撑作用。

而运维人员所需要做的是,通过DCIM(Data Center Infrastructure Management)管理系统,延伸到相关系统的所有产品,从纵向说,服务效能可从设备层延伸至子系统层、主系统层以及场地层,循序渐进地形成立体的发展脉络,如同一个金刚罩,紧紧保护着数据中心的运行。

可以预测的是,运维系统的再升级将成为了下一阶段数据中心基础设施运营流程的核心,与此对应,只有满足集约化的部署能力,管理效率才可以可以不断优化运维质量,降低运营成本,并通过专业化的管理平台提供全方位管理,才能真正推动并实现数据中心的安全、绿色产业发展。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-09-25 19:33:48

新型数据中心运维要保证哪三项重点?的相关文章

优云软件叶帅:“互联网+”时代的云数据中心运维思辨(二)

2017中国开源产业峰会暨中国国际软件博览会分论坛,优云软件叶帅在开源云计算技术创新论坛发表了<"互联网+"时代的云数据中心运维思辨>的主题演讲,本文根据演讲内容整理而成. 无论是稳态还是敏态,大家关注的内容最终的目标并不会发生变化,最终的目标都是保证当前的数据.业务或者用户能够得到一个比较好的系统体验,是不是说随着云环境或者容器对象的引入,当前的IT对象或者IT服务就能够得到持续的比较好的体验呢?其实往往不是这样的. 随着业务系统或者整个IT架构发生一个复杂的变化,要管理

简述数据中心运维知识体系架构

数据中心要正常运转,离不开大量的运维工作.运维的工作需要很多专业技术人才,要做好数据中心的运维需要掌握多学科.多门类的专业技能,运维的工作不强调人才对一门技术有多专.有深度,但要有广度.出于成本的考虑,数据中心不可能聘入所有专业知识领域的人才,需要的是通用人才.如何才能成为一名优秀的数据中心运维专家呢?本文就来说一说运维工作所需的知识体系架构,根据这个知识体系架构,对自己弱势的部分有针对性地学习,很快就能成为一名数据中心运维专家. 数据中心运维知识可以分为三大部分:运维技术.测试和开发和运维管理

数据中心运维需要的三大认证

数据中心的好与差需要有个衡量的标准,这可不是靠"老王卖瓜自卖自夸"就可以了.所以随着数据中心行业发展的成熟,出现了一些第三方的数据中心认证标准,这些标准按照自己的评价标准对世界各地的数据中心进行评估,得出评级.很多数据中心参与到这些认证中来,主要还是要提升自己的知名度,以便吸引更多的客户将业务放到自己的数据中心来.同时,这些第三方评估机构随着评估水平的高低,受认可程度也不同.数据中心领域其实并不缺少标准,包括国际标准.行业标准以及国际标准有很多,但是这些标准并不完全统一,而且有的标准更

高效数据中心运维团队的7个习惯

何运行一个庞杂的机房,进行无数的主动和被动的操作,同时避免错误导致的数据中心故障? 以终为始 以终为始是一种以结果为导向的思维方式,提示人们在做事情前要先明确做事情的最终目的,也就是"不忘初心,方得始终".数据中心的终极目标是支持业务系统的不间断运行.在接手一个数据中心的运维任务之前,我们首先需要明确业务连续性目标,然后才能制定相应的运维策略. 以人为本 70%的数据中心故障是由人为造成的.与此同时,即使有最先进的监控系统,数据中心内无论主动保养操作,还是应急反应,都还需要依赖于人员的

数据中心运维人的中年危机

数据中心属于年轻人的行业,紧随科技前进的步伐,在数据中心里从事技术运维的人普遍年龄较轻,一般在30岁以下,尤其是一些技术操作人员都很年轻,这是由这个行业的发展特点所决定的.数据中心里技术更新换代很快,很多人跟随不上这样的节凑慢慢也就被淘汰了,还有一些就是仅掌握了初级操作水平的人员,这些工作替代性强,新手往往几个月就可以上手,这样的工作自然不需要经验丰富的老员工,与其为老员工支付高工资,不如用年轻员工,这样人力成本大为降低,工作基本也不会受到影响.在富士康的经营中,我们看到其永远都处于缺人,不断招

数据中心运维——消防安全“四个能力”

数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力". 数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力".消防安全"四个能力"是公安部构筑社会消防安全"防火墙"工程提出的,即: 1.提高社会单位

数据中心运维从零开始

运维是数据中心里最为重要的工作部分,不过如果和朋友说起自己是干运维的,总会让人听起来感觉有点低级,很多人会想到专科技校.蓝翔电脑培训出来的都是搞这个的.不错,数据中心运维也需要大量这方面的初级人才,完成一些基本的重复性的操作类运维工作,但这只是运维很小的一部分内容.希尔顿是开饭店的,路边也有很多开饭店的,而人家希尔顿开的是五星级酒店,而且是在全球各地开,同样是开饭店的,却有大不同,没有任何可比性.所以,不要一对别人说自己是搞运维的,就觉得比搞金融.互联网.计算机的低一等,运维的工作里也有做得高大

ITIL在数据中心运维中的应用

随着数据中心建设规模越来越大,运维的工作变得十分重要.运维的工作效率与好坏在一定程度上决定了数据中心的整体水平.数据中心运维工作涉及两大方面:一是确保数据中心的稳定性而对数据中心各个环节进行维护;二是当数据中心内出现问题时,能够及时定位并且解决,以缩短故障时间.前一个是基础,后一个是关键.这就像当兵打仗,俗话说"养兵千日,用在一时",平时对数据中心各个方面进行了精心的检查和熟悉,对整个数据中心状况了如指掌,那在数据中心发生故障时,才能迅速找到痛点,明确故障原因,并采取恢复措施.一个数据

数据中心运维工程师必备技能

运维的工作是数据中心里最为重要的一部分工作,在整个数据中心的生命周期里,持续时间最长,拥有一批高水平的运维工程师是数据中心长期稳定运行的法宝.虽然数据中心的运行故障不可避免,但通过有效运维,可以大幅降低故障发生的频率,并在出现故障的时能够有效及时地恢复业务.在这些过程中,运维工程师的水平起到了至关重要的作用.作为数据中心里的一名运维工程师,应该掌握哪些技能,才能在工作中游刃有余.要知道数据中心里有很多设备,而作为一名运维工程师不可能,也没有必要全部掌握,要懂得应该掌握哪些技能,一些基本命令和重要