数据中心运维从零开始

运维是数据中心里最为重要的工作部分,不过如果和朋友说起自己是干运维的,总会让人听起来感觉有点低级,很多人会想到专科技校、蓝翔电脑培训出来的都是搞这个的。不错,数据中心运维也需要大量这方面的初级人才,完成一些基本的重复性的操作类运维工作,但这只是运维很小的一部分内容。希尔顿是开饭店的,路边也有很多开饭店的,而人家希尔顿开的是五星级酒店,而且是在全球各地开,同样是开饭店的,却有大不同,没有任何可比性。所以,不要一对别人说自己是搞运维的,就觉得比搞金融、互联网、计算机的低一等,运维的工作里也有做得高大上的,只要脚踏实地去做,都会有所收获,不想当将军的士兵不是好士兵,做运维圈里的将军,一样受人尊重,要充满信心地开始去做运维。本文将说说作为一个小白,如何从零开始做好数据中心运维。

 

作为一名数据中心小白,像上面提到的,首先要对自己即将开始运维的工作充满自信。当然仅有信心是远远不够的,先要搞明白什么是数据中心运维。数据中心运维就是确保数据中心承载的业务持续平稳运行。作为一个运维人员,你需要掌握数据中心每天的流量、数据的变化,明晰任何一个可能影响运营数据的因素,掌控所有可以提升运营数据的手段。你需要时刻记住自己的KPI,并且懂得如何通过正当的手段去提升真实的KPI。和所有入门工作一样,运维的工作入门大多先从非常基础甚至看似毫无价值的事情开始做,这些活儿甚至有些可以称之为体力活。比如,做网络扩容,就需要长时间在机房内工作,各种光纤连接,端口配置,大量的重复、基础配置,这样的工作一做往往要数天,做网络调试的时候,发现哪里有问题,还要一一去检查,这个在数据中心建设初期以及业务高速发展时期是经常需要做的工作,大量的、重复性的工作都需要运维人员完成,这些工作虽然看起来比较低级,但是如果你用心,还是可以有收获,尤其对这张靠自己的双手搭建起来的网络了如指掌。这些基础工作为后期做精细化运维提供了扎实的基本功,如果有机会能在数据中心初建时就介入运维,这是非常好的学习和锻炼机会,虽然这样对一个运维小白来说很难,不过肯定还会有很有经验的人员来带你一起去做数据中心,当将数据中心所有的运行模块都搭建完毕后,会对整个数据中心各个部分都非常了解。如果没有这样的机会,数据中心正处于稳定运行中,就需要获取数据中心网络、服务器、存储、安全、业务等方方面面的数据和文档,对数据中心各个环节有个了解,还要经常到数据中心机房里去查看,仔细检查各个环节,既达到了检查的目的,又可以熟悉环境。

 

仅对环境熟悉是远远不够的,还要善于沟通。稍微有些职场经验人都知道,很多时候问题的关键不在于资源、路径或者是技术问题,而在于人的问题,你所在的部门领导、你的主管、流程上下游相关的人、业务相关接口人等等,这些在你处理某个事务时有交集的所有人都可能影响到整个事务的成败。既然是人的问题,就需要通过沟通来解决。运维的工作,经常涉及业务接口人、流程相关方、细节信息确认方等经常是错综复杂,有时甚至斡旋于多个团队之间太极打得风生水起,问题却不能解决,这时沟通会起很大的作用,与相关部门、人员做好每件事的沟通,这将大大提升运维工作水平和效率。尤其作为一个新人小白,需要虚心向别人请教,在沟通上放低姿态,尽量不给别人添更多麻烦,同时还是完成工作,并从中学习到经验。运维人员的职业绝不是呆板和猥琐的,不能目光呆滞地蹲机房拆机器,或是焦头烂额的处理各类业务故障,好的运维人员懂得协调各种资源为我所用,知道如何利用好周围资源,提升运维水平。

 

数据中心系统涵盖很多方面,强电、弱电、空调、消防、建筑、机房装修、网络、服务器等太多方面,这里面设计太多的专业知识,作为一名小白无力全去了解,先从一个方面切入去了解。比如自己对服务器比较感兴趣,那就主动去学习一些Linux操作系统知识,学习服务器各种虚拟化技术,硬件架构等,有能力再去了解其它方面的技术知识。作为一个数据中心运维知识面一定要广,而不是专,否则未来将深深陷入到了单一技术领域,视野不够开阔,那可能真的就永远处于初级运维的水平。数据中心方面的技术很多,热门技术也不少,要关注这些新技术的发展,看是否有对于自身数据中心发展有利的,如果能将一些新技术引入到数据中心里,并能提升数据中心的运营效率,那着实能多为自己往脸上贴金。

 

作为一名数据中心运维小白,不要好高骛远,做好基础操作工作,前几年的运维工作会很枯燥,没完没了的配置变更,没完没了的设备升级,经常要在后半夜做各种运维工作,以免对现有业务造成影响,说运维工作不辛苦是假的,正所谓“不经历风云,怎能见彩虹”,只能坚持将这段时间走完,成为一名多领域的运维专家,才能进入到另外级别的运维,这时运维工作着重在如何提升自动化运维水平、流程优化、成本考虑。这时运维职业可能有机会进入骨干、主管、经理级别,再经过努力也许有机会达到总监、VP、CTO级别,这时没人敢嘲笑你做运维工作是Low的,作为运维的金领专家,也将获得别人的赞许。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-09-13 06:06:02

数据中心运维从零开始的相关文章

优云软件叶帅:“互联网+”时代的云数据中心运维思辨(二)

2017中国开源产业峰会暨中国国际软件博览会分论坛,优云软件叶帅在开源云计算技术创新论坛发表了<"互联网+"时代的云数据中心运维思辨>的主题演讲,本文根据演讲内容整理而成. 无论是稳态还是敏态,大家关注的内容最终的目标并不会发生变化,最终的目标都是保证当前的数据.业务或者用户能够得到一个比较好的系统体验,是不是说随着云环境或者容器对象的引入,当前的IT对象或者IT服务就能够得到持续的比较好的体验呢?其实往往不是这样的. 随着业务系统或者整个IT架构发生一个复杂的变化,要管理

简述数据中心运维知识体系架构

数据中心要正常运转,离不开大量的运维工作.运维的工作需要很多专业技术人才,要做好数据中心的运维需要掌握多学科.多门类的专业技能,运维的工作不强调人才对一门技术有多专.有深度,但要有广度.出于成本的考虑,数据中心不可能聘入所有专业知识领域的人才,需要的是通用人才.如何才能成为一名优秀的数据中心运维专家呢?本文就来说一说运维工作所需的知识体系架构,根据这个知识体系架构,对自己弱势的部分有针对性地学习,很快就能成为一名数据中心运维专家. 数据中心运维知识可以分为三大部分:运维技术.测试和开发和运维管理

数据中心运维需要的三大认证

数据中心的好与差需要有个衡量的标准,这可不是靠"老王卖瓜自卖自夸"就可以了.所以随着数据中心行业发展的成熟,出现了一些第三方的数据中心认证标准,这些标准按照自己的评价标准对世界各地的数据中心进行评估,得出评级.很多数据中心参与到这些认证中来,主要还是要提升自己的知名度,以便吸引更多的客户将业务放到自己的数据中心来.同时,这些第三方评估机构随着评估水平的高低,受认可程度也不同.数据中心领域其实并不缺少标准,包括国际标准.行业标准以及国际标准有很多,但是这些标准并不完全统一,而且有的标准更

高效数据中心运维团队的7个习惯

何运行一个庞杂的机房,进行无数的主动和被动的操作,同时避免错误导致的数据中心故障? 以终为始 以终为始是一种以结果为导向的思维方式,提示人们在做事情前要先明确做事情的最终目的,也就是"不忘初心,方得始终".数据中心的终极目标是支持业务系统的不间断运行.在接手一个数据中心的运维任务之前,我们首先需要明确业务连续性目标,然后才能制定相应的运维策略. 以人为本 70%的数据中心故障是由人为造成的.与此同时,即使有最先进的监控系统,数据中心内无论主动保养操作,还是应急反应,都还需要依赖于人员的

数据中心运维人的中年危机

数据中心属于年轻人的行业,紧随科技前进的步伐,在数据中心里从事技术运维的人普遍年龄较轻,一般在30岁以下,尤其是一些技术操作人员都很年轻,这是由这个行业的发展特点所决定的.数据中心里技术更新换代很快,很多人跟随不上这样的节凑慢慢也就被淘汰了,还有一些就是仅掌握了初级操作水平的人员,这些工作替代性强,新手往往几个月就可以上手,这样的工作自然不需要经验丰富的老员工,与其为老员工支付高工资,不如用年轻员工,这样人力成本大为降低,工作基本也不会受到影响.在富士康的经营中,我们看到其永远都处于缺人,不断招

数据中心运维——消防安全“四个能力”

数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力". 数据中心建筑不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信线路.环境控制设备.监控设备以及各种安全装置,作为数据中心运维管理人员更应熟练掌握"四个能力".消防安全"四个能力"是公安部构筑社会消防安全"防火墙"工程提出的,即: 1.提高社会单位

ITIL在数据中心运维中的应用

随着数据中心建设规模越来越大,运维的工作变得十分重要.运维的工作效率与好坏在一定程度上决定了数据中心的整体水平.数据中心运维工作涉及两大方面:一是确保数据中心的稳定性而对数据中心各个环节进行维护;二是当数据中心内出现问题时,能够及时定位并且解决,以缩短故障时间.前一个是基础,后一个是关键.这就像当兵打仗,俗话说"养兵千日,用在一时",平时对数据中心各个方面进行了精心的检查和熟悉,对整个数据中心状况了如指掌,那在数据中心发生故障时,才能迅速找到痛点,明确故障原因,并采取恢复措施.一个数据

数据中心运维工程师必备技能

运维的工作是数据中心里最为重要的一部分工作,在整个数据中心的生命周期里,持续时间最长,拥有一批高水平的运维工程师是数据中心长期稳定运行的法宝.虽然数据中心的运行故障不可避免,但通过有效运维,可以大幅降低故障发生的频率,并在出现故障的时能够有效及时地恢复业务.在这些过程中,运维工程师的水平起到了至关重要的作用.作为数据中心里的一名运维工程师,应该掌握哪些技能,才能在工作中游刃有余.要知道数据中心里有很多设备,而作为一名运维工程师不可能,也没有必要全部掌握,要懂得应该掌握哪些技能,一些基本命令和重要

北京供销大数据集团探索数据中心运维“新趋势”

<企业网D1Net>3月31日(北京) 近日,以"突破·重塑"为主题的2017年数据中心设施论坛(北京站)在北京万达索菲特酒店召开.本次大会由中国互联网协会数据中心运营工作组主办,聚焦数据中心行业热点话题,旨在为数据中心从业人员带来国内外领先的技术理念和最佳实践.其中,运维管理,是决定数据中心项目成功与否的关键要素,也成为本次参会者关注热点.作为国内大数据基础平台的领军企业,北京供销大数据集团(简称"SinoBBD")受邀参加此次大会.集团IDC事业部机