如何改变运维在数据中心中的地位

运维是数据中心里最为重要的工作,但却常常被人所忽略,这主要原因在于运维的工作是花钱部门,并且投入资金短时也看不到效果。而在运行出了故障时,又要运维被黑锅,将矛头指向了运维。实际上,一个数据中心运行的是否稳固是从其最开始建设就一定程度上决定了,就像一个人一样出身是非常重要的,虽然并不能代表全部。一个数据中心在最开始建设的时候要求就很高,各方面建设非常标准,冗余和备份系统非常完善,这样的数据中心后期运维也会很轻松,故障发生概率很低,即便出了故障也有备份系统正常接管业务,确保业务不受任何影响。不过,就算是最先进的数据中心,也离不开运维的工作,那些声称自己的数据中心是无人值守的,虽然不需要有人24小时在机房监控,可也离不开人管理,还是需要运维的人员周期性地对数据中心进行巡检,及时发现隐患。可以说:“运维工作是数据中心的神经和大脑,IT设备等基础架构是其骨架,而各种接口就是传感器,运维工作可以控制和分析整个数据中心的运转情况,保障数据中心良好运转”,运维的工作重要性不言而喻。

既然运维的工作对于数据中心这么重要,为何长久以来,并不能得到重视呢?首先是传统的“重建设,轻管理”的IT思维禁锢着数据中心运维的工作价值发挥和潜力发掘。在复杂多变的市场环境,快速发展业务为先,只有建设格调比较高的数据中心才能吸引到客户使用,所以数据中心将心思几乎全部用在建设上面,以便吸引到更多客户使用;其次是运维的工作难以量化,不像数据中心建设取得的成果立竿见影。当一个数据中心建设完成后,容纳多少服务器,能开启多少业务,都是可以预知的,很容易获得高层领导的认可。也正因此如此,数据中心架构师的收入要比运维工程师高出很多。的确,架构师只有在数据中心建设设计时投入精力比较多,可一旦建成就和架构师的关系不大了。一个数据中心建设之后,往往有漫长的生命周期,使用二三十年是常有的事儿,从时间长度上来说运维的工作伴随着数据中心的整个生命周期中,可让人印象深刻的一定是其发生的历次故障事件,这本身实质是对运维的工作否定;第三是运维是要花钱的,数据中心随着运行时间的延长,内部各个零件都是失效的可能,数据中心经常要进行零件的采购,这些都需要钱,还有运维的人员工资,各项技术培训和管理支出。总之,各种各样的运维费用让数据中心有时也喘不过气来,运维费用过高往往拖了数据中心建设和扩容的后腿,这些账都要算在运维头上,抱怨运维花钱太多,又不能直接产生效益,数据中心对待运维的态度多是能省则省。这样一来,在数据中心里运维工作开展的并不顺利,很多数据中心运维也是得过且过,只要不出问题一切都好,能不能出问题要看老天了。

冰冻三尺非一日之寒,要想一下子改变当前数据中心运维现状很难。不过,随着客户对数据中心依赖程度的增加,数据中心的运维工作质量将直接影响到客户的业务、市场甚至是形象等,数据中心宕机故障有可能导致数千万元的损失,甚至被监管机构处罚的例子屡见不鲜。在这样的严峻背景下,运维的工作逐渐浮出水面,确保数据中心不出故障仅仅是运维工作的一部分,远远不是全部。运维的工作重点应是如何定义数据中心工作与服务关系,如何建立与客户之间的服务水平协议,如何快速地支持客户业务的需求,如果规划好数据中心建设,更好地为业务部门提供发展动力等。要进行高效运维,而不是将精力全部放到设备运维上去。一定有人会问“不做设备运维,那出了问题怎么办,谁也无法保证设备不出问题”,是的,任何设备都有出故障的可能性,这就需要建设数据中心时做好系统备份,从服务器、网络、存储等都需要备份,甚至数据中心之间也可以备份,这样数据中心出了什么故障都不怕,业务自动切换到其它备用系统上去,以此来确保数据中心业务不受影响,至于设备故障原因交由设备厂家来查,分析出原因后确保下次相同问题不再出就可以。当然数据中心设计的再好,也可能存在漏洞,尤其是在不断扩容和运维过程中经常会出现这样那样的问题,这就需要不断优化数据中心系统,确保发展业务的同时,系统稳定性不受到任何影响。随着云计算和大数据的发展与普及加速了运维趋向成熟,基本上已经颠覆了小企业的运维模式,一场新的运维变革运行悄然兴起。向运维的工作要利润,向运维的工作要效率,是对运维提出的更高要求。新技术的到来势必砸掉大多数不思进取的运维人员的饭碗,普通运维的人员一定要具有创新思维,建设自动化运维系统,提升运维工作效率,否则丢掉饭碗只是时间问题。运维技术人员要有一种职业危机感,不断提升自己的技能水平,要有全局的视野,而不是局限于某些设备,某一类技术。运维的人员还需要不断学习,接受新技术,学会使用一些好用的运维工具,或者自己具备开发运维工具的能力,通过使用这些工具来提升运维的工作水平。以前,运维的人员都是作为数据中心运转幕后工作者,很难为外界所知,甚至数据中心内部管理者也未曾真正关注过。现在,数据中心发展对运维提出了更高要求,需要运维人员走到台前,这给了运维改变历史命运的机会,这样改变运维在未来数据中心中的地位。

作者:佚名

来源:51CTO

时间: 2024-10-30 21:47:20

如何改变运维在数据中心中的地位的相关文章

网站运维优化过程中遇到的优化挫折分析

网站运维优化过程中遇到的优化挫折分析 众所周知,网站优化是中小企业选择互联网营销最重要的手段之一,互联网的飞速发展,导致人们对于搜索引擎的需求激增,不可避免的网站优化工作也应运而生,在优化网站的同时,我们不仅仅要认识搜索引擎带来精准流量和转化率的同时,必须时刻警惕,网站优化过程中会面临的种种不稳定性因素,好了闲话短续今天今天主题,网站运维优化过程中遇到的优化挫折分析. 第一,高质量的原创文章撰写难度分析.不可否认很多优化人员都是建站或者程序出身,自身文案水平会存在一些瑕疵,加之互联网产品大同小异

透视数据中心中的25G、50G和100G技术

企业和云级网络的数据中心中各种"G"比比皆是,是时候搞清楚他们的性能了. 云计算的兴起和数据中心的扩展推动着最新的以太网速度升级,而基于云技术的大数据也已然增加了运营商的工作负载.为满足这一需求,数据中心通过增加与现有基础设施并行的带宽能力实现扩展.预期中25G和100G以太网部署的快速增长就是这一趋势的明证. 为了能够处理不断增大的数据负载,业界最大规模的远距离云企业已纷纷与他们核心网络的数据中心运营商一起,共同转向使用 100G以太网架构.不过大多数运营商认为,对服务器连接来说,1

在数据中心中使用可再生能源:PUE=总设施电源/IT设备电源

今年年初,社交网络巨头Facebook结束在俄勒冈州派恩维尔的最新的数据中心的建设.Facebook高管在新闻发布会上宣称这个新的设施在数据中心设计和运营方面创造了环境保护责任的新标准.这些标准采用了可再生能源策略,包括雨水再利用.太阳能和热量再循环. 到目前为止,IT行业环保努力的节能优势是明显的,尽管一些企业并不总是采取这些做法.由于电价上涨,甚至象征性的努力也会显著节省成本. 但是,显而易见的是节能在未来几年里将变得更加重要.随着IT马力的增加,数据中心更是如此.因此,高效率的数据中心运营

高密度光纤链路在数据中心中的应用 中篇

危险的跳线 最基本及必需的组件,跳线,是一种很容易管理的系统, 但是同时它也可能是最 复杂及最麻烦的东西.通常的问题都是这样:这条跳线的另外一端在 那里?如果(跳线)没有插上会有什么坏的影响? 我要如何或者是在那里才能提供 新的线路?一个健全的标签及文档系统,是第一重要的事情,但是大部分的跳线,特别是在高密度应用的区域,经常是出乎用户逻辑控制之外.端口密度将会因适合光纤接口类型而受到限制,那些SFP光纤转换器,并且是双工的LC接头,近年来已经减少了光纤接头的体积并提高了二倍的光纤密度.相对的,那

漫画图解IT人最在乎的三样东西,没想到运维狗又中枪了

中国有逾千万的IT从业人员 大家经常戏称他们为"挨踢"人 那么这些人群有些什么痛点呢? 看看下面三组漫画吧 01 关于女朋友 02 关于工资 03 关于时间 据说IT人22点下班都算早的 其中又以运维汪加班最为严重 但是! 品高云V7.0隆重推出 深度自动化运维服务 平台可根据预设的运维方案和常用指令 自动执行运维功能 充分解放运维压力 每天按时下班不用愁 下面就来看看怎样部署吧 深度分析品高云V7.0 05 深度自动化运维 云计算时代 IT 运维的发展趋势 目前,云计算已经从概念阶段

运维好数据中心的四大法宝

对于数据中心,运维工作的重要性不言而喻,在数据中心生命周期中运维管理是历时时间最长的一个阶段.数据中心运维的工作主要是对数据中心各项管理对象进行系统的计划.组织.协调与控制,是信息系统服务有关各项管理工作的总称,具体包括对机房环境基础设施部分的维护,系统与数据维护,管理工具的使用,人员的管理等方面.投资巨大的数据中心,为了能够尽快得到收益,就需要在运维的工作上多下工夫,切勿进入"一流设备.二流设计.三流运维"的不良运营之中,高品质数据中心运维的工作至关重要.那么如何才能提升数据中心的运

数据中心中的流量该如何保护?

数据中心安全的原始模型是基于安全威胁是来自外部的假设.故而保护数据中心的这些基础设施的安全架构都主要是专注于在数据中心和外部世界之间建立一个网络外围边界.而这一外围边界的基础便是一道防火墙,其将负责检查所有的南北走向的流量,这些流量主要是在数据中心和互联网之间传输.防火墙负责在这些数据流量中寻找违反安全管理策略和所存在的其他可疑活动的迹象.然后,其便采取相应的措施,如阻止流量传输.标记额外的附加信息,并通知操作管理员. 尽管数据中心仍然需要排查南北走向的流量,以及时发现外部安全威胁,但现在的安全

保护数据中心中的流量

部署下一代的防火墙可以保护进出数据中心.以及在企业内部的服务器之间传输的网络流量. 现如今的企业组织可以说是采用了各种各样的数据中心架构.有些企业组织选择为每款应用程序利用专用的物理服务器,运行一个企业私有的.单一组织的设施.其他有的企业组织则选择了一款为数百或数千家客户提供虚拟服务器的公有云设施.所有这些数据中心都有一些共同点:均需要保护他们的应用程序和数据的安全,进而免受越来越多的复杂的网络安全的威胁. 任何数据中心安全策略的关键部分都是通过采用了下一代的物理和虚拟防火墙的协同工作,来监控和

数据中心中UPS电源技术解析

摘要:GB50052---1995<供配电系统设计规范>中的强制性条文规定:"一级负荷中特别重要的负荷,除由两个电源供电外,尚应增设应急电源."柴油发电机组可以作为应急电源,但其反应速度太慢,要15,才能恢复供电,这与现代化的通信及网络信息数据流无法匹配.因此,工程中的一些重要部门和系统必须考虑不间断电源UPS供电. 1.交流不间断电源系统供电 在下列情况下应设计并采用交流不间断电源系统供电: (1)对供电可靠性要求较高,采用备用电源自动投人方式或柴油发电机组应急自启动方式