数据中心网络运维一指禅

数据中心网络如何高效运维?这个问题经常困扰着数据中心的运维技术人员,运维技术人员疲于处理各种网络故障、变更、检查等事物,没有时间学习新技术,网络运维技术人员的工作往往做得非常辛苦,经常加班加点处理,然而问题似乎越是解决反而越多,陷于一个恶性循环,运维的人员不停地加班,问题不断出现,不断被解决,似乎永远都有处理不完的事情。实际上,网络运维也是一门学问,已经演化成为一门技术学科。有些人整天忙于处理这样那样的问题,但是数据中心网络依然问题不断,而有的人似乎整天也没有很多事情,数据中心业务有条不紊地进行着,而两个数据中心的设备组成几乎一样,这显然就是运维的问题。并不是整天加班处理各种网络问题的运维技术人员就值得表扬,要深入考虑下其运维的效率是否出了问题,怎么会有这样无穷尽的问题,一点得不到收敛,所以高效运维的技术关注效果而不是过程,过程再辛苦没有好的结果也是徒劳,高效的运维就是用最少的工作量换取最佳的网络稳定运行,本文将谈谈如何进行网络运维。

关于网络运维的书籍也不少,有的从技术方面阐述,给出各种常用网络设备的使用方法、维护技巧;而有的则侧重从管理方面入手,强调对人、对设备的管理,通过完善的管理制度达到提升运维效率的目的。本文将根据这两个方面,并结合多年亲身的网络运维经验,给出一些网络运维的思路,篇幅有限,本文不对具体技能做讲述,而是提供一种运维的思想,希望可以对数据中心网络运维技术人员的工作起到画龙点睛的作用。首先,在做数据中心网络运维前要做大量的准备工作。不管是新手还是老手,都需要对数据中心的网络构成、业务走向、设备互连关系等了如指掌,这些数据要熟记于心。平时多看多记,将这些数据通过表格整理好,便于随时查找,对于任何一次网络变更都要做记录,并及时更新这些数据,确保这些数据是准确的。常用的网络操作命令要反复记忆,不同设备的命令千差万别,无任何规律可言,没有太好的办法,只能死记硬背。如果遇到了突发故障,或者领导要求紧急变更一下网络,这时还需要去查找各种网络资料,对应用配置不熟练,这不是很好的运维技术人员。这一点说白了就是需要运维技术人员要能吃苦,要耐心,对数据中心网络环境相当熟悉。我们知道领兵打仗就要对地形非常熟悉,网络运维也是如此,要对整个数据中心网络环境非常熟悉,将整张网络都印到了脑海里,否则掌握再好的网络技术也无的放失;其次,网络技术是一个大染缸,仅网络协议就有数百种,再加上不同网络设备实现上的差异,一个人要掌握全部协议根本不可能。所以网络运维技术人员一定要懂得抓“重点”,纵然有很多网络协议,但是因为要适应各种各样的场景,在一个特定的数据中心里一般只要两三种网络协议就够了,所以只要将自己数据中心需要的网络技术吃透、玩精通足矣。比如早期的数据中心网络基本靠OSPF、BGP、VRRP、LACP几大网络协议运转,掌握这几种协议就可以吃遍天下的数据中心。如今,数据中心技术也在不断发展,VXLAN、TRILL、虚拟化等技术都涌现出来,掌握了这些新技术依然可以让数据中心充满活力,所以数据中心网络技术人员一定要以自己的数据中心为基础,吃透自己数据中心所用到的各种网络协议技术,不管哪种协议出了问题,都能按照自己的理解去排查问题,有一套应对的措施,而不是乱做一团,不知所措;第三,数据中心与网络设备商关系非常重要,数据中心运维技术人员对网络技术再精通,也无法了解到网络设备内部的实现,很多时候都需要设备商来分析问题,给出答案,所以要善于与网络设备商打交道。作为甲方,运维技术人员有权力向网络设备商获取关于设备内部各种功能实现、配置手册、操作手册等资料,有了设备和资料,一定要认真学习,有疑问的地方及时向设备商人员咨询。当然设备商也会考虑自己的利益,服务也是要占用成本支出的,为了能获得更好的服务,数据中心也应该适当地购买一些服务,比如设备巡检服务、维保服务、原厂工程师驻地服务等,购买这些服务的好处就是可以得到及时的技术交流。在出现一些重大网络问题时,可以得到设备原厂工程师的积极响应,并帮助数据中心迅速恢复业务;最后,数据中心网络不是静止的,一成不变的,网络技术也在不断地更新与发展。现在的网络设备和电脑一样,过不了三年就面临着淘汰,所以数据中心要想不断进步,就需要掌握新技术,学习新知识。作为网络技术人员,要有全球化的视野,掌握世界最新数据中心网络技术动态,每一个数据中心都有着自己这样那样的问题,很多问题都要未来的新技术来解决。为了提升数据中心的竞争力,引入新的网络技术是一个重要手段,所以网络技术人员应该多出去走走,向周围优秀的数据中心学习,与数据中心运维技术人员进行多交流,虽然可能不是同一个数据中心的,但时常也会面临相同的问题。现在每年都有数据中心论坛、数据中心各种技术研讨会、数据中心联盟等各种会议,经常参加这样的会议,可以扩大自己的视野,也可以在这里找到解决自己数据中心问题的方案。总之,数据中心运维技术人员要多看、多学。

数据中心网络运维一指禅,对如何进行高效运维给了几点思路,这里并没有详细地去告诉您具体维护的知识,只是给了学习的方向。不过有了正确的方向是最为关键的,因为一旦走错了方向,那之后再努力也是徒劳的。

作者:何妍 

来源:51CTO

时间: 2025-01-20 15:36:51

数据中心网络运维一指禅的相关文章

云数据中心网络运维的苦与乐

前几年大家讲 SDN 比较多的是怎样利用控制器,像 OpenDayLight.ONOS 这些东西,其实在讲怎样做一个 Driver.怎样做控制.大概从去年开始,SDN 开始跨入应用的时代,现在大家更多地在讲实际要做的事情.应用场景是什么.由于大家对 SDN 有多种不同的理解,在本文中我想把话题聚焦一下,落到云数据中心的网络运维这个点上,分享一些运维中的实际例子.没有大的篇章,只说说我们遇到的那些苦与乐. 因为本文话题的场景是云数据中心,所以我们有必要先看一下云数据中心里面的网络是什么样子. 简单

云时代如何简化数据中心网络运维?

SDN,在经历了犹豫彷徨.百家争鸣之后,目前已成为企业CTO的坚定选择. SDN时代的网络展现出两面性:一方面让客户使用更加简单,另一方面却让运维更加复杂.而当前,整个行业的目光多聚焦在前者而忽略了后者. 随着SDN的部署如火如荼,一丝忧患也隐隐浮现.2015年12月,管理行业研究机构EMA(Enterprise Management Associates)针对100多家企业的调查结果显示:70%左右的客户对于现有管理运维体系是否适用于SDN场景表示担忧.Gartner于 2015年7月发布的通

【博文推荐】如何做好大型数据中心的运维

什么叫数据中心?维基百科给出的定义是"数据中心是一整套复杂的设施.它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接.环境控制设备.监控设备以及各种安全装置".在云大行其道的今天,随着数据中心建设规模的不断扩大,新技术的层出不穷,数据中心变得越来越复杂.大型数据中心往往是由很多功能不一的单元系统组成,其运维工作需要具备方方面面的知识,包括硬件.网络.服务器.存储.安全以及业务上的东西,需要一体化联动地去做好运维工作. 当一个数据中心的规模非常大,

如何做好大型数据中心的运维

什么叫数据中心?维基百科给出的定义是"数据中心是一整套复杂的设施.它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接.环境控制设备.监控设备以及各种安全装置".在云大行其道的今天,随着数据中心建设规模的不断扩大,新技术的层出不穷,数据中心变得越来越复杂.大型数据中心往往是由很多功能不一的单元系统组成,其运维工作需要具备方方面面的知识,包括硬件.网络.服务器.存储.安全以及业务上的东西,需要一体化联动地去做好运维工作. 当一个数据中心的规模非常大,

如何做好大型数据中心的运维工作?

随着数据中心建设规模的不断扩大,新技术的层出不穷,数据中心变得越来越复杂.大型数据中心往往是由很多规模庞大的集群系统组成,其运维工作需要具备方方面面的知识,包括硬件.网络.服务器.存储.安全以及业务上的东西,需要上下打通地去做运维工作. 当一个数据中心的规模非常大,面临的挑战和问题也比较超前,很多在小环境小体系下不是问题的问题在这样的规模下也就凸显出来了,所以要做好大型数据中心的运维工作,对整个数据中心技术体系的系统学习就要花费比较长的时间,只有对这个数据中心整体非常了解,才能有针对性地制定一些

数据中心智能化运维之路

在新技术层出不穷的今天,数据中心运维工作总是得不到足够的重视.数据中心在不出任何问题的情况下,对运维的工作是持默认态度的,但如果出了一系列问题,付出的工作可能毁于一旦,工作的绩效有点要拼人品的味道.其实,正如那句话所说的"古罗马不是一天建成的"那样,数据中心发生了故障,甚至是致命的故障,很多时候并不是突然就发生的,是平时工作的长期忽视才最终酿成了悲剧.如何做运维才能体现出工作的价值,如何做运维才能降低数据中心出现故障的风险,在这样的需求背景下,智能化运维应运而生. 数据中心运维工作主要

大数据对网络运维意味着什么?

2016年对于SDN来说无疑是利好的一年,在金融.电信.互联网等行业SDN产品和解决方案开始规模化部署,许多传统行业对于SDN的需求也初现端倪.<2016-2017年中国SDN市场发展状况白皮书>显示,2016年中国SDN软件市场(主要指SDN控制器及相关的软件解决方案与服务)规模达到了7.2亿元,比2015年增长30.9%,预计到2021年,市场规模将达到46.7亿元.同时,白皮书也指出了企业传统网络架构面临的四大难题. 难以满足业务灵活部署的需求 难以满足业务资源整合的需求 难以满足场景化

数据中心网络操作的可视化之路

众所周知,数据中心网络设备都是采用的命令行操作界面(CLI),这种方式需要操作者有着非常专业的技术知识才能使用,而不像Windows可视化的系统,交互界面友好,操作方便.网络设备从以太网技术出现发展到现在几十年,却从来没有真正实现图形化的界面,原因何在呢?本文将带领大家去探求数据中心网络设备操作的可视化之路.PC诞生之初也是采用的命令行操作界面,随着图形化技术的发展,CPU.内存.显卡等部件处理能力的提升,可视化的操作界面成为PC的主流,尤其是Windows系统.Linux系统则两者兼具,以命令

步入云时代 H3C推数据中心网络技术认证

云时代的网络建设不仅提供了前所未有的市场机遇,也向所有数据中心的运维建设人员提出了前所未有的挑战.H3C在北京.杭州.深圳三地隆重发布了国内首个重量级的数据中心网络技术认证--H3CSE-Data Center(H3C认证数据中心网络高级工程师) 金秋十月,"领跑新时代.笑傲云时代",H3C在北京.杭州.深圳三地隆重发布了国内首个重量级的数据中心网络技术认证--H3CSE-Data Center(H3C认证数据中心网络高级工程师).在发布会现场,该认证受到与会的互联网.金融等用户.渠道