1.1 应用维护方法
CCNP TSHOOT(642-832)学习指南
网络支持和网络维护是网络工程师的两大职责,网络维护的目的是保证网络的可用性,将服务中断时间降低到可接受的程度。网络维护工作包括日常的计划任务,如备份或升级网络设备或软件,结构化的网络维护方法可以为大家提供方法指南,以最大化网络可用时间、最小化计划外网络宕机时间,但具体选用何种技术则受到每个企业的维护策略和维护流程以及个人经验和喜好等因素的制约。网络支持工作主要是故障驱动型任务,如对网络设备或链路故障做出响应或者为有需求的用户提供帮助等。网络管理员必须评估各种常见的网络维护模型和网络维护方法,并选择最适合本企业的网络维护模型和维护规划工具。
1.1.1 维护模型和维护方法
一名典型的网络工程师的工作内容通常包括网络设备的安装、实施、维护和支持,但确切的工作内容则与各个企业组织的规定相关。对不同的企业组织来说,网络工程师的工作可能包括下面部分或全部任务。
- 与网络设备安装和维护相关的任务:包括安装网络设备和软件、创建并备份设备配置及软件等任务。
- 与故障响应相关的任务:包括为遇到网络故障的用户提供支持、检测与排除设备或链路故障、替换故障设备、恢复备份等任务。
- 与商业流程相关的任务:包括文档化、一致性审计以及SLA(Service Level Agreement,服务等级协定)管理等任务。
- 与安全相关的任务:包括遵循和实施安全流程及安全审计等任务。
网络工程师不仅要理解本企业组织规定的网络维护范畴及其相关任务,而且还必须掌握执行这些网络维护任务所需的策略及流程。对很多小型网络来说,网络维护工作通常都是故障驱动型的(interrupt-driven),例如,当用户遇到问题时网络工程师才开始帮助用户解决问题,或者当网络应用出现性能故障时,网络工程师才去升级中继链路或网络设备,或者是接到安全故障或安全事故报告后,网络工程师才去查看并改善网络的安全能力。这种故障驱动型网络维护是一种最简单的网络维护方法,具有以下明显缺点。
- 可能会忽视、推迟或遗忘那些对网络健康性很重要的长期维护任务。
- 可能不会按照维护任务的优先级或紧急程度来执行维护工作,而是按照接到网络故障的顺序来执行维护任务。
- 由于不能防患于未然,因而网络宕机时间可能更长。
虽然无法规避故障驱动型网络维护工作(因为故障的发生是无法预先规划的),但是通过主动地监控和管理系统,完全可以减少故障驱动型工作的次数。
与故障驱动型维护模型相对应的是结构化网络维护模型。结构化网络维护模型的特点是预定义与规划网络维护步骤和维护流程,这种主动性的网络维护方法不仅可以降低用户、应用及商业故障的频率及数量,而且能够更有效地减少网络事件的响应时间。与故障驱动型网络维护方法相比,结构化网络维护方法的好处如下所示。
- 减少网络宕机时间:在故障出现前发现并阻止故障的发生,从而能够使网络不宕机或减少网络宕机时间。网络工程师应该尽量增加网络的MTBF(Mean Time Between Failures,平均故障时间),即便无法避免网络故障,也应该通过正确的流程和适宜的工具来减少故障修复时间,努力减少MTTR(Mean Time To Repair,平均故障修复时间)。最大化MTBF和最小化MTTR也就意味着可以最大限度地减少经济损失、提高用户的满意度。
- 性价比更高:通过性能监控和容量规划,可以为当前及未来的网络需求做出足够的预算。选择正确的网络设备来满足容量需求也就意味着拥有更好的性价比(从设备生命期角度来看),而且较少的维护成本和网络宕机时间也能提高性价比。
- 更好地满足商业需求:结构化网络维护框架并不根据网络事件来制定任务优先级并分配预算,而是基于这些任务对商业行为的重要性来分配时间和资源,例如,绝对不在关键的工作时间内进行网络升级或执行大量的维护工作。
- 更高的网络安全性:关注网络安全性是结构化网络维护工作的一部分,如果攻击防范技术未能阻止攻击行为,那么攻击检测机制也会发现攻击行为,这样一来,网络支持人员就可以通过日志和告警知道该攻击行为。通过网络监控机制,可以发现网络中的脆弱性,从而可以做好增强网络安全性的规划工作。
包括ISO(International Organization for Standardization,国际标准化组织)、ITU-T(International Telecommunication Union Telecommunication Standardization sector,国际电信联盟电信标准化部)和Cisco Systems在内的很多企业组织已经定义了一些众所周知的网络维护方法,网络支持工程师必须深入研究这些维护方法并运用到现实网络环境中。下面列出了这些众所周知的网络维护方法。
ITIL:ITIL(IT Infrastructure Library,IT基础设施库):该IT服务管理框架定义了一套能够提供高质量IT服务以满足商业目标要求的IT管理最佳实践集合。
FCAPS:ISO定义的FCAPS将网络管理任务分为以下几类。
- 故障管理。
- 配置管理。
- 记账管理。
- 性能管理。
- 安全管理。
注意:
FCAPS是上述5种管理任务的首字母缩写。
TMN:ITU-T以FCAPS为基础,整合并重新定义为TMN(Telecommunications Management Network,电信管理网)。TMN是一个概念性的电信网管理框架,要求建立一个管理网并与电信网进行多点互通,以完成手工或自动维护任务。
Cisco生命周期服务(Lifecycle Services):Cisco生命周期服务维护模型清楚地定义了网络中Cisco技术生命周期的各个阶段,包括准备(Prepare)、规划(Plan)、设计(Design)、实施(Implement)、运行(Operate)以及优化(Optimize)阶段,因而也经常将Cisco生命周期服务模型称为PPDIOO模型(基于网络生命周期的6个阶段),而网络维护工作通常被认为是整个生命周期中的运行和优化阶段。
1.1.2 确定支持维护模型的流程和工具
在确定采用结构化维护方法时,要么从这些众所周知的维护模型中选择一种,要么根据自己的需求将各种维护模型整合为自定义模型。例如,如果某企业选择FCAPS模型,那么就要完成以下5种主要管理任务。
- 故障管理:故障管理负责发现并修复网络故障,虽然某些故障管理工作无法完全避免事件驱动,但故障管理的关注重点是预防性管理,需要采取正确的维护步骤以防止网络宕机以及故障的重复出现,从而在最大程度上减少网络宕机时间。
- 配置管理:配置管理负责硬件设备(包括线卡、模块、内存及供电系统等组件)和业务应用的安装、标识及配置。配置管理还包括软件及固件管理、变更控制、目录管理以及设备部署状态的监控和管理等内容。
- 记账管理:记账管理负责在企业用户之间优化资源分配,通过最有效地使用网络可用资源,帮助企业减低操作成本。此外,记账管理还负责部门/用户的成本分配和计费等管理任务。
- 性能管理:性能管理负责管理整个企业网的性能,主要关注于最大化吞吐量、找出网络瓶颈以及制定增强网络性能的计划等任务。
- 安全管理:安全管理负责确保CIA(Confidentiality,Integrity, and Availability,机密性、完整性和可用性),保护网络不受未授权访问以及物理和电子破坏。安全管理利用AAA(Authentication, Authorization, and Accounting,认证、授权和记账)以及加密、网络边界保护、入侵检测/入侵防护、安全监控和报告等机制来确保CIA。
选定了网络维护模型之后,接下来需要将理论模型映射为实际可操作的结构化网络维护流程。以图1-1为例,该例为FCAPS模型中的配置管理定义了4种配置管理流程。
定义了维护步骤和维护流程之后,就能很容易地判断出需要在网络管理工具箱中为这些维护流程配置哪些维护工具。为此,接下来需要根据自己的预算条件选择性价比最好的网络管理和支持工具箱,图1-1列出的网络管理工具箱(图中右侧)提供了4种工具,每种工具针对一种已定义的维护流程(图中中部)。需要注意的是,故障驱动型网络维护方法常常会导致网络管理工具箱杂乱无章,这是因为该维护方法总是根据特定需求来配置维护工具,而不是从整体上考虑选择一套支持所有网络维护流程的工具箱。