1.路由器状态
弄清楚路由器发生故障时处于什么状态,才能进行下一步操作。最直接的方法就是观察路由器上各种指示灯的工作状态,如果你不知道他具体代表什么意思,可以查看相应的用户手册。使用命令行界面和路由器直接对话能够得到更详细的信息,常见的路由器都可以使用“show”或“display”就可以显示路由器当前的工作状态和配置信息。总之弄清状况是一个最基本的要求。
2.正常情况应该得到什么结果
你首先应该明确你想让路由器做什么,并按照你的想法来配置路由器,以确认路由器应该可以实现什么功能。例如,你应该能ping通指定接口的地址吗?一个广播网上OSPF所有邻居应该是Full吗?在你调试完路由器后应该对这些问题能够正确回答,确认你想要的东西。
3.可能造成某种错误的原因
回答这个具有挑战性的问题光有勇气是不够的,更需要学识和经验。无论那种错误现象,其原因可能有多种,可能是一种故障,也可能是多种故障叠加。当然,对原因的全面可靠列举,需要对特定网络和设备的状况做全面的了解。你的知识水平和经验在此展露无遗。
4.排除假象,寻找真凶
对于一个故障,形成它的“原因”会有很多种,但并不意味着所有“原因”都发生问题。所以排除法就是最好的排错选择,我们可以归纳出下面的这种过程框图对它加以回答。
一个合格的网络工程师应该在处理故障的时候不断向自己提出问题,并且冷静地加以分析,最终提出方案并细心地逐一检验,最终解除故障,进一步增加自身的维护经验。
路由器故障排除理论
单机故障还是网络故障?
单机故障一般与设备以及附件的物理故障相关,比如电源的问题导致设备运行不正常,线缆的原因导致路由器接口不能正常检测到信号。软件处理存在缺陷也属于单机故障的范畴,假设处理过大的NAT HASH表或路由表,内存耗尽导致路由器瘫痪。
路由器是网络互联的核心设备,所以不得不与整个网络相关联。比如,一个办公网络通过PSTN或ADSL拨号的方式访问Internet,需要正确地安装路由器并连接外部线缆,对路由器进行简单配置包括拨号程序配置,同样需要终端主机指定网关和DNS的地址。另外一方面,日益复杂的网络应用环境对网络设备的排错提出了更多的要求。所以在故障处理中,不论对于连通性的故障还是性能上的问题,都要全面系统地了解网络情况,进行综合性分析。
路由器的物理故障
路由器的安装和使用注意事项应该严格按照安装手册进行。安装前应检查安装场所的温湿度、洁净度、静电、干扰、防雷击等要求是否满足;安装后应检查电源的输入电压幅值、频率、中性点的连接及保护地、接地电阻等是否满足要求。
安装后无法使用
*线路连接问题。如线路阻抗不匹配、线序连接错误、中间传输设备故障。
*与其它设备配合有问题。
*接口配置问题。
*电源或接地不符合要求。
*在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。
使用过程中发生故障
*电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。
*传输线受到干扰。
*中间传输设备故障。
*环境的温湿度、洁净度、静电等指标超出使用范围。
在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障。
病毒攻击引起的故障
网络环境变得复杂后,病毒攻击已经成为路由器排错和维护不得不考虑的因素。病毒和非法报文通过路由器转发,会占用路由器的大量资源。如果路由器的CPU 使用率过高,数据包丢包率高,你可以断开本地局域网,通过抓包等手段来判断是否有本地攻击的情况发生。根据这些攻击报文的特定在路由器上使用访问控制过滤非法数据包,一般会起到一定的效果。当然,最根本的解决方法是对本地计算机进行彻底地杀毒,但工作量也是巨大的。
排错工程是个复杂的工程,需要管理员有深厚的知识基础和技术水平,同时在处理十分复杂的故障时还需要耐心,细心和清晰的逻辑思维。在排错的过程中同时增加了管理员的经验,能为以后的工作提供帮助,使排错工程更加高效,更加正规,管理员同样能得到职业的满足感。