单向链路检测模式消除交换机误诊断

  大部分交换机都会有自我诊断的功能。当交换机或者交换机端口由于某些原因出现故障的时候,都会通过指示灯来告知管理员存在的错误。不过有些时候交换机也会存在误诊断的情况。如交换机的端口工作指示灯明明表示正常,但是用户却反映网络不通。如果只是普通的用户,问题还不是很大。但是如果这个端口恰巧是用来进行备份的,那么情况就会比较糟。为了避免这种情况,在实际工作中很多网络管理员都喜欢采用交换机的UDLD模式来消除交换机的这种误诊断。

一、什么情况下会出现误诊断?

误诊断的情形主要是即使当链路或者交换机的端口指示灯正常的(即端口的状态是UP的),但是接口仍然无法正常传递数据流量。通常情况才将这种错误称之为单向链路。一般情况下,当出现接口故障、软件故障、硬件失效或者其他异常原因的时候,就会出现这种错误。凭现在的技术手段,交换机还不能够从根本上避免这种错误的发生。为此只有采取其他的方式,加强对交换机端口的检测,以尽早发现这种错误。在思科系列的交换机上,就采用了UDLD模式来解决这种情况下的误诊断。

UDLD从理论上来说,其是在第二层工作的协议。不过从实际情况来看,其往往跟第一层的内容有很深的关系。也就是说,UDLD模式不光光在第二层运作,其还会跟第一层的相关机制协同工作,才能够完成。其主要的思路就是UDLD协议运行在第一、二层之间,最终确定链路的实际工作状态。当发现有 “链路UP状态正常,但是没有传递流量”的时候,UDLD协议会马上报警。具体的说,在第一层中通过自动协商功能来观测物理信令等相关的参数运作。而 UDLD协议则会完成一些自动协商机制不能够执行的任务。让自动协商发现物理信令有异常的时候,不会自动将端口从UP状态转换为其他状态,从而导致了单向链路的故障。而UDLD协议能够接受来自自动协商机制传递来的参数,然后再发现故障的时候及时的将交换机端口处于关闭状态。可见,UDLD模式所采用的不只只是一种协议,而是UDLD协议与自动协商机制相互作用的结果。如果网络管理员要启动UDLD模式的话,那么就必须要同时启用UDLD协议和自动协商机制,在第一层与第二层中通过他们的各司其责、协同工作,来防止物理上或者逻辑上的单向连接,从而从根本上消除交换机的误诊断。

网络管理员需要明白的是,UDLD并不是交换机原有诊断体系的补充,而是一种独立的诊断方法。也就是说,它是从另一个角度对交换机各个端口的运行状态进行自我诊断。两者之间基本上没有冲突或者重叠的地方。在实际工作中,传统的诊断方法与UDLD模式经常是同时使用。

二、合理配置UDLD模式下的各种参数

如果同时启用了UDLD协议与自动协商机制,就启动了UDLD模式,在这种情况下,交换机的某个接口会定期的向邻近的端口发送UDLD协议数据报。在正常情况下,交换机的这个接口会在预定计时器到期之前接收到回应的数据包。如果在这个计时器到期之前,交换机发送UDLD数据包的接口还没有收到回应信息,则UDLD协议就会认为出现了故障,即发生了单向链路的故障(其实更加精确的说,应该是自动协商发现了这个故障并告知了UDLD协议)。当 UDLD知道这种情况后,会马上关闭有问题的交换机接口。

在UDLD配置的时候,首先需要考虑这个计时器。也就是说,将这个时间设置为多少为好。如果时间设置的比较短,不仅会造成不必要的数据流量,而且也有可能因为数据延迟等原因导致无法在合理的时间内接到回应的数据包。而如果将这个计时器的时间设置的比较长的话,那么就可能无法在短时间内发现问题。要知道,可能一分钟对于用户来说,没有多少感觉。但是对于数据网络传输来说,这个时间就很长了。默认情况下,这个计时器是15秒。在实际工作中,网络管理员可能需要根据不同的情况来合理设置这个参数。如需要根据企业网络的复杂情况、布线的长短来考虑。如根据以前的情况,企业可能经常会遇到网络堵塞等情况,而这种堵塞也是暂时的,那么要适当延长这个计时器等等。笔者的建议是在刚开始的时候可以将这个计时器设置的长一点,然后慢慢的减短。最后得到一个合理的数值。

三、提高端口的适用性

在采用普通接口的情况下,当某个接口因为接收不到UDLD回应消息时,接口就会关闭。这也有一种缺陷。如企业可能会有网络拥塞,如因为临时备份等等导致拥塞等等。此时在发送端可能无法在计时器到期之前收到回应的信息。那么遇到这种情况时,如果将交换机的端口就设置为关闭,显然就会引起不比要的麻烦。网络管理员希望能够给网络“改错”的机会。为此在原有UDLD模式的基础上,思科交换机又提出了积极UDLD模式的概念。两个模式的差异主要就在于后者给了网络一个改错的机会。

在积极UDLD模式下,当交换机接口发现无法正常收到UDLD回应信息的时候,并不会马上将这个端口设置为关闭状态,而会继续发送UDLD数据包。通常情况下,UDLD数据包会发送八次。如故发送八次之后仍然无法收到UDLD数据包的话,那么UDLD协议就会将这个端口状态改为Err- disable状态。如果在这个间断的时间内,发送端口能够收到任何一个回应信息,就会认为是正常的。很显然,如果采用积极UDLD模式,就可能有效的避免因为网络拥塞而导致的误判问题。

采用积极UDLD模式的另外一个原因就是路由黑洞。什么叫做路由黑洞呢?这个定义不怎么好说,笔者就举一个例子。如第3层或者路由接口正在经历单向链路时,此时接口汇保持在UP状态,所以交换机就会继续将流量转换到这个接口。但是最终的结果是数据包将永远达不到远端设备的对应接口之上。这就是路由黑洞的一个简单例子。如果采用传统的UDLD模式,还不能够很好的避免这种情况下。相反,如果采用积极UDLD模式,就可以有效的避免路由黑洞导致的网络故障。

积极的UDLD模式除了在发送信息的次数上比较特殊之外,还有以下两个特殊的地方。一是当链路的一侧端口发送拥塞时,积极模式的UDLD协议也会将端口设置为Error状态,并显示相关的措施信息。而采用传统UDLD模式对这种情况不会有任何反应。二是当链路的一侧端口处于UP状态,而另一侧处于Down状态时,如果采用的是积极UDLD模式,则会显示错误信息,并将端口设置为错误状态。而如果采用传统UDLD模式的话,则不会有任何反应。这也正是笔者上面所讲的通过积极UDLD模式来解决上路有黑洞的原因。

四、故障恢复后重新启动交换机接口

无论采用的是传统的UDLD模式,还是采用的是积极的UDLD模式,有一个共同点,即只要将端口设置为Error-disable状态后,即使故障解决了,交换机也无法自动恢复接口。换句话说,当出现这种情况时,网络管理员需要手工恢复接口。一般的做法是,先将端口利用命令shutdown关闭掉,然后再利用命令no shutdown进行启用。

总之,只要交换机支持,就启用UDLD模式,甚至可以启用积极UDLD模式,就可以有效的避免单向链路的误诊情况。特别是采用积极模式的 UDLD,那么路由黑洞这个网络难题也可以迎刃而解
 

时间: 2024-08-31 20:17:54

单向链路检测模式消除交换机误诊断的相关文章

数据中心网络里的链路检测技术漫谈

2017年1月14日,Ucloud云北京B区的业务发生了中断,中断的原因是运营商施工原因导致B区数据中心机房到北京核心汇聚点的两对光纤同时被挖断,导致业务中断.这让人想起了2015年5月的支付宝业务中断事件,也是运营商网络光纤被施工挖断导致,当时是四条大对数光缆中断.互连的光纤链路出现中断这类突发事件,如果没有一些备份和监控措施,就会导致业务受到影响.实际上,在数据中心内外部,类似于这样的链路故障问题时有发生,只不过这两个例子是影响比较大的.那么,数据中心怎么才能提前做好链路检测工作,避免发生类

无线干扰的检测和消除措施

WLAN已经不再仅仅是最初的一种简便的网络接入方式,企业的许多重要应用,诸如语音.视频.定位等服务都逐渐部署到无线网络上.即便是普通的网络访问,用户也是希望带宽越高越好.随着应用的增加, 无线干扰问题对网络服务的质量影响日显突出.无线干扰的检测大型的WLAN网络一般采用瘦AP架构.对无线干扰的检测和消减既可以利用提供接入服务的AP来扫描,也可以通过专门的设备组成的网络来进行,甚至还可以配合专门的手持RF设备来进行干扰定位.后两者属于频谱分析的范围.手持RF设备的定位,一般适用于小的网络或小范围的

《C语言程序设计进阶教程》一第3章 预防、检测及消除bug

第3章 预防.检测及消除bug 本文讲的是C语言程序设计进阶教程一第3章 预防.检测及消除bug,一些书中建议,软件应该是精心设计的.认真地编写且从不被调试.这些书不会说任何关于调试相关的内容.以我在编写程序.与学生一起工作以及与在软件行业人士交流的经验来看,即使软件是被认真的计划并编写的,调试也很难完全避免.某种程度上讲,调试就像是在编辑一篇文章.想要在不进行任何编辑的情况下写出一篇好文章是非常困难的.虽然不能完全避免调试,我们也不应该依赖它.有经验的程序员会仔细地防止出现bug,并尽早地发现

无线干扰的检测和消除措施综述

WLAN已经不再仅仅是最初的一种简便的网络接入方式,企业的许多重要应用,诸如语音.视频.定位等服务都逐渐部署到无线网络上.即便是普通的网络访问,用户也是希望带宽越高越好.随着应用的增加,无线干扰问题对网络服务的质量影响日显突出. 无线干扰的检测 大型的WLAN网络一般采用瘦AP架构.对无线干扰的检测和消减既可以利用提供接入服务的AP来扫描,也可以通过专门的设备组成的网络来进行,甚至还可以配合专门的手持RF设备来进行干扰定位.后两者属于频谱分析的范围.手持RF设备的定位,一般适用于小的网络或小范围

如何启动JDBC Debug模式,打印JDBC诊断日志

1.下载Debug版本jar包      首先要下载一个Debug版本的JDBC jar包,Debug版本的jar包命名形式为jdbcX_g.jar(如下图所示),如Oracle11g的Debug版本的jar包为jdbc6_g.jar.点击这里下载:http://www.oracle.com/technetwork/database/enterprise-edition/jdbc-112010-090769.html  2.启动Logging模式      第一种方式:设置运行环境变量java

陆龙兄弟海蜇头遇"硼酸门"检测机构致歉称误读标准

宁波中普检测公司的道歉声明中广网宁波5月25日消息 据中国之声<央广新闻>报道,宁波"陆龙兄弟"海产品"硼酸门"事件因为第三方检测机构的一份致歉声明而再度发酵.昨天(24日),此次事件中的检测机构宁波中普检测技术服务有限公司在<宁波日报>等主流媒体刊登道歉声明,称此前出具的检测报告是对检测标准的理解错误,郑重向陆龙兄弟公司道歉,并为该公司"硼酸门"事件辟谣.一条微博引出的"硼酸门"事件5月13日,宁波一

简单介绍思科交换机的三种交换模式

交换机在交换数据帧时可以选择不同的模式来满足网络和用户的需要,思科的交换机提供三种交换模式:存储转发模式 存储转发(Store-and-forward)模式是指交换机收完整个数据帧,并在CRC校验通过之后,才能进行转发操作.如果CRC校验失败,即数据帧有错,交换机则丢弃此帧.这种模式保证了数据帧的无差错传输,当然其代价是增加了传输延迟,而且传输延迟随数据帧的长度增加而增加.快速转发模式 快速转发(Fast-forward)模式是指交换机在接收数据帧时,一旦检测到目的地址就立即进行转发操作. 但是

《Cisco局域网交换机配置手册(第2版•修订版)》一4.3 以太网

4.3 以太网 Cisco局域网交换机配置手册(第2版•修订版)根据IEEE 802.3u和802.3ab标准,10/100/1000BASE-T可以协商链路速率和双工模式.一条连接上的两端设备互相交换性能信息,并选择双方都支持的最高的共有速率和双工模式.可以使用接口类型和接口号(interface后接ethernet.fastethernet.gigabitethernet或tengigabitethernet中的一种)来引用以太网端口.如果在端口上检测出了某些问题,交换机将自动将此端口转入e

交换机状态灯的功能解析

交换机的前面板有几个指示灯,用于监控系统的活动和性能.这些指示灯称之为发光二极管(LED).前面板上的指示灯包括: 系统指示灯 远程电源供应指示灯 端口模式指示灯 端口状态指示灯 1:系统指示灯 显示系统是否已经接通电源并且正常工作. 指示灯颜色 系统状态 关闭 系统未加电 绿色 系统运行正常 琥珀色 系统加电但运行不正常 2:远程电源供应(rps)指示灯 指示灯显示交换机是否有远程电源供电.RPS指示灯表明了交换机的RPS状态. 指示灯颜色 RPS状态 关闭 RPS关闭或未安装 持续绿色 RP