《Cisco IOS XR技术精要》一2.7 高可用架

2.7 高可用架构

Cisco IOS XR技术精要
Cisco IOS XR是一款模块化的网络操作系统,在设计之初考虑进了故障控制和故障恢复功能,其主要目标是控制、管理,以及从任何潜在故障中恢复的能力。在一款复杂的系统中,如运行IOS XR的平台上,即便在系统开发时使用了最优的设计、研发及测试规范,软件bug和硬件故障也是无法避免的。IOS XR高可用软件和硬件设计思想是将各种类型的软硬件故障预先定义出来,当故障发生时,使用影响最低的恢复机制从故障中恢复系统,从而将故障对系统造成的影响降至最低。

IOS XR使用分层的高可用(HA)架构来执行故障检测、故障控制,以及故障恢复。图2-8画出了IOS XR中HA特性的不同层级。

IOS XR是一款基于微内核的NOS,除了少量微内核,所有操作都是由进程来完成的,甚至包括设备驱动和文件系统。由于所有进程各自运行在自身的受保护内存中,所以某个进程的崩溃或中断不会影响到其他进程。

IOS XR具有可重启特性。进程崩溃后可以重新启动。运行的进程会将重要的状态信息保存在检查点服务器中,检查点服务器由一块共享内存空间组成。当某个进程发生崩溃或中断,随后系统管理器会对其执行重启,重启后的进程可以从检查点服务器上恢复之前的某些状态信息。图2-9给出了这一状态的说明。进程还可以通过peer进程来恢复状态信息。例如,RIB进程可以通过接收路由选择协议进程的更新来恢复自身的RIB表。

主RP上的检查点服务器同时也会镜像到备RP上。当主备RP故障切换时,新的主RP可以从本地的检查点服务器中恢复状态,这时主备RP同步的作用便体现出来了。图2-10解释了在故障切换时热、温、冷进程是如何恢复其状态的。活动热(hot)进程会将其状态同步给备RP上的peer进程,备peer当即处理状态信息。当RP切换时,备peer会立即接管主peer的角色。另一方面,对于备RP上的温(warm)进程来说,只有当故障切换发生时,才会去从检查点服务器上检索状态信息。冷(cold)进程不会将其检查点状态镜像给备peer。故障发生后,进程必须通过系统管理器执行重启。重启后,由于没有检查点状态,所以无法恢复原有状态。不过,冷进程可以从使用平滑重启(GR)功能的邻居路由器以及peer进程中恢复其状态。

IOS XR通过监控进程来检测CPU黑洞(hog)和内存耗尽,同时还会监控硬盘空间利用率、死锁、内核线程、文件描述符,以及共享内存的使用。如果检测出了问题,造成问题的异常进程将被中断掉。监控CPU黑洞、内存以及死锁的进程被称为wdsysmon(系统监控看门狗[watchdog system monitor])。默认情况下,wdsysmon会对造成CPU黑洞、内存黑洞、死锁的异常进程进行重启处理。这一行为可以通过命令watchdog restart [cpu-hog | deadlock | memory-hog] disable进行更改。

Cisco IOS XR平台对关键性的硬件组件使用了硬件冗余,如RP、风扇组、电源。以RP为例,许多原因可以导致主备RP的故障切换。当执行故障切换时,备RP上的进程将使用镜像来的检查点数据来恢复其状态。以下是一些导致RP切换的原因:

  • 主RP检测到硬件错误;
  • 主RP控制平面锁死;
  • 主RP上的强制进程崩溃并且无法重启;
  • 主RP上的内核崩溃;
  • 使用命令redundancy switchover;
  • 硬件watchdog计时器到期。

在IOS XR中,转发平面、控制平面和管理平面彼此清晰地分离开来。管理平面或控制平面中的故障不会中断流量转发。线卡的硬件转发不受RP切换的影响。在IOS XR平台上,线卡上的硬件包转发可以在控制平面脱控时独立工作。当故障切换完毕,并且控制平面完全恢复之后,系统通过使用一种标记-清除(mark-and-sweep)技术使HW转发表与最近的控制平面转发表同步,从而更新硬件转发表。

所有IOS XR路由选择协议,包括BGP、LDP、RSVP、OSPF和IS-IS,均支持平滑重启(GR)特性。使用GR特性,当进程崩溃或RP故障切换时,如果邻居路由器同样启用了GR特性,重启进程能够从邻居路由器上恢复路由信息。GR功能、标记-清除技术,控制平面与数据平面相分离,这三者共同实现了在RP故障切换或进程崩溃时IOS XR的不中断转发(NSF)。

在某些情况下,用户网络中的路由器很可能不支持GR特性。这时,可以在Cisco IOS XR上部署不中断路由(NSR)特性,使得RP故障切换时能够从本地恢复路由信息。使用NSR特性,路由信息以及重要的路由选择协议状态将被镜像到备RP对应的进程中。RP切换时,拥有所有路由信息及重要协议状态的备RP上的协议进程将接管协议的功能性。邻居路由器甚至感知不到对端设备发生了RP故障切换。NSR特性不需要邻居路由器支持GR特性。许多协议都可支持NSR,包括IS-IS、OSPF、LDP,以及BGP。

Cisco IOS XR能够通过软件维护升级(SMU)交付机制来实现软件修复。SMU提供了特定组件的软件补丁。大多数的SMU升级对业务的影响是可以容忍的甚至是无影响的,因为升级过程中仅会重启单个或非常少量的必要进程。

时间: 2024-09-13 21:41:37

《Cisco IOS XR技术精要》一2.7 高可用架的相关文章

《Cisco IOS XR技术精要》一1.3 操作系统概念

1.3 操作系统概念 Cisco IOS XR技术精要 计算机系统,包括路由器之类的嵌入式系统,都会带有一个负责向应用提供服务的操作系统.操作系统还提供了协调进程活动和访问硬件资源(如内存.网络接口.硬盘)等重要功能.图1-1给出了操作系统.应用,以及硬件资源之间的逻辑关系图. 操作系统基本功能 操作系统为应用提供了多种多样的服务.可提供的基本功能包括进程调度.中断处理.内存管理.进程间通信,以及常见例行程序(常见库).本节将对操作系统的这些基本功能做更详细的介绍. 1.进程调度 所谓进程(pr

《Cisco IOS XR技术精要》一1.4 Cisco IOS XR高级介绍

1.4 Cisco IOS XR高级介绍 Cisco IOS XR技术精要 随着世界对IP网络基础结构的依赖程度日益加剧,网络运营商需要一个具有高度可靠性和可用性的网络.Cisco IOS XR软件被设计用来满足网络运营商的迫切需求.IOS XR可提供如下特性: 高度可扩展性: 分布式转发架构: 极高的可靠性与弹性: 服务分离和灵活性: 健壮的安全性: 软件构件模块化: 层次性配置和健全的配置管理: 更优的可管理性. Cisco IOS XR软件是一款高级分布的.安全的.模块化的.高度扩展的.支

《Cisco IOS XR技术精要》一第1章 Cisco IOS XR介绍1.1 网络的演变

第1章 Cisco IOS XR介绍 Cisco IOS XR技术精要 本章讲解了以下几个主题: 网络的演变: 运营商级NOS需求: 操作系统概念: Cisco IOS XR高级介绍: Cisco IOS XR平台: 参考资料. 本章讨论了网络操作系统(NOS)的演变.今天和未来的网络对NOS的需求,以及Cisco IOS XR如何满足这些需求.本章第一节概述了网络的演变,第二节论述了通过关键应用支撑的融合性网络对运营商级NOS的需求,第三节介绍了操作系统的基本概念,最后一节对Cisco IOS

《Cisco IOS XR技术精要》一2.1 Cisco IOS XR内核

2.1 Cisco IOS XR内核 Cisco IOS XR技术精要 Cisco IOS XR是一款基于微内核.高度分布的操作系统.Cisco IOS XR中使用的微内核是一种由QNX Software Systems公司开发的QNX Neutrino实时操作系统(RTOS),其使用的内核是轻量级的,仅提供了少量必要的服务.该系统负责终端处理.调度.任务交换.内存管理.同步.进程间通信等工作.微内核系统不包括如设备驱动器.文件系统和网络栈之类的系统服务:这些服务是通过内核外的独立进程来执行的,

《Cisco IOS XR技术精要》一第4章 配置管理4.1 理解分布式配置管理

第4章 配置管理 Cisco IOS XR技术精要 本章讲解了以下几个主题: 理解分布式配置管理: 理解配置平面: 配置管理组件: 理解二级提交模型: Cisco IOS XR配置特性: 硬件与软件操作的配置管理: 配置回退. 本章将介绍Cisco IOS XR配置管理中的特性.IOS XR中引入了配置数据库的概念,配置就像数据库中的数据一样存放起来.为了更符合网络工程师处理ASCII配置文件的习惯,配置数据库同时使用二进制和ASCII两种格式,从而为网络操作提供了更多的管理特性. 本章还介绍了

《Cisco IOS XR技术精要》一本章小结

本章小结 Cisco IOS XR技术精要 互联网已经从使用多种不同类型的网络来实现多种特定应用的限制架构方式,演变到今天通过企业.公共事业.政府以及个人用户不断增加的各种应用来支撑的网络架构模式.这种演变的结果是,运营商会要求其网络环境中的路由器具有高可用性.可靠性以及安全性来适应这种网络的变形.针对这些需求,Cisco研发出了IOS XR. Cisco IOS XR是一种基于微核的操作系统,具有抢占多任务处理.内存保护.高度模块化,以及快速内容交换等功能.由于微内核外的每个进程都可以不影响系

《Cisco IOS XR技术精要》一第2章 Cisco IOS XR架构

第2章 Cisco IOS XR架构 Cisco IOS XR技术精要 本章讲解了以下几个主题: Cisco IOS XR内核: Cisco IOS XR系统管理器: 进程间通信: 分布式服务: 进程迁移: Cisco IOS XR系统数据库: 高可用架构: 转发路径: 参考资料. Cisco IOS XR的设计定位是一款具有可扩展性.安全性.高性能.不间断系统运作特性的大型可升级系统.本章讨论了IOS XR的架构以及IOS XR是如何实现上述目标的.第一节讨论了IOS XR使用的微内核,后续章

《Cisco IOS XR技术精要》一4.6 硬件及软件操作的配置管理

4.6 硬件及软件操作的配置管理 Cisco IOS XR技术精要本节介绍在不同的硬件及软件操作中IOS XR配置管理所扮演的角色.这些操作包括: 热插拔(OIR):PIE的激活与卸载:预配置:路由器启动. 4.6.1 OIR操作中的配置管理 前面介绍过,在IOS XR中,配置是通过RDSFS复制到各个节点上的,但所有节点的初始原版配置是存放在CFS系统中的.所以,当拔出某块板卡时,所有存储在此节点上的配置都会丢失,不过,该节点的配置信息会被转移到CFS中的预配置区域.在插入MSC时,节点上的配

《Cisco IOS XR技术精要》一2.8 转发路径

2.8 转发路径 Cisco IOS XR技术精要转发路径描述了数据包在穿越路由器或被路由器接收时的处理过程.了解转发路径有助于读者理解数据包在路由器中经过一系列操作的相关概念.后文以CRS-1路由为例介绍了设备的转发路径机制.本节讨论的内容适用于IPv4.MPLS或IPv6数据包:同样适用于所有型号的CRS-1路由器. 图2-11列出了CRS-1转发路径的概述图.以RP的控制平面计算和路由器上配置的特性为基础,假定转发信息和特性信息已经下载到了CRS-1的线卡上. CRS-1的线卡由连接到中间

《Cisco IOS XR技术精要》一1.2 运营商级NOS需求

1.2 运营商级NOS需求 Cisco IOS XR技术精要服务提供商力求能够提供一种完全满足用户需要的网络解决方案.公司需要将数据.语音.视频以及移动服务整合到一起,并具有高可用性.安全性,以及快速交付的特性.用户希望在一笔订单中获得语音.视频.移动无线以及数据等捆绑服务的宽带接入功能.政府也在致力于推动宽带接入到户以及可在灾难性故障中存活的弹性网络结构. 本节介绍了运营商级的NOS需求. 1.2.1 融合性 一款运营商级的NOS应具有可以利用现有的网络结构并将多种服务融合到一起的能力.网络融