云网络时代 网络故障管理何去何从?

检测、发现和纠正网络故障从来都不是容易的事情。过去是客户端服务器“统治”、应用运行在指定服务器、最终用户通过以太网、租用WAN链路或其他服务连接的时代,彼时网络故障管理已经比较麻烦了,而现在大型数据中心和云网络让网络故障管理更具挑战性。

技术在变化,但最终结果是最重要的。这里的问题是:用户是否在接受所需的服务质量?答案取决于应用和网络性能。现在的应用通常在公共、私有或混合云上运行,应用作为负载转移在服务器之间迁移。服务器和数据存储之间的吞吐量取决于其他应用放在共享链路的负载。

网络性能取决于连接用户到应用的网络的类型和容量。本地用户可能通过以太网或无线网络连接,远程用户则通过各种WAN技术连接,包括公共互联网或蜂窝网络等。每种连接都需要专门的方法来维持所需的性能。任何这些位置(应用或网络)的故障都可能降低客户满意度。

云故障检测

很多拓扑结构和设计(其中包括虚拟化服务器、多个虚拟局域网和覆盖网络)让云故障检测和网络故障管理变得更加复杂。一个租户的应用出现性能问题可能与影响另一个租户的问题并没有什么关联,但它们可能来自同一来源。每个租户的应用可能在相同超载或配置错误的服务器上执行,或者两个租户的覆盖网络通过相同超载或故障链接来路由。

海量的服务器、网络组件和链接是故障的一大来源。现代硬件极为可靠,尽管每个组件有多年故障平均时间,但对于数千独立的设备来说,依旧会有硬件故障发生。

配置错误是另一个问题来源,该问题可由网络故障管理进行跟踪。服务器和网络设备不断添加、升级或取代。大型云计算通常包括来自不同供应商的组件,甚至来自同一供应商的相同组件也可能运行着不同的软件版本。在这种环境中,任何变更都可能导致错误的出现,同时,对一个组件的改变还可能影响到其他组件。

简单地检测和报告错误已经不够,每个错误可能导致几十份错误报告。链路故障会在链路两端的交换机生成硬件故障指示,并且每次链路故障和恢复时都会发出新报告。2层和3层网络协议路由会改变,在备用路由流量水平接近最大数值时链路流量监控也会变化。同时,应用性能监控器会从通过该链路路由流量的每个应用报告问题。

故障相关性及其在网络中的作用

没有哪个网络管理员能够整理完单一故障生成的海量报告,并快速发现其根本原因。对此,故障相关性软件很重要,这是每个主流系统供应商网络管理产品的重要组成部分。

故障相关性产品利用各种机制来发现问题,其中包括SNMP trap、TL1消息、应用日志和SYSLOG条目。SNMP和特定产品轮询监控器运行在服务器、交换机和链路。相关性工具还可监控设备问题、电源电压和磁盘可用空间来预测未来的问题。

网络故障管理软件必须提供对网络准确的且最新的视图。该软件必须保持更新(无论是通过手动或者通过网络映射),以追踪添加的、移除的或更新的组件。它必须维护每种组件的内部型号,介绍其配置和功能,并包含网络运营政策的描述。当添加应用时,还必须更新服务水平协议(SLA)等信息。

此外,故障相关性软件必须与云编排软件来交互,追踪正在运行的应用、它们在哪些服务器运行和VLAN以及与每个租户相关的覆盖网络。网络故障管理软件还必须不断根据SLAN监控应用性能水平。

当出现问题时,相关性软件会获取所有接收到的故障指示,并利用有关的网络拓扑以及在故障出现前数据如何移动的信息来确定根本原因,并为网络管理人员提供简要的报告。

SDN网络

云计算与SDN技术管理的数据中心面临着与依靠传统技术的数据中心相同的潜在问题。它们都需要故障相关性软件,但SDN架构需要将相关性软件内置到网络控制器或与其紧密连接。

这种差异的原因是Spanning Tree和Open Shortest Path First等传统协议在网络设备内部部署。它们在链路或端口问题阻止流量时根据需要重新路由流量。通过SDN,所有路由都由控制器来确定,故障相关性软件必须告知控制器问题的类型,以便它能够确定备用路由。

OpenFlow兼容的白盒交换机支持各种供应商的操作系统,每个都有自己的检测和故障报告方法。Big Switch和Pica8的操作系统都支持SNMP,但Big Switch的控制器和交换机操作系统利用OpenFlow消息来与设备进行通信。相关性软件通过接口与控制器通信,从设备处接收消息,并轮询其状态。

无线网络和广域网

Wi-Fi依靠一组专门的工具来诊断问题。Wi-Fi连接可受到很多问题的影响,例如信号干扰、墙壁或阻止信号的固态物体,以及安全漏洞。现在有各种故障排除产品,包括免费软件和专业的软件产品。还需要专门的硬件产品来诊断某些类型的问题。

在网络服务提供商拥有和管理的WAN连接的情况下,关键参数是吞吐量和往返时间,这方面也有免费和专业产品可供选择。

满足最终用户性能要求需要应用性能的各方面都正常运行。在出现问题时,网络故障管理和故障检测产品必须能够查明原因,使它们可快速被修复以及恢复正常运作。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-09-26 17:02:52

云网络时代 网络故障管理何去何从?的相关文章

浅析网络时代的客户关系管理

中介交易 SEO诊断 淘宝客 云主机 技术大厅 随着互联网络的迅猛发展.市场的不断成熟,9374.html">世界经济进入了电子商务时代.产品和服务的差异越来越小.以生产为中心.以销售产品为目的的市场战略逐渐被以客户为中心.以服务为目的的市场战略所取代.谁能掌握客户的需求趋势.加强与客户的关系.有效发掘和管理客户资源,谁就能获得市场竞争优势,在激烈的竞争中立于不败之地. 一.客户关系管理的内涵 在现今的网络时代,越来越多的企业开始意识到客户对企业运营及其后期发展的重要性,企业开始关注客户在

后网络时代链路均衡控制利器详细介绍

作为网络用户尤其是中小型网络用户的你是不是被这样的问题和烦恼所困扰:路由器根本解决不了应用层链路负载均衡的问题. 基于PC架构Linux的软件解决方案本身成为瓶颈!由于资金不足,不能购买真正专门为应用层链路负载均衡的硬件设备,而只能购买基于PC架构Linux或Windows的软件解决方案,虽然能够提供负载均衡的功能,但是在流量刚刚达到总带宽50%的时候,这个设备本身却由于体系架构的限制,成了链路的瓶颈. 各种应用争抢带宽,导致重要的应用时断时续反应极慢!视频.语音等多媒体应用要求保证的带宽和时延

信息化进入2.0时代 网络融合管理成为必然方向

信息化1.0时期,企业资产从物理化到数字化,将信息和资产从物理实体转换成数字形式,而信息化2.0时期,企业将数字化从本地发展到多地,从本地集群到云计算,从信息和资产数字化到业务数字化,通过互联网进行新时代的业务发展. 在信息化 2.0 时期,随着企业对IT的依赖性剧增, 便突显了IT基础建设规划扩展与快速的业务发展之间的矛盾,而这个矛盾所指向的解决方式或许有一个共同的名字--网络融合管理. 信息化2.0时代网络管理难题浮出水面 网络在现代企业的业务发展过程中有多重要?看看企业在网络建设中的投入就

西数亮相2013重庆国际云博会 引领TB网络时代

 10月24日,以"云端互联,引领未来"为主题的第二届中国重庆国际云计算博览会在重庆南坪国际会展中心隆重拉开序幕,来自全球云计算领域.和国内最高科技学府中国科学院等的百位专家讲师在大会上就大数据时代下的应用与发展趋势分享了各自的创新科技成果.西部数据携全线企业级存储产品与NAS网络云存储解决方案于此次大会上倾情亮相,向与会者一展各款明星大容量存储产品的超强性能.无与伦比的可靠性和稳定性,以4TB系列硬盘来诠释TB网络时代的到来. (完美兼容网络存储器的NAS系列西数红盘,2.5英寸产品

云数据中心网络运维的苦与乐

前几年大家讲 SDN 比较多的是怎样利用控制器,像 OpenDayLight.ONOS 这些东西,其实在讲怎样做一个 Driver.怎样做控制.大概从去年开始,SDN 开始跨入应用的时代,现在大家更多地在讲实际要做的事情.应用场景是什么.由于大家对 SDN 有多种不同的理解,在本文中我想把话题聚焦一下,落到云数据中心的网络运维这个点上,分享一些运维中的实际例子.没有大的篇章,只说说我们遇到的那些苦与乐. 因为本文话题的场景是云数据中心,所以我们有必要先看一下云数据中心里面的网络是什么样子. 简单

有容云:容器网络那些事儿

本文讲的是有容云:容器网络那些事儿[编者注]本文根据7月31日有容云<Docker Live时代线下沙龙-北京站>嘉宾分享内容整理而成,分享嘉宾杜东明,有容云高级技术顾问,十年IT经验,IT行业的全栈工程师.涉足领域包括存储.网络.备份/容灾.服务器/终端虚拟化.Docker等.拥有丰富的一线客户经验,曾帮助工行.建行.光大.国寿.泰康等诸多金融客户设计其虚拟化基础架. 我相信,真正拿容器工作或者是去运维一个容器环境,真正在容器上面做生产的时候大家都会遇到的一个话题就是容器网络,所以我今天给大

SONiC:为Microsoft全球云提供支持的网络交换机软件

微软运行着全球最大的公有云之一,在构建和管理全球性.高性能.高可用性和安全网络方面又宝贵的经验.经验告诉我们,运行书包个数据中心和数万台交换机,我们需要: 在网络的各层都使用最佳的交换机硬件在不影响最终用户使用的情况下部署新功能在几个小时内安全可靠地推出更新,而不再是需要数月的周期利用云端深度遥测和全自动化解决故障让我们的软件定义网络软件能够使用统一的结构轻松控制网络中的所有硬件元素,以消除重复并减少故障.为了满足这些需求,微软率先开发了开放式交换机软件SONiC,这是网络交换机操作和管理上的突

优化混合云的企业网络设计

随着企业将更多的工作负载迁移到公共云中,出现了新的网络瓶颈.诸如VPN之类的选项,可以帮助获得来自云计算提供商和互联网交换点的直接连接. 公共云和混合云的采用对于企业网络设计具有重大的影响,因此出现了新的瓶颈,一些企业需要改变他们的网络配置,特别是那些用于广域网的网络配置,以确保他们获得所需的性能. 尤其是采用混合云和公共云,网络重点转移到广域网(WAN)连接.企业需要将其数据中心链接到其公共云提供商的网站,并且通常依靠他们现有的互联网线路来完成.但这种方法也有缺点. 首先,带宽是一个问题.用于

盘点网络虚拟化技术 软件定义网络时代到来

虚拟交换机 虚拟化的环境中,在主机内部,各虚拟机通过模拟物理功能的虚拟交换机vSwitch相互通信,虚拟机和外界通信则是通过虚拟机交换机捆绑的上联物理网卡来进行.这种纯软件实现的交换机功能的控制平面位于主机上,同时主机还负责数据平面,通过虚拟交换机,管理员可以灵活创建端口和端口组.网卡捆绑和vLan划分等配置.VMware标准交换机提供流量调整功能,管理员可对端口设置平均带宽.峰值带宽和突发流量.在方物虚拟化的标准交换机中,管理员还可以对端口组设置最小带宽. 分布式虚拟交换机 在VMware v