解决数据中心网速慢的八个检查必备步骤

在数据中心运行过程中,不可避免会出现各种各样的问题。若网络发生信息不通、网页不能浏览等连通性故障时,这类故障现象的故障点很容易检查和定位,解决起来并不困难。
但是网络如果是通的,而网速变慢。遇到这种“软”故障,就比较令人头痛,
有的人
往往就会束手无策。一旦遇到这类问题时,需要有一个定位问题的基本思路,这样就能帮助我们在日常维护中有条不紊地找到问题的真实原因。第一:检查设备CPU占用率。数据中心里的设备少则数百,多则上万,不可能都去依依检查CPU。需要先明确哪个业务慢,了解这个业务在数据中心里需要
经过哪些设备,
然后检查这些设备的CPU占用率。当然如果有网管软件,通过设定CPU阈值,可以监控所有设备的CPU占用率,则可以很快发现CPU异常的设备。一般如果设备CPU占用率在40%以下,则可以跳过这项,直接检查第二步,如果在60%以上的话,建议您最好看一下。一般是设备受到了网络攻击。有的时候网络攻击不仅影响网速慢,甚至会中断业务。网管可以监控可疑的端口,网络流量异常的这一段时间,通过网络流量变化会看到突起突落,明显的人为痕迹。根据对以上可疑现象的分析,初步定位网络业务中断事故是人为攻击造成,采集了网络流量急剧上升时的异常流量,证明
的确是有网络攻击。针对网络攻击也有进一步的排查方法,在此不一一详述。第二:日志信息和其它异常信息。现在的电子设备可维护性都比较好,运行出现异常时都会有一些信息打印,以便提示用户设备出了问题,便于用户采取解决问题的措施。设备日志、异常记录等对于诊断问题愿意非常有用,一些比如端口DOWN、配置错误、硬件问题等简单故障,通过打印出来的信息就可以明确。对于广播流量较多的数据中心,要注意设备的端口流量是否有异常,是否可能出现了网络环路,网络环路是在数据中心经常发生的网络故障。主要是由于设备故障、STP/RRPP等二层环路协议失效、人为错误配置所致。这类问题通过观察端口的流量很好排除。因此,要检查这些设备的日志和异常信息记录。第三:利用PING来检验业务是否正常。PING是用来诊断网络故障最简单明了的手段,现在网络上流行的Xping、Multiping、网管软件等都是基本PING功能实现的,通过PING业务沿路的各个设备就可以迅速判定故障设备。一般PING的结果基本会显示出哪个设备可能存在网络问题。第四:检查端口双工的状态。服务器的网卡、网络设备端口、防火墙端口等设备的工作方式可以为全双工或半双工。当服务器、交换机的工作状态不匹配,如服务器、工作站网卡被设置为全双状态,而交换机等都工作在半双工时,就会产生大量碰撞帧和一些FCS校验错误帧,访问速度将变得非常慢。从服务器上拷贝一个100Mb的文件可能需要30分钟,
所以网速变慢也要检查下设备端口双工是否存在不一致的问题。第五:检查网线、光纤、光模块这些互连器件的问题。网线的制作方式对网络传输速度的影响是非常大的,如果不按照正规的标准制作网线,
那么来自网线自身的背景噪音以及内部串扰就会降低网络传输速度。还有光纤和光模块如果质量不佳,容易产品大量的错包,影响网速。还要的光模块收发功率不稳定,导致传输的数据出现问题,这些故障都是容易影响网速慢的最常见的原因。在数据中心里,几乎天天都会有更换网线、光纤或光模块的工作。这些都是易消耗的器件。第六:端口UP/DOWN问题。如果出现了端口的UP/DOWN,自然会引起业务时断时续,网速就慢。造成端口出现UP/DOWN的原因也可能是多方面的。比如:光纤架、跳线架有问题,链路质量不好;网线,光纤出了问题;设备两端配置速率双工不一致等等都会造成端口的UP/DOWN,一般的设备端口出现了UP/DOWN都会有记录,或者在网管上有记录,这样用户就可以通过检查记录,迅速排除掉故障。第七:对比测试。通过业务测试。比如玩传奇游戏卡,玩其它游戏没有问题,那一般是传奇服务器的问题。另外为何明确故障问题,还可以在上游设备上的一个业务端口下FTP本地网络的一个大文件,在本地设备上的一个业务口下同时FTP
同一网站的同一电影文件,比较下载速度,立刻可以知道本地设备有没有问题。第八:检查是否应用服务器是否有病毒。蠕虫、红色代码、蓝色代码、尼姆达等病毒,可使计算机运行变慢,造成网络堵塞。如蠕虫病毒对网络速度的影响严重,危害性极大。这种病毒导致被感染的用户只要一上网就不停地往外发邮件,成百上千的这种垃圾邮件有的排着队往外发送,有的又成批成批地被退回来堆在服务器上,造成服务器繁忙或者数据中心网路拥塞,网速变慢。所以需要在数据中心内部署防火墙设备,在服务器上安装杀毒软件,并保持实时更新。周期性地检查服务器是否有中病毒的情况。网速慢是一个比较
复杂问题,随着网络规模的不断扩大和应用的复杂,网络安全问题越来越多,这类问题也越来越不好分析。对于出现网速变慢的故障时,可以采用以上的八个步骤去逐一排查,在绝大多数情况下,都可以解决问题。如果通过这些步骤仍找不出异常的地方,那就需要专业的技术人员深入分析了,可能需要资深的网络专家或者设备厂家的工程师进一步深入排查。总之,只要是问题总会露出一些蛛丝马迹,我们这些数据中心的工程师不是在时刻准备着解决问题,就是在解决问题的路上。

时间: 2024-10-02 16:52:40

解决数据中心网速慢的八个检查必备步骤的相关文章

解决数据中心网速变慢的八个检查必备步骤

在数据中心运行过程中,不可避免会出现各种各样的问题.若网络发生信息不通.网页不能浏览等连通性故障时,这类故障现象的故障点很容易检查和定位, 解决起来并不困难.但是网络如果是通的,而网速变慢.遇到这种"软"故障,就比较令人头痛,有的人往往就会束手无策.一旦遇到这类问题时,需要有一个定位 问题的基本思路,这样就能帮助我们在日常维护中有条不紊地找到问题的真实原因.   第一:检查设备CPU占用率 数据中心里的设备少则数百,多则上万,不可能都去依依检查CPU.需要先明确哪个 业务慢,了解这个业

数据中心网中网技术漫谈

网络是数据中心最重要的组成部分,没有网络,就没有数据中心,这是将所有设备互连互通的唯一纽带.网络要进行工作依仗的是各种各样的协议,经过这四十多年的发展,很多网络协议已不适应现在数据中心的需要.不过,经过这么多年形成的协议标准已难以改变,这就衍生出来很多新的协议类型.这些协议不是凭空臆想出来的,而是和原始协议都有着紧密联系,与原始网络协议有着千丝万缕的联系.对原有协议直接进行修改当然不行,聪明的人类想到了很多办法,于是就有了网中网的协议.为何叫网中网协议?就是在不改变原有协议的基础上,再增加一部分

如何解决机器学习中的数据不平衡问题?

在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题. 数据不平衡问题主要存在于有监督机器学习任务中.当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降.绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作. 本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路: 1.重新采样训练集 可以使用不同的数据集.有两种方法使不平衡的数据集来建立一个平衡的数据集--欠采样和过采样. 1.1. 欠采样 欠采样是通过减少丰富类

我的Android进阶之旅------>解决Jackson、Gson解析Json数据时,Json数据中的Key为Java关键字时解析为null的问题

1.问题描述 首先,需要解析的Json数据类似于下面的格式,但是包含了Java关键字abstract: { ret: 0, msg: "normal return.", news: [ { id: "NEW2016062800875700", from: "腾讯新闻客户端", qqnews_download_url: "http://inews.qq.com/m?refer=openapi_for_xiaotiancai",

ACM图灵奖获得者:想从大数据中获益,先解决集成问题!

文章讲的是ACM图灵奖获得者:想从大数据中获益,先解决集成问题!如今,大数据对所有行业都产生了深远影响:从医疗保健.汽车.电信到物联网.随着数据浪潮的持续,企业都在寻找更新的管理和分析方法.收集可行的见解并应对安全和隐私的双重挑战. 计算机协会(ACM)刚刚结束了ACM A.M.50年的庆祝活动.图灵奖(俗称"诺贝尔计算奖")在旧金山举行了为期两天的会议.会议汇集了一些计算行业的翘楚,探讨计算机的未来发展以及该领域的领先地位.以下是与麻省理工学院计算机科学与人工智能实验室(CSAIL)

如何解决estjs中异步数据加载失败问题(加载数据超时导致数据加载失败),或延长extjs异步数据加载时间?

问题描述 如何解决estjs中异步数据加载失败问题(加载数据超时导致数据加载失败),或延长extjs异步数据加载时间? 问题补充:lizhi92574 写道 解决方案 Ext.data.Connection.prototype.timeout='9000';设置ajax请求时间默认30秒解决方案二:对解决方案三:你加载多大的数据居然超时了?

图片-SQL将列数据中字段的一个字符去除

问题描述 SQL将列数据中字段的一个字符去除 这个sgrade里数据前的's'是我通过update sc set sgrade='s'+sgrade加进去的,现在要去掉这个s怎么办 解决方案 update sc set sgrade=replace(sgrade, 's', '') 解决方案二: SQL 字段取字符位置与循环修改数据 解决方案三: 就操作而言,可以用字符串切割或者STRING操作按位从第二个字符读取,然后更新掉sgrage的值就可以了 解决方案四: 你的这个S 会有重复吗,没有重

麦肯锡:从客户大数据中获取价值,企业需要思考这几个问题

编者按:现在是大数据的时代.很多科技巨头掌握了大量的客户数据,而大家都清楚,这些数据是无价之宝.然而,由于技术.理念等等方面的限制,实际的客户数据利用情况并没有那么令人满意.麦肯锡在报告中分析了这一情况,并且为希望充分利用大数据的公司提出了几点建议.以下是报告正文. 公司可以通过梳理出新的模型.推动生产效率.创造出新的解决办法来使用他们的信息. 在一个以消费者为中心的世界里,一种能够整体获取并利用客户的洞察力来塑造产品.找出解决办法并改善购买体验的能力显得至关重要.研究告诉我们,能够利用客户行为

解决tableView中cell动态加载控件的重用问题

解决tableView中cell动态加载控件的重用问题 tableView的cell,有时候需要在运行时取得对应的数据后才能够动态的创建该cell中的控件并加载到该cell中,此时,你一定会遇到重用问题,即使你能做到该cell只根据数值加载了一回控件,你也没法保证不出现重用问题:) 效果(请注意查看,移动下面的格子时,上面出现了重用的问题) 源码: YXCell.h // // YXCell.h // YXTableView // // Copyright (c) 2014年 Y.X. All