公司的业务有几台服务器存放在IDC机房中,说是双线路。但是我看到网卡的配置是单网卡双IP的形式。如下:
而公司这边的线路是联通的IP,如下:
nagios监控搭建在公司内部,由于南北线路联通的问题。导致公司这边nagios监控IDC机房中的服务器经常误报。特别是一大夜间,妹的,误报的信息多的都让人头疼。如下:
刚开始怀疑是公司路由器不稳定导致的。但是重启了几次后,还是这样的问题。,如下:
查看nagios监控其中一台服务器的IP地址为电信IP。如下:
在公司内部白天ping该IP地址,一切都正常。但是一到晚上那个丢包严重的,我都不好意思截图了。
后来猜想是不是因为这个问题导致的,因为nagios有一定的监测周期。如果在一段时间内,获取不到数据,那么nagios就会发邮件通知。
果断把nagios监测该服务器的IP地址修改为联通的IP,如下:
修改完毕后,重启nagiso,进行监控,如下:
/etc/init.d/nagios restart
观察一段时间后,发现还是不行,还会是误报信息。
这客人让人头疼,ping那个联通的IP也是通的。如下:
后来仔细观察该服务器上的IP地址配置,如下:
发现在默认网关中只有电信的IP,而没有联通的IP。猜想是不是因为这个原因导致的,果断添加进去。如下:
添加完毕后,重启nagios,再次监控。发现还是误报,这次坑爹了。在想不出问题出在什么地方,就胡乱的点击。突然发现在网卡显示的IP出与网卡配置的IP有一定的出入,如下:
注意图中标记出来的黄色部分。
可以看到刚刚在前面添加的联通IP地址作为网关,没有起作用。
这个是怎么回事呢?查了相关资料还是没有头绪。
测试下把原来电信IP的网关删除,添加联通IP后,再次重新添加电信IP,却发现可以正常监测。如下:
查看该服务器的路由表,如下:
route print
现在我怀疑,由于原来使用的是电信IP作为默认网关。造成nagios在接收数据是,造成网络不稳定。这样就导致了nagios的误报。
到此nagios的误报已经大大减少了……