俗语说“人心不足蛇吞象”,在上篇满足基本要求后,需要满足更高级的功能要求。
1、多个地点和线路同时监控
多个监控地点是指同时在不同地方对网站和服务器进行监控,如在广州、北京、重庆等多个点同时进行监控,任何一个点监控到故障都会告警。多线路是指用不同线路(电信、联通、铁通等)同时进行监控。地点和线路是组合一起使用,如广州电信、北京联通等。
中国互联网人为的划分为南北,南方主要是电信、北方主要是联通(以前的网通),还有其它教育网、铁通等。不同网络线路访问速度比同一网络线路的要慢和不稳定,如电信访问联通要比电信访问电信慢几倍,并不时会出现互联不通的情况。再加上地点不同,情况更复杂。如在广州Ping广州电信一般是10ms,Ping广州联通一般是30ms,Ping北京电信是20ms,Ping北京网通是60ms。我们在广州经常会监控到广州电信线路不能访问广州联通线路的情况。
大部分站长和网管自己没条件进行多个地点和线路监控,在线监控轻而易举帮你解决这个问题。如你的网站服务器是面向全国的,更需要多地点和线路监控。
2、故障告警支持主要告警和次要告警
服务器一般同时开通多种服务,如网站服务、邮件服务、FTP服务、数据库服务等,网管们喜欢能同时监控这些服务是否正常。如果不分主次的话,当服务器出现网络故障或者维护重启时候,你会立即收到网站故障告警、邮件服务告警、FTP服务告警...,更惨是这台服务器短时不能恢复时候,告警消息源源不断发给你,直到服务器恢复正常或者你崩溃为止。
对于监控同一台服务器的服务,需要定义一个主要监控对象,当主要监控对象出现故障,只发送主要监控对象的告警,其它次要的监控对象暂停监控和告警。例如用Ping来做主要监控对象,如果Ping不通出现Timeout,表示服务器已经当机或者断网,这时只发送服务器Ping告警持续监控Ping,因为再继续监控和告警其它服务已经没有必要。这样能大大减少告警消息数量,又让监控更加合理、更加有效率。
3、自定义告警条件
一般的监控到的结果是成功或者失败,如Ping不通、访问网页出错、连接不到Socket,发生时这些称之为故障,故障是最优先的告警。除此之外,还能监控到返回的延时、内容等,如Ping返回的延时、访问网页的时间、访问网页取到的内容等。利用返回的结果可以自定义告警条件,如Ping监控的返回延时一般是10-30ms之间,当延时大于100ms时候,表示网络或者服务器可能出现问题,引起网络响应慢,需要立即检查是否流量过大或者服务器CPU太高等问题。
自定义告警条件能更加细化监控内容,精确知道网站和服务器状态,在故障准备发生前争取到更多时间去解决问题。
4、自定义告警消息内容
告警消息内容非常多,如告警网站名、服务器IP、监控的线路、监控的服务、出错信息、发生时间等,自定义告警消息内容能自由选择收到的告警内容,修改为完全适合自己的实际要求。这点对于用短信接受告警内容特别有意义,短信内容最多是70个字符,要在70个字符完全知道故障内容比较困难,更需要能自定义内容,调整为在有限字符内容下也能知道故障时间、故障内容,如:“007电影网12:32电信线路监控第到1次失败”,清晰明了的知道故障信息。
5、通过邮件接收汇总报表
当网站和服务器没多大问题时候,大家都懒得登录到在线监控服务管理后台查看。如果每天能收到一封网站服务器监控的汇总报表邮件,花个两三分钟就大致了解网站和服务器状态。
6、被动监控
主动监控虽然能不需要安装代码和程序,非常安全和方便,但缺少很多细致的监控内容,如无法获取硬盘大小、CPU的使用率、网络的流量等,这些监控内容非常有用,如CPU太高表示有网站或者程序出问题,流量太高表示可能被攻击等。
被动监控常用的是SNMP(简单网络管理协议),通过SNMP能监控到大部分你感兴趣的内容。大部分操作系统支持SNMP,开通管理非常方便,也非常安全。SNMP缺点是比较占用带宽,会消耗一定的CPU和内存,在CPU太高和网络流量大情况下,无法有效进行监控。
本文作者:中域互联应用与服务(http://www.118cy.com)在admin5原创首发,转载留下文章出处。
上一篇《谈在线网站服务器监控(二)之使用的基本功能要求》