Centos 6.4下网络监视工具(Nagios)邮件告警配置

系统:Centos 6.4

服务器:hostname:Nagios-Server kernel:2.6.32-358.el6.x86_64 IP:1.1.1.26
客户端:hostname:Nagios-Client kernel:2.6.32-358.el6.x86_64 IP:1.1.1.27

升级内核:

[root@Nagios-Server ~]# yum install ntpdate -y    #安装ntpdate,时间同步
[root@Nagios-Server ~]# /usr/sbin/ntpdate time.nist.gov    #时间同步
[root@Nagios-Server ~]# yum install kernel kernel-devel gcc gcc-c++ wget vim -y    #升级内核
[root@Nagios-Client ~]# yum install ntpdate -y
[root@Nagios-Client ~]# /usr/sbin/ntpdate time.nist.gov
[root@Nagios-Client ~]# yum install kernel kernel-devel gcc gcc-c++ wget vim -y

升级后内核:

服务器:2.6.32-504.1.3.el6.x86_64
客户端:2.6.32-504.1.3.el6.x86_64

日志分析:

一、服务

①check_users服务监控,第一次soft、第二次soft、第三次hard,在然后发送邮件

[1417348396] Warning: Return code of 255 for check of service 'check_users' on host '1.1.1.27' was out of bounds.
[1417348396] SERVICE ALERT: 1.1.1.27;check_users;CRITICAL;SOFT;1;(Return code of 255 is out of bounds)
[1417348456] Warning: Return code of 255 for check of service 'check_users' on host '1.1.1.27' was out of bounds.
[1417348456] SERVICE ALERT: 1.1.1.27;check_users;CRITICAL;SOFT;2;(Return code of 255 is out of bounds)
[1417348516] Warning: Return code of 255 for check of service 'check_users' on host '1.1.1.27' was out of bounds.
[1417348516] SERVICE ALERT: 1.1.1.27;check_users;CRITICAL;HARD;3;(Return code of 255 is out of bounds)
[1417348516] SERVICE NOTIFICATION: nagiosadmin;1.1.1.27;check_users;CRITICAL;notify-service-by-email;(Return code of 255 is out of bounds)
②:check_zombie_procs服务监控,第一次soft、第二次soft、第三次hard,在然后发送邮件

[1417348426] Warning: Return code of 255 for check of service 'check_zombie_procs' on host '1.1.1.27' was out of bounds.
[1417348426] SERVICE ALERT: 1.1.1.27;check_zombie_procs;CRITICAL;SOFT;1;(Return code of 255 is out of bounds)
[1417348486] Warning: Return code of 255 for check of service 'check_zombie_procs' on host '1.1.1.27' was out of bounds.
[1417348486] SERVICE ALERT: 1.1.1.27;check_zombie_procs;CRITICAL;SOFT;2;(Return code of 255 is out of bounds)
[1417348546] Warning: Return code of 255 for check of service 'check_zombie_procs' on host '1.1.1.27' was out of bounds.
[1417348546] SERVICE ALERT: 1.1.1.27;check_zombie_procs;CRITICAL;HARD;3;(Return code of 255 is out of bounds)
[1417348546] SERVICE NOTIFICATION: nagiosadmin;1.1.1.27;check_zombie_procs;CRITICAL;notify-service-by-email;(Return code of 255 is out of bounds)
③:check_total_procs服务监控,第一次soft、第二次soft、第三次hard,在然后发送邮件

[1417348436] Warning: Return code of 255 for check of service 'check_total_procs' on host '1.1.1.27' was out of bounds.
[1417348436] SERVICE ALERT: 1.1.1.27;check_total_procs;CRITICAL;SOFT;1;(Return code of 255 is out of bounds)
[1417348496] Warning: Return code of 255 for check of service 'check_total_procs' on host '1.1.1.27' was out of bounds.
[1417348496] SERVICE ALERT: 1.1.1.27;check_total_procs;CRITICAL;SOFT;2;(Return code of 255 is out of bounds)
[1417348556] Warning: Return code of 255 for check of service 'check_total_procs' on host '1.1.1.27' was out of bounds.
[1417348556] SERVICE ALERT: 1.1.1.27;check_total_procs;CRITICAL;HARD;3;(Return code of 255 is out of bounds)
[1417348556] SERVICE NOTIFICATION: nagiosadmin;1.1.1.27;check_total_procs;CRITICAL;notify-service-by-email;(Return code of 255 is out of bounds)
二、主机

[1417349046] HOST ALERT: 1.1.1.27;DOWN;SOFT;1;CRITICAL - Host Unreachable (1.1.1.27)
[1417349116] HOST ALERT: 1.1.1.27;DOWN;SOFT;2;CRITICAL - Host Unreachable (1.1.1.27)
[1417349186] HOST ALERT: 1.1.1.27;DOWN;HARD;3;CRITICAL - Host Unreachable (1.1.1.27)
[1417349186] HOST NOTIFICATION: nagiosadmin;1.1.1.27;DOWN;notify-host-by-email;CRITICAL - Host Unreachable (1.1.1.27)

配置:

①:配置报警邮箱

sed -i 's#email                           nagios@localhost#email                           byrd_monitor@163.com#g' /usr/local/nagios/etc/objects/contacts.cfg    #修改发送报警邮件地址

②:配置主机报警频次(备注:可以自定义,也可以修改修改/usr/local/nagios/etc/objects/templates.cfg)

define host{
        name                            linux-server    #linux模板通用名
        use                             generic-host    #继承了通用主机模板的其他值
        check_period                    24x7            #检查周期7*24小时
        check_interval                  2               #每隔2分钟检查一次
        retry_interval                  1               #异常后,1分钟后重试
        max_check_attempts              3               #异常后,最大尝试3次,然后报警
        check_command                   check-host-alive #检查主机存活命令
        notification_period             24x7            #工作时间通知
        notification_interval           2               #异常后,通知间隔2分
        notification_options            d,u,r           #当主机down(关机)、unrealcable(不可达)、recovery(恢复)
        contact_groups                  admins          #通知发送管理员组
        register                        0               #???
        }

③:配置服务报警频次

define service{
        name                            generic-service         #通用服务模板名称
        active_checks_enabled           1                       #服务检查启用
        passive_checks_enabled          1                       #被动检查启用
        parallelize_check               1                       #并行检查开启
        obsess_over_service             1                       #分布式监控使用,1启用,0禁用
        check_freshness                 0                       #不检查服务'freshness'
        notifications_enabled           1                       #服务通知启用
        event_handler_enabled           1                       #启用服务事件处理程序
        flap_detection_enabled          1                       #Flap detection is enabled
        failure_prediction_enabled      1                       #启用故障预测
        process_perf_data               1                       #性能数据
        retain_status_information       1                       #保留重新启动状态信息
        retain_nonstatus_information    1                       #保留非状态信息
        is_volatile                     0                       #The service is not volatile
        check_period                    24x7                    #7*24
        max_check_attempts              3                       #重新检查服务3次,以确认是否真正的状态
        normal_check_interval           1                       #正常情况下每个1分钟检查一次
        retry_check_interval            1                       #每隔1分钟检查一次服务,直到真正的状态确定
        contact_groups                  admins                  #通知管理组
        notification_options            w,u,c,r                 #发送通知,当服务状态为warning, unknown, critical, and recovery events
        notification_interval           2                       #60分钟后重新通知状态
        notification_period             24x7                    #7*24
         register                        0                      #???
        }

时间: 2024-10-02 22:59:54

Centos 6.4下网络监视工具(Nagios)邮件告警配置的相关文章

如何使用浏览器网络监视工具进行黑客攻击

本文讲的是如何使用浏览器网络监视工具进行黑客攻击, 在上一篇<重构后的Firefox网络监视工具,里边加了什么黑科技?>中,除了深入了解重构之后的网络监视器工具,我们还了解到,使用Web标准构建开发工具使我们能够在不同的环境中运行它们比如加载在Firefox Developer Toolbox中,或者作为标准Web应用程序加载到浏览器选项卡中. 在本文中,我们将向你展示如何尝试这些操作,并使用网络监视器进行黑客攻击. 获取源代码 Firefox开发人员工具代码库目前是Firefox源代码库的一

重构后的Firefox网络监视工具,里边加了什么黑科技?

本文讲的是重构后的Firefox网络监视工具,里边加了什么黑科技?, Firefox开发工具的早期版本已经在Firefox中提供了网络监视器工具,任何关心页面加载性能和网页运行速度的用户都非常喜欢这个工具.不过该工具最近被进行了广泛的重构(项目代号为Netmonitor.html),这篇文章旨在向大家解释如何设计新架构以及你如何使用重构之后的新技术. 以下就是Firefox Developer Toolbox中运行的网络监视器用户界面. 目标 重构的主要目标之一是在标准Web技术之上重建整个工具

pmacct 0.14.0rc3发布 被动的网络监视工具

pmacct 0.14.0rc3这个版本现在的BGP守护进程的特性使用BGP/MPLS VPN实现:关联路由器的IP,输入/输出接口界面连接到Route Distinguisher(RD)测试值.打印插件现在可以写入flat-files(print_output_file)特定格式或CSV输出,动态的文件名,历史故障,并触发的http://www.aliyun.com/zixun/aggregation/10374.html">网络流量数据.pmacctd现在支持DLT_LOOP链路类型(

Linux系统下使用mail发送Internet邮件的配置方法

  用惯了windows系统的用户可能一开始对linux系统掌握不好,很多功能可能用起来不是很习惯.本文就介绍了linux系统的一个小应用:在Linux系统下使用mail发送Internet邮件.不过在介绍mail之前先来看一下先来看一下sendmail服务. Red Hat上sendmail服务一般是自动启动的.可以通过下面的命令查看sendmail服务的状态: service sendmail status 如果sendmail服务未启动可以使用如下命令启动: service sendmai

CENTOS 6.3下MYSQL主主互备架构配置

MySQL主主互备结构是基于mysql增量日志基础上的,区别于主从复制结构. 在主主复制结构中,两台服务器的任何一台上面的数据库存发生了改变都会同步到另一台服务器上,这个改变是基于sql语句的改变,如果删除系统数据库源文件或删除后新创建同名MYSQL表实现同步则无效.这样两台服务器互为主从,并且都能向外提供服务,这就比使用主从复制具有更好的性能. 接下来我将使用两个相同的环境来实现这个效果: 系统环境:centos6.3 数据库: mysql-5.6.10 注:在做此项配置之前首先要保证数据库当

Centos 5.6下安装Nagios监控平台

最近需要对公司内的所有服务器进行监控,当然现在有很多软件可以进行这个功能的实现,比如说微软的SCOM,还有就是今天的Nagios软件了,但是前者还好说Windows 平台下的产品,还是比较好配置和安装的,但是如果我们要安装Nagios的话,就可能会有一小些不好搞,因为这个东东是装在Linux平台上的,昨天晚上没怎么睡,搞了搞怎么去装,今天呢把相关的安装方法呢发上来,分享一下,供博友们参考参考. 首先我们来看看,什么是Nagios?,Nagios是一款用来监视系统和网络的开源监控软件,它一般被运行

《构建高可用Linux服务器 第3版》—— 1.6 用开源工具Nagios监控Linux服务器

1.6 用开源工具Nagios监控Linux服务器 1.6.1 CentOS 5.8下的监控工具 在开源系统CentOS 5.8下有许多监控工具,比如实时监控系统状态的Nagios,还有监控网络流量的Cacti和MRTG,以及我个人比较喜欢的NTOP和Iptraf:另外,在CentOS 5.8下也有许多强大的命令行可用于监控系统状态,大家可以在Google上搜索以了解其具体用法. 1.6.2 Nagios应该监控的服务器基础选项 经过工作实践,我们认为Nagios应该监控服务器的参数有如下几个方

zabbix在CENTOS 6.3下的安装部署

最近研究了下群里谈论比较火的一个国外开源网络监控系统ZABBIX,玩过一遍后就深深被他的界面简洁,后台配置逻辑分类清晰,易于配置上手的优点给吸引,立即将单位的系统统一换成这个平台监测,测试了一段时间,效果良好. 之前玩过cacti和nagios,算是一个大家耳熟能详的业内常用的的网管互补组合,但个人感觉前者由于调用snmp协议,导致有时候在网络不太稳定时会有数据丢失情况,后者nagios虽然不依赖于SNMP,但客户端的复杂的安装,初始配置以及需要读懂插件语法导致会让很多初学者望而却步. zabb

Centos 6.3下用Bacula实现远程备份还原

Bacula是一款开源的跨平台网络备份工具,提供基于企业级的CS的备份解决方案.可以对数据进行备份.恢复.以及完整性校验. 功能特点: 支持完全备份,增量备份,差异备份. 支持多种恢复方式 支持多种文件系统下的备份恢复(ext3.ext2.reiserfs.xfs.jfs.smbfs.iso9660.ntfs等) 支持各种备份介质 支持多种操作系统 强大的内部功能 一个完整的bacula备份系统,由下面5个部分组成 Director Daemon:负责监听所有的备份.恢复.验证.存档事务,以及定