运维监控利器Nagios的安装指南

本章主要介绍开源监控软件Nagios的安装配置和使用技巧o Nagios是系统管理人员和运维监控人员必需的工具之一,利用Nagios可以监控本地或远程主机资源,如磁盘空间、系统负载等情况,也可以监控各种应用服务,例如HTTP服务、FTP服务等。当主机或服务出现故障时,Nagios还可以通过邮件、手机短信等形式在第一时间通知系统维护人员。作为一名系统管理人员,一定不要错过这个功能强大的开源监控软件。

Nagios综述

作为一名运维人员或系统管理员,难免会遇到主机或服务异常的情况。遭遇故障并不可怕,可怕的是在出现故障后,系统管理人员并不知道。由于没有及时发现故障,不但解决问题时存在困难,而且可能带来很大的损失。因此,一个能完成对主机或服务进行检测的自动化工具对于运维人员或系统管理员来说非常重要。Nagios就是一个这样的开源管理软件,通过Nagios可以轻松实现对远程主机、服务以及网络的全面监控。

1、什么是Nagios

Nagios是一款Linux上成熟的监视系统运行状态和网络信息的开源IT基础设施监视系统。Nagios能监视所指定的本地或远程主机及服务,同时提供异常通知、事件处理等功能。与商业IT管理系统,如IBM Tivoli、HP OpenView/Operations等相比,Nagios具有成本低廉、结构简单、可维护性强等诸多优点,越来越受IT运维人员和系统管理员的青睐。

Nagios可运行在Linux和UNIX平台上,同时提供一个可选的基于浏览器的Web界面,以方便系统管理人员查看系统的运行状态、网络状态、各种系统问题及日志异常等。

2、Nagios的结构与特点

从结构上讲,Nagios可分为核心和插件两个部分。Nagios的核心部分只提供了很少的监控功能,因此要搭建一个完善的IT监控管理系统,用户还需要为Nagios安装相应的插件,这些插件可以从Nagios官方网站下载,也可以根据实际要求编写。

Nagios的主要功能特点如下:

口监视本地或者远程主机资源(内存、进程、磁盘等)。
口监视网络服务资源(HTTP、PING、FTP、SMTP、POP3等)。
口允许用户编写自己的插件来监控特定的服务。
口当被监控对象出现异常时,可以通过邮件、短信等方式通知管理人员。
口可以事先定义事件处理程序,当主机或者服务出现故障时自动调用指定的处理程序。
口可以通过Web界面来监控各个主机或服务的运行状态。

1、安装Nagios

1.安装前的准备

(l)创建Nagios用户和用户组

将Nagios进程的运行用户和组设置为nagios,并且将nagios的主程序目录设置为nagios,以保证系统的安全(当然设置为root用户也是可以的,但是不建议这么做)。基本操作如下:

[root@localhost ~]# useradd -s /sbin/nologin nagios
[root@localhost ~]# mkdir /usr/local/nagios
[root@localhost ~]# chown -R nagios.nagios /usr/local/nagios/

(2)开启系统的sendmail服务

在Nagios监控服务器上开启sendmail服务的主要作用是让Nagios在检测到故障时可以发送报警邮件。目前几乎所有的Linux发行版本都默认自带了sendmail服务,所以,在安装系统时只需开启sendmail服务即可,并不需要在sendmail上进行任何配置。

时间: 2024-11-02 19:22:49

运维监控利器Nagios的安装指南的相关文章

运维监控利器Nagios性能分析图表的实现

1.Nagios性能分析图表的作用 &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   Nagios对服务或主机监控的是一个瞬时状态,8630.html">有时候系统管理员需要了解主机在一段时间内的性能及服务的响应状态,并且形成图表,这就需要通过查看日志数据来分析.但是这种方式不但烦琐,而且抽象.不过幸运的是,PNP可以帮助我们来完成这个工作. 2.PNP的概念与安装环境 PNP是一个小巧的开源软

运维监控利器Nagios的运行和维护

本文涉及到Nagios的运行和维护,从验证Nagios配置文件的正确性,启动与停止Nagios及Nagios遇到故障时的报警机制来进行详细的说明. 1.验证Nagios配置文件的正确性 在上节中,已经配置完成了一个基本的Nagioshttp://www.aliyun.com/zixun/aggregation/23104.html">监控系统.那么如何知道配置文件的正确性呢?Nagios在这个方面做得非常到位,只需通过如下一个命令即可完成: /usr/local/nagios/bin/na

运维监控利器Nagios的配置攻略

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   Nagios主要用于监控一台或者多台本地主机及远程主机的各种信息,包括本机资源及对外的服务等.默认的Nagios配置没有任何监控内容,仅是一些模板文件.下面通过理论与实践相结合的方式详细介绍如何搭建一个完善的Nagios监控系统. 1.默认配置文件介绍 Nagios安装完毕后,默认的配置文件在/usr/local/nagios/etc目录下,每个文件或目录的用途

建设DevOps统一运维监控平台,全面的系统监控你做好了吗?

随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展,机器越来越多,应用越来越多,服务越来越微,应用运行基础环境越来多样化,容器.虚拟机.物理机不一而足.面对动辄几百上千个虚拟机.容器,数十种要监控的对象,现有的监控系统还能否支撑的住?来自于容器.虚拟机.物理机.网络设备.中间件的指标数据如何采用同一套方案快速.完整的收集和分析告警?怎样的架构.技术方案才更适合如此庞大繁杂的监控需求呢 一.统一监控平台架构解析 先做一下回顾,统一监控平台由七大角色构成:监控源.数据采集.数据存储.数

轻松监控上万台服务器:企业运维监控平台架构设计与实践指南

一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择  1.cacti   Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具.   简单的说Cacti 就是一个PHP 程序.它通过使用SNMP 协议获取远端网络设备和相关信息,(其实就是使用Net-SNMP软件包的snmpget 和snmpwalk 命令获取)并通过RRDTOOL 工具绘图,通过PHP 程序展现出来.我们使用它可以展现出监控对象一段时间内的状态或者性能趋势

用大数据思维做运维监控

今天一大早就看到了一篇文章,叫[大数据对于运维的意义].该文章基本上是从三个层面阐述的: 工程数据,譬如工单数量,SLA可用性,基础资源,故障率,报警统计 业务数据,譬如业务DashBoard,Trace调用链,业务拓扑切换,业务指标,业务基准数据,业务日志挖掘 数据可视化 当然,这篇文章谈的是运维都有哪些数据,哪些指标,以及数据呈现.并没有谈及如何和大数据相关的架构做整合,从而能让这些数据真的变得活起来.比较凑巧的是,原先百度的桑文峰的分享也讲到日志的多维度分析,吃完饭的时候,一位优酷的朋友也

最简单也最难:运维监控的最后1公里

谈运维我们不得不提监控,监控是运维的起点,也是难点.随着IT架构逐渐复杂化,从前端到IT底层,中间涉及浏览器.网络.服务器.操作系统.中间件.应用.数据库等,每个环节厂商不尽相同.当出现异常需要定位哪个环节出了问题的时候,排查就耗时耗力,若使用优云监控产品,以上难题不再是问题.优云全栈运维监控覆盖了所有环节的监控,真正做到监控无盲区,运维无隐患. 运维最后一公里是指高度可视化.优云除了提升监控能力还注重可视化,深知可视化是运维的亮点更是本质,为了让每个环节监控的数据更好的展现出来,优云拥有一批在

用大数据思维做运维监控是怎样一种体验?

早先就看到过这样一篇文章,叫<大数据对于运维的意义>.该文章基本上是从三个层面阐述的:   工程数据,譬如工单数量,SLA可用性,基础资源,故障率,报警统计 业务数据,譬如业务DashBoard,Trace调用链,业务拓扑切换,业务指标,业务基准数据,业务日志挖掘 数据可视化   当然,这篇文章谈的是运维都有哪些数据,哪些指标,以及数据呈现.并没有谈及如何和大数据相关的架构做整合,从而能让这些数据真的变得活起来.   比较凑巧的是,原先百度的桑文峰的分享也讲到日志的多维度分析,吃完饭的时候,一

优云蒋君伟:运维监控大数据的提取与分析

本文内容整理来自[敏捷运维大讲堂]蒋君伟老师的线上直播分享.分别从以下3个维度来分享:1.云时代监控分析的窘境:2.使用标签标记监控数据的维度:3.监控数据应用场景. 云时代监控分析的窘境 在虚拟化与容器技术广泛应用的情况下,运维对象大规模地增长,监控平台每天存储的指标都以亿计,所以监控数据如今已经成了大数据.传统的监控工具在这种场景下,对于数据的提取分析,已经力不从心,反而成为了运维的负担. 我们用一个典型的互联网档案分析应用举例说明: 这个应用支持容灾与负载均衡,它部署在三个数据中心,并同时