分布式监控系统ganglia配置文档

一、Ganglia的组件

Ganglia包括如下程序,他们之间通过XML格式传递监控数据,达到监控效果。

Gmetad 这个程序负责收集各个cluster的数据,并更新到rrd数据库中。

Gmond 收集本机的监控数据,发送到其他机器上。收集其他机器的监控数据,供Gmetad读取。默认监听端口8649

web front-end 一个基于web的监控界面,需要和Gmetad安装在同一个节点上,从Gmetad取数据,并且读取rrd数据库,生成图片,显示出来。

二、Ganglia的工作模式

Ganglia的收集数据工作可以工作在单播(unicast)或多播(multicast)模式下,默认为多播模式。

单播:发送自己收集到的监控数据到特定的一台或几台机器上,可以跨网段

多播:发送自己收集到的监控数据到同一网段内所有的机器上,同时收集同一网段内的所有机器发送过来的监控数据。因为是以广播包的形式发送,因此需要同一网段内。但同一网段内,又可以定义不同的发送通道。

三、Ganglia的安装

Ganglia的安装非常简单,分为监控管理端(Gmetad)和客户端(Gmond)安装两部分,已经写成安装脚本,这里不在描述。

推荐安装版本是ganglia-3.4.0,可以在http://sourceforge.net/projects/ganglia/files/下载安装。

四、Ganglia的配置

这里介绍一个简单的Ganglia配置构架,即一个监控管理端和多个客户端,我们假定gmond工作在多播模式,并且有一个Cluster1的集群,里面有10台服务器(从host1到host10),在同一个网段内。

1、监控管理端配置

监控管理端的配置文件是gmetad.conf,在安装Ganglia的etc目录下可以找到,这个文件配置非常简单,介绍如下:

data_source "Cluster1" host1 host2

xml_port 8651

interactive_port 8652

rrd_rootdir "/var/lib/ganglia/rrds"

data_source参数定义了集群名字,以及集群中的节点。由于采用multicast模式,每台gmond节点都有本Cluster1内节点机器的所有监控数据,因此不需要把所有节点写入data_source中。建议写入不低于2个,在host1节点死机的时候,会自动找host2节点取数据。

xml_port定义了一个收集数据汇总的交互端口,如果不指定,默认是8651,可以通过telnet这个端口得到监控管理端收集到的客户端的所有数据。

interactive_port 定义了Web端获取数据的端口,这个端口在配置Ganglia的web监控界面时需要指定。

rrd_rootdir参数定义了rrd数据库的存放路径,gmetad收集到监控数据后,会更新到该目录下的对应的rrd数据库中。

上面通过data_source参数定义了一个监控集群,如果要监控多个应用系统,可以通过如下方式定义:

data_source "my cluster" 10 localhost  my.machine.edu:8649  1.2.3.5:8655

data_source "my grid" 50 1.3.4.7:8655 grid.org:8651 grid-backup.org:8651

data_source "another source" 1.3.4.7:8655  1.3.4.8

在定义集群节点的时候,可以采用主机名、IP地址等形式,也可以加端口,如果不加端口的话,默认是8649端口,同时可以设定采集数据的频率,如上面的“10 localhost、50 1.3.4.7:8655”等,分别表示每隔10秒钟、50秒钟采集一次数据。

时间: 2024-11-05 06:03:58

分布式监控系统ganglia配置文档的相关文章

分布式监控系统Ganglia,测试中的监控技术

我们在测试活动中,时常关注一些性能数据,这些数据从哪儿来?很显然,放在我们面前的第一道关卡便是监控技术,我们需要合理的,可以高度扩展和集成的监控系统,可以实时监控性能数据,并将他们用漂亮的方式展现出来,云时代背景下诞生了这么一些给力的工具,他们中有一些名字已经让大家足够熟悉了,Nagios,Gmond等,他们中还有一个强大的身影,就是今天给大家分享的Ganglia. Ganglia Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,如集群和网格.它是基于分层设计,它使用广泛的

集群监控系统Ganglia应用案例

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://chenguang.blog.51cto.com/350944/1330114 集群监控系统Ganglia应用案例 --我们把集群系统投入生产环境后,这时就需要一套可视化的工具来监视集群系统,这将有助于我们迅速地了解机群的整体配置情况,准确地把握机群各个监控节点的信息,全面地察看监控节点的性能指标,使机群系统具有较高的管理性.监视系统的主要目标是从各个监控节点采集监控信息,如CP

惠普打印机打印WORD,系统提示“该文档未能打印 本地下层文档”解决办法

打印WORD,系统提示"该文档未能打印 本地下层文档",打印机是惠普的,搞了一天,驱动和系统都重装几遍了,还是没用   解决办法 出现"文档未打印"   有以下几个原因:     1. 电脑USB插口接触不良生锈或有氧化层或松动! 清理或改换别的USB插口.     2.主板供电不足. 这个就有些麻烦,但可以 改用高速打印线USB2.0线改善.     3.电源或交流电压过低. 更换主机电源 或加装 稳压器     4.病毒阻碍打印机软件驱动或者电脑配置低打开的启动

分布式监控系统Zabbix3.2给异常添加邮件报警

在前一篇 分布式监控系统Zabbix3.2跳坑指南 中已安装好服务端和客户端,此处客户端是被监控的服务器,可能有上百台服务器.监控的目的一个是可以查看历史状态,可以对比零晨和工作区间数据的对比,以便后期进行优化指导.还有一个是报警,总不能等到服务器出现异常了才去从头查是什么问题吧.所以这篇主要介绍报警中最基础的一个 配置邮件预警. 通常zabbix提供了 e-mail.sms.jabber.微信等预警方式,sms等前期需要资金投入那就先否决吧,谁叫老板不给钱. 安装邮件发送工具mailx 这里我

分布式监控系统Zabbix3.2监控数据库的连接数

在 分布式监控系统Zabbix3.2跳坑指南 和 分布式监控系统Zabbix3.2给异常添加邮件报警 已经介绍了如何安装以及报警.此篇通过介绍监控数据库的3306端口连接数来了解如何监控其它端口和配置自定义监控项的过程. 添加监控脚本 在要监控的客户端上新建脚本: /usr/local/zabbix/alertscripts/check_3306_port_num.sh 内容如下: #!/bin/bash ss -an|grep 3306|grep ESTAB|wc -l  这个脚本很简单,就是

分布式监控系统Zabbix3.2对数据库的连接数预警

在前篇分布式监控系统Zabbix3.2监控数据库的连接数 中已经对数据库的端口3306进行了监控,可以看到数据库的连接数历史变化有高有低,那如果达到了数据库连接数的阀值是不是主动通知给运维人员去检查问题呢,总不能实时盯着看吧,下面就怎么配置预警作简单介绍. 在这里我们是针对模板级别来进行配置,而有些园友如果只针对某台服务进行预警那也是可以的,只需要在此台服务器上的触发器列表中添加一项即可,配置步骤一样. 配置触发器 找到Template App MySQL模板 >触发器>创建触发器 在新增页面

win7系统电脑打印文档后出现隐藏的网站链接怎么去掉?

  win7系统电脑打印文档后出现隐藏的网站链接怎么去掉?         方法一: 1.按ALT+F9可将文档中的域代码全部显示出来(特有字会被链接替换); 2.然后编辑--替换,在查找内容中输入除{ }符号的其它字符(如果将符号{}一并拷贝过来的话会自动换为特有字),在"替换为"中输入特有字,"全部替换"即可. 方法二: 1.工具--选项,在"打印"选项卡中找到"打印文档的附加信息",取消勾选"域代码"

安装Win7系统后Word文档字体变化

问题:电脑安装Win7系统后Word文档字体变了,这是怎么回事呀? 解答:为了工作的需要,笔者将Win-XP升级成了Win7,却也同时产生了一个问题,就是笔者的所有Word文档中仿宋字体都改变了.问了同事,也存在这个问题.在网上搜查,才知道原因是Win7中没有自带仿宋_GB2312字库,需要自己下载安装.按照说明,下载了仿宋_GB2312字库,放在C盘-Windowsfonts中.一切又OK了.

win7系统编辑word文档后无法保存怎么办?

  win7系统编辑word文档后无法保存怎么办? 1.首先我们在无法保存的文档上单击右键,选择属性; 2.在属性界面中查看"只读"前面是否有打钩,有的话把钩去掉,然后点击应用并确定即可; 3.检查保存的目录磁盘空间是否不足,打开计算机,在保存文档的磁盘上单击右键,选择属性即可看到(如果是保存在桌面上的,查看C盘系统盘的磁盘空间即可); 4.检查一下是否有com加载项,打开word文档,点击工具,点击"自定义",然后点击"命令"选卡,先在类别框内