浅谈Orabbix监控指标

对于Orabbix监控Oracle来说,它是提供了一个相对轻量级的客户端来综合监控多个数据库实例。从这一点来看,它的角色有点类似于工作中使用的SQLDeveloper或者toad这类的工具。
在之前的章节中,先花了些篇幅去比较zabbix和grid control,其实从功能上来看,基于zabbix的Orabbix的监控功能要有限的多。提供的默认模板中,监控触发器不到20个。
自己梳理了一下,默认的监控触发器在15个左右。

故障类型 报警对应项 错误类型 报错简述
数据库没有数据响应 Oracle:alive High 数据库无数据响应
数据库实例不可用 Oracle:alive High 数据库实例是否可用
数据库中存在锁 Oracle:locks High 数据库中存在锁
session使用量过高 (Oracle:session.last(0)}*100/Oracle:maxsession.last(0)})>80 High session过多,比如session超过80%
Process 使用量过高 (Oracle:procnum.last(0)}*100/Oracle:maxprocs.last(0)})>80 High process过多,比如process超过80%
异常信息的通用审计 Oracle:audit High 异常信息的审计,比如密码错误次数过多
active
session数过高
Oracle:session_active High active session数
用户异常锁定 Oracle:users_locked Warning 用户密码过期或者错误登录次数过多账户锁定
表空间使用率过高 Oracle:showtsps Warning 表空间使用率超过90%
归档日志量过高 Oracle:archive Warning 归档日志量
正常运行时间 Oracle:uptime Average 正常运行情况
PGA 使用量过高 (Oracle:pga.last(0)}*100/Oracle:pga_aggregate_target.last(0)})>90 Average PGA使用率过高
缓存命中率不足 Oracle:hitratio_table_proc.avg(60)}<50|Oracle:hitratio_trigger.avg(60)}<50|Oracle:hitratio_sqlarea.avg(60)}<50|Oracle:hitratio_body.avg(60)}<50 Information 缓存命中率不足

在这个基础上进行了一些额外的补充,比如去检测dg是否可用,检测闪回区空间利用率是否合理,监控内存使用率是否过高等等。

datagurad不可用 Oracle:dg_error High datagurad不可用
剩余内存不足2G Oracle:vm.memory.size[free].last()}<2048m Warning 剩余内存不足2G
闪回区使用率过高 Oracle:archive_area_usage Warning 闪回区使用率过高

其实和实际工作结合起来还有不少的盲点。
比如监听器的监控
是否有有大量的并行查询
DB响应时间的监控
ASM的一些基本监控
rac实例的监控
所以把问题以面铺开来看,还有很多的工作需要做,而不只是局限于当前的监控指标。
当然了也不能这么为难orabbix,我相信这个开发者是希望在Oracle的监控上有所突破,但是还是给我们留下了不少的功课去完成。
自己在sourceforge上下载了源码,源码的实现是基于java,依赖于zabbix基础工程,代码量其实不大,如果能够在这个基础上进行深入扩展,可能还会有更多的惊喜。
比如目前使用orabbix监控表空间的使用明细,比如在数据库A中有10个表空间,在数据库B中有5个表空间,对于表空间的空间剩余量的监控通过SQL就会是下面的形式。
TS1     5%
TS2     9%
TS3     20%
TS4     30%
比如我们需要监控剩余比例在10%以内的,那就是说TS1,TS2了。目前的实现是把结果集当做一个text来对待,还不能把结果集中的每一列单独来处理,所以邮件报警的显示还是不够清晰。还得借助于结果集,然后再次进行脚本格式化显示,实现起来还是不够那么灵活。这个也是我下一步需要攻关的点。
如果我们较真一下,比较一下gc和orabbix的监控指标,gc里面有300多个,粒度,数量上远远超过了orabbix,但是如果你自己静下心来,似乎自己常用的指标其实不到10%。
还是选择适合自己的,满足工作就可以。

时间: 2024-09-30 05:44:35

浅谈Orabbix监控指标的相关文章

浅谈视频监控 在智慧城市建设中的综合治理业务

"996号文件"提出综治牵头,公安负责的建设思路,将原先仅为公安部门服务的平安城市共享平台纳入城市基础设施建设,统一专网,统一系统,高标准建设,将原先分散在各部门的建设资金集中使用,高标准建设一套覆盖全城市的物联网系统,为各部门共享资源,深化应用,服务各业务部门,最终开放数据服务城市生活方方面面.在"996号文件"精神指导下,公安部门应该如何有效引导平安城市快速向智慧城市综合管理系统转变呢?笔者将在下文与各位读者一同探讨. 坚持"顶层设计" 立足

浅谈网络监控软件的部署

基于校园网安全和提高管理效率方面的考虑,网管员们 纷纷用起了各种各样的http://www.aliyun.com/zixun/aggregation/32387.html">网络监控软件.可是试用过后,效果往往不能令人满意,有一些网管软件功能强大,但软件部署条件过于苛刻,最终不得不放弃.如果你也为部署网络监控软件苦恼过,相信本文会给你一些有益的启示. ■ 网络监控软件的分类 网络监控软件数目虽多, 不过根据其对客户机的控制方式,可粗略分为两大类: 1. 连接控制类 其主要实现的功能是:根据

浅谈利用元数管理平台自动化管理指标的方法

目录: 一.企业指标管理的三个核心问题 二.解决指标管理的问题,需要从三个方面入手 三.通过元数据管理平台,实现指标管理在技术上的自动化 四.总结 本文讲的是浅谈利用元数管理平台自动化管理指标的方法,指标直接反映企业的生产运营状况,为企业决策提供数据支撑.随着国家大数据战略与企业数字化转型的驱动,指标的作用越来越重要,指标管理上的诸多痛点让全企业统一的指标管理成为普遍需求.但要想把指标管理好并不容易,不仅需要科学合理的方法,还需要技术的强力支撑. 指标作为一种业务元数据,与企业元数据有着千丝万缕

【转载】运维角度浅谈MySQL数据库优化

 运维角度浅谈MySQL数据库优化 2015-06-02 14:22:02 标签:mysql优化   mysql分库分表分区 mysql读写分离 mysql主从复制 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://lizhenliang.blog.51cto.com/7876557/1657465   一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善.这篇博文主要谈My

浅谈 Linux 高负载的系统化分析

讲解 Linux Load 高如何排查的话题属于老生常谈了,但多数文章只是聚焦了几个点,缺少整体排查思路的介绍.所谓 "授人以鱼不如授人以渔".本文试图建立一个方法和套路,来帮助读者对 Load 高问题排查有一个更全面的认识. 从消除误解开始 没有基线的 Load,是不靠谱的 Load 从接触 Unix/Linux 系统管理的第一天起,很多人就开始接触 System Load Average 这个监控指标了,然而,并非所有人都知道这个指标的真正含义.一般说来,经常能听到以下误解: Lo

浅谈zabbix和Grid control

在IT行业始终在进行着开源和商业的竞争而且双方火力都不差,开源的受众更多是中小企业,免费开源而且用户基数庞大,商业的用户都是一些大中型企业,求稳求成熟的服务. 今天来浅谈一下zabbix和Grid control,限于自己的认识有限,所以先开个题,zabbix也在熟悉和使用中,后续继续补全和更正. zabbix大量在互联网企业使用,很大的一个原因就是MySQL所用,但是它的发展不止于此,对于系统级的监控也是很拿手.按照通用的说法,zabbix是基于WEB界面的提供分布式系统监视以及网络监视功能的

浅谈网站日常维护工作哪些是关键

对于网站维护者而言平时需做哪些事,相信广大的站长朋友们都十分的清楚,但哪些工作才是日常网站维护工作当中最为关键的呢?下面A5站长网SEO诊断优化团队就来和广大的站长朋友们浅谈下究竟网站日常维护工作哪些才是关键? 稳定新鲜的内容更新 内容这项工作永远都会是网站维护者工作的重点所在,无论是什么类型的网站,网站都需要更新内容,没有内容的支撑,网站就别提发展,想要网站有生机,就要每天有规律的写些新鲜的内容,进行网站更新,网站只有有新内容的增加,才能吸引搜索引擎蜘蛛和用户的访问,否则,搜索引擎蜘蛛每次来你

一分钟了解阿里云产品:浅谈阿里云批量计算

阿里云发布批量计算备受关注,今天就让我来浅谈下批量计算吧.   阿里云批量计算服务是一种适用于大规模并行批处理作业的分布式云服务,适用于渲染.生物基因分析.多媒体转码.科学计算.金融保险分析等多个行业领域,解决大规模并行批处理作业问题的通用PAAS服务.自阿里云正式对外开放以来,批量计算服务就在背后默默地支撑着渲染云服务,完成了昆塔动画等超1千万核小时的标杆性渲染业务.现在,批量计算服务正式对外开放,适用于多个通用行业领域.   阿里云批量计算服务可支持十万核级别并发规模,系统按照作业需求动态分

浅谈物联网用户体验目标的变化

云栖TechDay39期,阿里云IoT体验设计专家陈宁带来浅谈物联网用户体验目标的变化的演讲.本文主要从物联网用户体验开始谈起,接着通过智能家电进一步举例说明,着重分析了全屋智能.语音,最后分享了设计语言与期望值.   设计师是对设计事物的人的一种泛称,TA以视觉传达的方式来表现TA的工作或作品.随着新技术的不断涌现,设计师学习和实践的不仅仅是设计技能,还有运营技能.产品技能,更要有发现.分析和解决问题的技能. 本文主要从物联网用户体验开始谈起,接着通过智能家电进一步举例说明,着重分析了全屋智能