一则orabbix报警的分析(第一篇)

最近使用zabbix监控之后，都会在凌晨收到1台数据库服务器的报警短信，报警的内容为: No data received from Orabbix
这个错误其实就是orabbix通过jdbc已经接受不到数据库实例的信息了，但是隔了10来分钟之后，又会收到问题恢复的短信。
既然问题已经自动修复了，可能在那个时间段里有一些固定的操作，操作完成之后，数据库实例的负载就自动恢复了。
可以从监控DB time的趋势图中看出一些端倪。

根据提示的信息查看了问题时间段的awr和对应ash报告。
先来看awr报告，这个报告中的等待时间主要就是control file sequential read，占到了大概65%的比例。

Event	Waits	Time(s)	Avg wait (ms)	% DB time	Wait Class
control file sequential read	628,810	3,843	6	65.33	System I/O
DB CPU		847		14.40
db file sequential read	90,656	314	3	5.34	User I/O
log file sync	2,572	297	116	5.06	Commit

而查看ash报告，对这个等待事件进一步解读发现对应的file#为0

Event	% Event	P1, P2 , P3	% Activity	Parameter 1	Parameter 2	Parameter 3
control file sequential read	38.21	"0","1","1"	6.14	file#	block#	blocks
		"0","17","1"	3.41	file#	block#	blocks
		"0","18","1"	2.71	file#	block#	blocks

对于这个等待事件的主要原因还是对于基表的大量访问，同时会有大量的控制文件读写。
然后进一步抓取top sql,可以看到存在两个查询语句。

Elapsed Time (s)	Executions	per Exec (s)	%Total	%CPU	%IO	SQL Id	SQL Module	SQL Text
1,789.17	30	59.64	30.42	0.74	8.18	92t2p1mb77fd2	JDBC Thin Client	SELECT * FROM ( select '- Tabl...
1,745.27	35	49.86	29.67	0.92	5.01	fhud2jfjwy64g	JDBC Thin Client	SELECT to_char(sum( NVL(a.byte...

我们贴出其中一条。可以看出这一条是在查询资源的使用情况。
SELECT to_char(sum( NVL(a.bytes/1024/1024 - NVL(f.bytes/1024/1024, 0), 0)), 'FM99999999999999990') retvalue FROM sys.dba_tablespaces d, (select tablespace_name, sum(bytes) bytes from dba_data_files group by tablespace_name) a, (select tablespace_name, sum(bytes) bytes from dba_free_space group by tablespace_name) f WHERE d.tablespace_name = a.tablespace_name(+) AND d.tablespace_name = f.tablespace_name(+) AND NOT (d.extent_management like 'LOCAL' AND d.contents like 'TEMPORARY')
对于这个语句还是有一些印象，这是因为在orabbix默认提供的监控项中还是有这么一个sql语句的。
看来orabbix监控的时候，默认提供的语句就把自己给弄糊涂了。
仔细查看这个语句，里面存在大量的基表数据访问。为什么其它的库没有报这种问题，而这个库报了呢，一个原因就是这个库的数据文件比较多，大概有900多个，在平时运行的时候就有些慢了，其它的库相对数据文件要少很多，所以这方面的隐患就小很多。
所以这个问题到目前为止，发现这样两个orabbix默认提供的监控sql还是存在一定的隐患，可以后续改进，但是问题至少需要缓解吧。
从上面的图表可以看到，这两条语句在一个小时内基本运行了30次左右，也就是2分钟一次。
如果从orabbix的配置来看，执行频率确实是2分钟一次。
dbsize.Perod=2
dbfilesize.Period=2
所以在执行的过程中，下次发起请求的时候上次的结果还没有返回，就有了orabbix的报警。
对于这个问题，先暂时缓解，后续进行改进，我们可以尝试调大这个执行频率，比如几个小时执行一次，因为数据文件的使用情况的监控也不需要精确到分钟去详细统计，只需要得到一个大概的增长情况即可。
所以这样改进之后，后续持续改进这个监控项会有一定的提升。
通过这个案例我们可以看到如果监控工具本身的监控语句就不够优化，结果造成了性能隐患还是比较尴尬的，还是需要借鉴它的思想，持续改进。
末尾还有个问题就是，既然这个语句相对执行较慢，为什么平时不报警告，而在特定的时间点会报警呢，下一篇中会进行进一步的分析。

时间： 2024-12-24 08:58:53

一则orabbix报警的分析(第一篇)的相关文章

android emulator虚拟设备分析第一篇之battery

一.概述本文使用的android版本是5.1.0_r1,goldfish内核版本是3.4,android镜像是x86架构的.本文以battery为例,完整地介绍了虚拟设备的实现和使用. 为什么android emulator需要虚拟设备,简单来说就是android系统需要使用,但是host系统却没有,比如gps,bluetooth,battery,gsm等.另外,虚拟设备也提供了android emulator和guest os之间交流的方式,比如emulator控制面板中可以设置电池的电量,

《Hadoop与大数据挖掘》——第一篇基　础　篇第1章浅谈大数据 1.1 大数据概述

第一篇基础篇第1章浅谈大数据当你早上起床,拿起牙刷刷牙,你是否会想到从拿起牙刷到刷完牙的整个过程中有多少细胞参与其中?这些细胞在参与的过程中会结合周围环境(可能是宏观的天气.温度.气压等,可能是微观的分子.空气中的微生物等),由你的意识控制而产生不同的反映.如果我说结合这些所有的信息,可以预测你接下来的0.000 000 01秒的动作,那么,你肯定说,这我也可以预测呀.比如正常情况下,你脚抬起来走路,那么抬起来后,肯定是要落下去的,这算哪门子预测呢?那如果我说可以预测你接下来一个小时

《C语言解惑》—— 第一篇 C语言编程中的对与错

第一篇 C语言编程中的对与错本篇主要采用分析编程中存在的典型错误.对比正确与错误程序的方法,使读者加深印象并提高分辨语法对错及编程的能力,进而达到尽快掌握C语言编程基础知识的目的.

ASP基础入门第一篇(ASP技术简介)_应用技巧

本文将以如何建立基于IIS 的ASP 动态网站为中心向大家一步一步地揭示动态商业网站设计的真正奥秘.为了使各位能够全面.细致地掌握 ASP 的开发技巧,本文今后将采取连载的形式,手把手地教你如何建立属于自己 ASP 动态网站.由于本文是作者根据自己的学习和实践经验并结合了一些外文资料而写成的,因此不免会有一些偏颇,希望各位见谅. Microsoft Active Server Pages 即我们所称的ASP ,其实是一套微软开发的服务器端脚本环境, ASP 内含于 IIS 3.0 和 4.0 之

《数据库技术原理与应用教程（第2版）》——第一篇基础篇第1章数据、数据管理与数据处理 1.1 概述

第一篇基础篇数据库技术是计算机学科中的一门重要分支,它已有五十余年历史并已成为一门完整的学科,其主要内容包括基础理论.基本操作及开发应用等. 数据库技术的基础理论部分是构成该学科的基石,它给出了该学科的抽象的.全局的研究结果并对整个学科起指导性作用. 在本书中,基础部分由两方面内容组成,它们是数据库技术的一般性理论和关系数据库技术的理论. 1.数据库技术的一般性理论第1~3章介绍数据库技术的一般性理论.其中第1章介绍有关数据.数据管理与数据处理的一般性概念:第2章介绍数据库技术中的基础知识

linux0.11内核源码剖析:第一篇内存管理、memory.c【转】

转自:http://www.cnblogs.com/v-July-v/archive/2011/01/06/1983695.html linux0.11内核源码剖析第一篇:memory.c July 二零一一年一月六日 ----------------------------------------- 博主声明:1.本系列非linux系统教程,仅仅是针对linux0.11内核源码,所做的剖析,注释.2.本系列参考:深入理解linux内核.linux内核完全注释,linux内核源代码情景分析

如何提高WEB程序的效率 (第一篇SQL篇)　　(转）

web|程序如何提高WEB程序的效率 (第一篇"SQL篇") 很多网友非常不喜欢用ASP来编程,他们总是抱怨说ASP程序太慢,效率太低.更希望用PHP,JSP等来写程序.其实不能从 "认为" 这个角度来看问题 ,而应该从实际中看问题,ASP真的很慢的吗,那么微软的站为何用ASP也不慢呢?PHP真的很快吗,其实它也仍然是解释性的语言.只不过在Linux下的结合比较好而以.JSP的开发也不会简单到何处,而且要通过JDBC-ODBC桥才能连接ACCESS库等,这种情况下

如何提高WEB程序的效率 (第一篇)

web|程序很多网友非常不喜欢用ASP来编程,他们总是抱怨说ASP程序太慢,效率太低.更希望用PHP,JSP等来写程序.其实不能从 "认为" 这个角度来看问题 ,而应该从实际中看问题,ASP真的很慢的吗,那么微软的站为何用ASP也不慢呢?PHP真的很快吗,其实它也仍然是解释性的语言.只不过在Linux下的结合比较好而以.JSP的开发也不会简单到何处,而且要通过JDBC-ODBC桥才能连接ACCESS库等,这种情况下效率也不高. 其实,三种语言各有特点,就是优,缺点.作为一个程序员不应

CoreOS Fest 系列之第一篇：容器江湖

本文讲的是CoreOS Fest 系列之第一篇:容器江湖,[编者的话] 这是总结 CoreOS Fest 大会的三篇文章之一,主要介绍了 CoreOS 公司与 Docker 公司之争,新成立的 appc 规范委员会, Tectonic 平台, Kubernetes 项目. 最近在旧金山, Linux 容器已经显得非常有「钱」景,看起来每个人都想从这个有几十亿美金规模的新市场中分得一杯羹.多家创业公司和云主机公司已经或者即将召开有关容器的大会,包括 4 月 17 日召开的 Container Ca

猜你喜欢

被Dmoz拒绝的16个理由

被Dmoz拒绝郁闷吧?到底Dmoz的收录原则是什么?我们也不知道,但是我们可以分析一下被拒绝的原因,改善好了可能会被尽快收录. 被Dmoz拒绝的16个理由正在建设的站点.(内容是否完整) 网站外观风 ...

代码详解：ASP读取XML数据文件的方法

xml|数据|详解分别保存下面两段代码,一个保存为readxml.asp另一个保存为test.xml,放在同一个目录下面,调试程序即可,在程序里面我已经做了解释,读取代码可以做成一个readxml的 ...

百度再次激怒SEOer 企业救命稻草再次被打击

SEO,从诞生那天起就是搜索引擎的天敌,纠结其原因主要是降低了其搜索引擎自身的竞价排名.在近几年,越来越多的企业已经知道SEO!国外的情况咱不知道,但是在国内,百度已经多次人工干预排名了.起初百度动作 ...

sql server函数介绍-文件类

1.设置内存选项 --设置 min server memory 配置项 EXEC sp_configure N'min server memory (MB)', 0 --设置 max server m ...

win8怎么取消开机动画

win8怎么取消开机动画 Win8取消开机动画步骤 1.在进入Win8系统传统桌面后,右键点击"计算机",选择"属性".接着在打开的计算机属性窗口上点击& ...

怎样用电脑上微信

这里推荐一款安卓模拟器(BlueStacks) Beta-1,(电脑上安装安卓手机模拟器的方法 )可直接安装apk安卓软件,并模拟运行,完美模仿安卓手机系统的操作,是一款难得的安卓模拟器.这样你不就是 ...

怎么解决Win7 32位系统下双击文件夹无法正常打开而是弹出搜索界面

答:可以通过注册表来恢复,具体步骤如下: 解决方法: 可以通过修改注册表来恢复,解决Win7系统双击无法打开文件夹的问题. 具体操作步骤如下: 1.首先在键盘上的同时Windows徽标键+R组合键 ...

js-html中iframe的高度问题

问题描述 html中iframe的高度问题我在项目A的jsp中嵌入了一个iframe,iframe的src 的路径是项目B ,我想要iframe的高度可以根据iframe中嵌的内容的高度实现自适应, ...

从小站到大站的部署架构总结

- 今天給大家介绍下运维部署常见的架构模型,以及他们的演变过程.你所接触的站点用的什么部署模型呢?? ** 一.常见的网站部署架构模型 ** 一. 单机集中式 1.1 什么是单机集中方式? 单机-单个 ...

How to improve Java&#39;s I/O performance（提升 java i/o 性能）

原文:http://www.javaworld.com/article/2077523/build-ci-sdlc/java-tip-26--how-to-improve-java-s-i-o-per ...

checkbox-action中如何获取jsp页面append出来的标签值?

问题描述 action中如何获取jsp页面append出来的标签值? if($(""#byUserId"").is("":checked&q ...

机器人与关键技术解析

机器人(robot)一词,最早出现在1920年捷克科幻作家恰配克的<罗索姆的万能机器人>中,原文作"Robota",后来成为英文中通行的"Robot" ...

grub 详解2

GRUB 是引导装入器(boot loader) -- 它负责装入内核并引导 Linux 系统.GRUB 还可以引导其它操作系统,如 FreeBSD.NetBSD.OpenBSD.GNU HURD 和 ...

maven 编译时pom出现问题

问题描述 maven 编译时pom出现问题安装maven是命令下提示配置成功,但使用install命令是总显示找不pom.xml文件,修改了目录也不行?求解,非常感谢

《CUDA高性能并行计算》----0.2　学习CUDA的“须知”

本节书摘来自华章出版社 <CUDA高性能并行计算> 一书中的第0章,第0.2节, 作者 CUDA for Engineers: An Introduction ...

【Qt编程】基于Qt的词典开发系列--后序

从去年八月份到现在,总算完成了词典的编写以及相关技术文档的编辑工作.从整个过程来说,文档的编写比程序的实现耗费的时间更多.基于Qt的词典开发系列文章,大致包含了在编写词典软件过程中遇到的技术重点与难点 ...

操作系统概念学习笔记 16 内存管理(二) 段页

操作系统概念学习笔记 16 内存管理 (二) 分页(paging) 分页(paging)内存管理方案允许进程的物理地址空间可以使非连续的.分页避免了将不同大小的内存块匹配到交换空间上(前面叙述的内存管 ...

什么是深网、暗网与黑网？别混淆了

近年来,小编听说了很多关于暗网的报道,一直搞不太清楚一些关系和名词,今天就一起来了解一下. 互联网是巨大的,我们日常访问的其实只是冰山上面的部分,但在冰山的下面藏着不比互联网小的深网(Deep Web ...

网络编程-有关于Socket的问题,简单的服务器程序与客户程序之间的通信

问题描述有关于Socket的问题,简单的服务器程序与客户程序之间的通信问题是这样的,我写了两个简单的服务器程序,其中一个与一个简单的客户程序可以连续发多次信息,而另一个则不可以,发一次它就会不能 ...

js实现浏览本地文件并显示扩展名的方法_javascript技巧

本文实例讲述了js实现浏览本地文件并显示扩展名的方法.分享给大家供大家参考.具体如下: 这里用文件域浏览指定文件,可以显示该文件的扩展名,想想它可以用在哪里?可以用在文件上传系统上,用来判断上传的文件 ...

央视3.15晚会延迟,澄清并非撤稿

昨天晚上,央视"3·15"晚会迎来了第25个现场直播.原本应该在20点直播的晚会推迟到了20点44分.一向以揭黑.打大老虎著称的"3·15"晚会推迟,引来了网友 ...

如何利用10万元为APP带来2000万用户

看到标题,估计很多人都会觉得我在开玩笑.当然,如果用的是传统的推广方法,当然是不可能的.所谓传统的APP推广方法,其实就是找渠道首发,找其他APP换量,刷榜.然后就是花钱cpa,cpc等等,这些办法本 ...

做站一月1000IP月赚5000

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅每当晚上这个时候,流浪在图王的A5 ...

博客的潜力与价值有多大？

http://www.aliyun.com/zixun/aggregation/5038.html">博客在刚出现时,不过是记录日记的工具,而如今最变成了最流行最便捷的传递信息的方式. ...

javascript实现漂亮的拖动层，窗口拖拽特效_javascript技巧

javascript实现漂亮的拖动层,窗口拖拽特效 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ...

ssh 不同页面传值问题

问题描述 ssh 不同页面传值问题一个a.jsp页面(该页面有别的页面的a链接eg:b.jsp.c.jsp,同时b.c页面也有a页面的链接),表单请求到后台,可以把传过去的参数显示在a.jsp页面 ...

★ASP.NET最强编辑器 CuteEditor 6.0 在线HTML编辑器的领航者★

问题描述附带lic文件,完美无限制! 解决方案解决方案二:lic文件是什么解决方案三:license解决方案四:该回复于2008-11-13 13:21:36被版主删除解决方案五:牛

J2ME中有没有方法读取SIM卡中的内容?

其实国外也在讨论这个问题,呵呵. 一般性的答案是:可以的.只不过现在的手机尚且不支持此标准. 更多的信息: 对于JavaCard这种东西,MIDP2.0中扩展了一个叫做Security and T ...

Ruby中类变量和实例变量的比较_ruby专题

1.类变量名以@@开始,一个类变量被这个类所有的实例对象共享;实例变量名以@开始,每个实例对象有各自不同的实例变量; 2.类变量在使用前必须初始化,否则在使用时会报错;而实例变量如果没有初始化,则使用 ...

《APEX》被网友谴责剽窃《团队要塞2》

近日,韩国Nexon子公司Symmetricspace开发的新款休闲射击网游<APEX>被众多韩国网友谴责,称其剽窃了<团队要塞2>(Team Fortress2)的游戏角色和 ...

热搜