一个dg警告发现的硬件问题

今天收到一条报警短信,提示dg似乎出了点问题。信息的来源是从v$dataguard_status里面扫描得到的最新错误。
2015-09-15 22:06:19.0 Log
Transport ServicesErrorError 12541 received logging on to the standby
2015-09-15
22:06:19.0 Log Transport ServicesErrorPING[ARC1]: Heartbeat failed to connect to
standby 'stest11g'. Error is 12541. 
看样子是心跳的检测失败了,看来主库和备库之间的网络可能出现了延迟之类的问题,在最大性能模式下,这个还是能够接受的,当时就没有在意。
等过了一会之后,自己想还是看看到底是怎么回事吧,毕竟别的库就没有保护这样的错误。
连接到备库之后,发现ssh连接是正常的,证明备库还是能够访问的,没有出现备库的宕机问题。
查看实例也存在,但是监听器给停掉了。自己也感觉挺奇怪,监听怎么会自动停掉呢。就手工启动,结果启动就报了下面的错误。
lsnrctl start listener
LSNRCTL for Linux: Version 11.2.0.4.0 - Production on 14-SEP-2015 23:27:38
Copyright (c) 1991, 2013, Oracle.  All rights reserved.
Starting /DATA/app/oracle/product/11.2.0.4/bin/tnslsnr: please wait...
TNS-12547: TNS:lost contact
 TNS-12560: TNS:protocol adapter error
  TNS-00517: Lost contact
   Linux Error: 32: Broken pipe
对于这个问题还是有些陌生,启动监听失败,启动其它的监听也是同样的错误,这个时候还是来看看日志里面是怎么描述的吧。
结果切换到监听日志的路径下,使用ll命令就得到了下面的错误。
$ ll log
ls: reading directory log: Input/output error
total 0
ls: reading directory .: Input/output error   
这个错误又陌生了,查看资料显示应该是文件系统出了问题。
怎么 验证呢,使用dmesg来做或者使用MegaCli都可以。
> dmesg|grep sd|less
sd 0:2:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
sd 0:2:0:0: [sda] CDB: Write(10): 2a 00 13 f4 21 38 00 00 08 00
Buffer I/O error on device sda8, logical block 33423143
lost page write due to I/O error on sda8
end_request: I/O error, dev sda, sector 331257944
Buffer I/O error on device sda8, logical block 32984587
lost page write due to I/O error on sda8
end_request: I/O error, dev sda, sector 303472624
end_request: I/O error, dev sda, sector 628396920
JBD2: Detected IO errors while flushing file data on sda8-8
Aborting journal on device sda8-8.
EXT4-fs error (device sda8) in add_dirent_to_buf: Journal has aborted
EXT4-fs error (device sda8): ext4_journal_start_sb: Detected aborted journal
EXT4-fs (sda8): Remounting filesystem read-only
EXT4-fs error (device sda8) in ext4_reserve_inode_write: Journal has aborted
EXT4-fs error (device sda8) in ext4_reserve_inode_write: Journal has aborted
EXT4-fs error (device sda8) in ext4_reserve_inode_write: Journal has aborted
EXT4-fs error (device sda8) in ext4_reserve_inode_write: Journal has aborted
看来确实是文件系统出了问题,根源还是磁盘损坏导致的IO错误。
这种错误还是比较让人无奈的,只能稍后尝试更换硬盘或者切换到别的环境了,不过所幸的是问题发生在备库。
通过这个案例可以看出,对于dg中的警告信息也不要掉以轻心,很可能一个不经意的ora错误其实已经在警示重大的问题,如果及时关注,就为我们保证数据的安全提供了最快的补救措施。

时间: 2024-08-01 00:51:18

一个dg警告发现的硬件问题的相关文章

java程序-写一个Java程序检测电脑硬件信息,风扇转速等等

问题描述 写一个Java程序检测电脑硬件信息,风扇转速等等 写一个Java程序检测电脑硬件信息,风扇转速等等,跪求写一个Java程序检测电脑硬件信息,风扇转速等等,要求代码清晰,谢谢 解决方案 > **_是的_ 很有道理** 解决方案二: 其实虚拟机加载的时候硬件信息已经加载到内存中了,具体获取办法,调用内置类库里面的类即可,至于调用哪个,请自己查 解决方案三: 参考这里http://blog.sina.cn/dpool/blog/s/blog_4cef5c7b0100wyrd.html

2010年写的一个小工具发现原来只需一行命令即可!

 2010年写的一个小工具发现原来只需一行命令即可! 时间过得很快,转眼间2016年下半年了, 2010年写过一个小工具:http://blog.csdn.net/yangzhenping/article/details/5333184 ping一个网段的cmd程序  http://download.csdn.net/source/2084490 今天发现只要在cmd命令行工具中输入: FOR /L %i IN (1,1,254) DO ping -n 1 192.168.1.%i 即可.

ASP.NET的一个bug的发现和解决

asp.net|解决 gridview中的按钮类型用如果用image,触发rowcommand事件时会被执行两次,据说只出现在IE6,IE5.firefox等没有问题,我的IE7也存在同样问题,似乎和IIS版本也有关系,期待微软的补丁.   今天下午一遇到一个问题,gridview 的rowcommand事件会被执行两次,postback也会执行两次,最初还怀疑是调试器的问题,经过察看日志,确定真的被执行了两次.   代码检查了n遍,逐句排除,仍没有找到问题,已经开始怀疑是鼠标了,抓包发现确实是

一个BUG的发现、定位和解决

前言 在iOS 11发布之后,出现了一系列适配相关的问题,UIScrollView在pagingEnabled=YES时滑动手势不灵敏,UITableView的滑动删除功能变动,UIImagePickerViewController的取消按钮点击区域变小等,本文介绍其中一个UIAlertView问题,分享其发现.定位和解决. 正文 1.问题产生 问题的最初,是iOS 11正式版发布后不久,测试的同学提了一个iOS 11相关的BUG,表现是:在直播间内发送聊天信息,如果被禁言,会弹出"被禁言&qu

Flash中一个很难发现的快捷键Alt+Shift

其实这个快捷件很早就在别处看到,但是一下子忘了在哪了-_-当时觉得不咋实用,今天才发现确实经典! 在Flash IDE中时间轴面板的空白处,按住alt+shift后再双击之 就可以变成如下的结构 好处呢,就是可以避免在调整时间轴面板大小的时候误托拽辅助线.所以用这样的一种结构会减少工作失误,相信这种失误很多朋友都遇到过.

vxworks-同一个镜像下载到同一个硬件上,执行我结果不同是怎么会事啊

问题描述 同一个镜像下载到同一个硬件上,执行我结果不同是怎么会事啊 我用同一个vxworks镜像下载到同一个硬件上,一次能进去系统,一次不能,这是怎么回事啊,有没有大哥知道啊 解决方案 有可能是文件传输过程中文件受损,也有可能是传输到硬件上的时候被防毒软件损坏

U盘插入电脑时提示“发现新硬件”的修改

  修改C:WINDOWSsystem32下面的newdev.dll文件. 下载DLL文件修改工具EXESCOPE,最好下汉化版,看的懂.下载地址:百度搜索EXESCOPE 安装或者直接运行,打开newdev.dll,点击资源>字符串(或字串表,看怎么汉化的而定),找到133项2123子项的内容和133项(或135项)2121子项的内容修改即可.(以上具体项和子项记不清,大体上就这几个,自己找找,反正是修改汉字就对了) 友情提示:修改前备份一份newdev.dll.以防出现问题后好恢复.修改时先

按了删除键后怎么先弹出一个框框警告要不要删除?

问题描述 请问怎么在这段程序里面加入点击删除键后,弹出确认删除对话框??的程序,谢谢.privatevoidDataShow_DeleteCommand(objectsource,System.Web.UI.WebControls.DataGridCommandEventArgse){stringstrSql="deletefromtbl_WorkOrdrwhereID="+e.Item.Cells[0].Text+"";ExecuteSql(strSql);} 解

意外发现了winform的一个控件个数的极限

问题描述 很久没来CSDN了,今天跟大家分享一个我的发现,调试这个的时间用了很久,希望大家在遇到类似问题时,不要走弯路.如下图,我用反射在一个窗体上根据从数据库里取来的数据创建自定义控件,当完成1169个之后创建第1170个,而且每次都是在1170时,会报错,如下图.有时则直接说发生了一个异常,根本没把这个错误报出来.大概是微软觉得你肯定不会在同一个窗体上创建1000多个控件吧.....托管(v4.0.30319)):已加载"C:WindowsMicrosoft.NetassemblyGAC_M