12月份,上地机房进行电源割接,不少光线交换机重启,业务系统、数据库主机也进行了重启,但是由于设备重启顺序不同导致一内容拨测系统数据库出现了异常。
出问题的数据库所在主机是IBM的AIX 6100,数据库版本是11.2.0.4,采用的是HA双机软件管理的热备双机,数据库安排的有exp定时计划任务。
出现的问题是:数据库exp定时备份计划任务出现告警,
处理过程:
使用ps -ef|grep exp发现后台有3个exp相关的.sh备份进程挂起;
查看备份目录发现有3天前的备份文件和备份日志,但是备份文件是4096字节,而备份日志是0字节;
首先杀死3个相关的exp备份进程,删除失败的备份日志和备份文件,重新发起exp备份,发现备份卡在登录sqlplus 2个小时候自动断开,而备份文件还是4096字节,备份日志是0字节;
从服务器端登录sqlplus,select username from dba_users;能查询到数据库相关用户,select file_name,tablespace_name from dba_data_files;却一直卡主没有输出结果;
退出sqlplus切换到root用户lsvg能输出相关vg信息,lsvg -p rootvg显示rootvg相关的2个pv卷信息,但是lsvg -p vg_oravg却是卡主没有输出;
经AIX主机工程师查看并与系统管理员沟通判断是电源切割引起光交链路发生改变,而AIX主机不识别链路导致的;
尝试使用root 通过smit hacmp将服务切换到备机解决链路不识别问题,发现HA切换失败;
接下来重启HA相关的2个主机,重启完成后lsvg -p vg_oravg有正常输出,登录数据库查询数据文件正常,重新发起exp备份4分钟完成;
到此故障解决。
IBM HA双机光交链路问题导致的oracle数据库exp备份问题
时间: 2025-01-28 06:23:39
IBM HA双机光交链路问题导致的oracle数据库exp备份问题的相关文章
HP-EVA4400故障导致的oracle数据库丢失的恢复过程
一.故障描述 整个EVA存储结构是由一台EVA4400控制器,三台EVA4400扩展柜和28块FC 300G硬盘构成的.由于两块磁盘掉线导致存储某些LUN不可用,某些LUN丢失.由于EVA4400是因为某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后北亚工程师先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道.磁盘坏道检测日志如下: 图一: 二.备份数据 考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以防万一操作不
rose ha 维护技术-安装了ROSE HA双机热备的服务器,重装系统,需要怎么重新配置
问题描述 安装了ROSE HA双机热备的服务器,重装系统,需要怎么重新配置 公司有两台服务器做了双机热备的,但是其中一台后备机器阵列卡坏了,换了阵列卡,现在需要重新安装操作系统和rose ha,需要怎样去配置这个ROSE,求教程,谢谢... 解决方案 看你是什么阵列,raid 1 raid5之类的才可以恢复,raid 0就不可以.开机进入阵列的bios(不是系统的bios)设置,里面有重构raid的.
Iptables实现HA双机进出口ip一致性,保证验证一致性!
Iptables实现HA双机进出口ip都为浮动ip,更保证了收发信验证的一致性! 这个项目是前一阵子,帮老师配置双机的时候遇到的,跟大家分享下,好久没有进入自己的博客了哈~不过倒是经常关注咱们的chinaunix,希望这个网站越来越强大! 客户环境: PS: 老师那边给的俩个真实ip(网络通信的ip),都配置在eth0上,而这俩个ip实际都没有对外开放的,原先主机使用的是浮动ip.这样就就带来了后续的问题: 第一,修改浮动ip和真实ip兑换之后,重启肯定是无法远程了,只能qq远程,不过我都配置好
学一点 mysql 双机异地热备份----快速理解mysql主从,主主备份原理及实践
原文 学一点 mysql 双机异地热备份----快速理解mysql主从,主主备份原理及实践 感谢大家在上一篇 学一点Git--20分钟git快速上手 里的踊跃发言.这里再次分享干货, 简单介绍mysql双机,多机异地热备简单原理实战. 双机热备的概念简单说一下,就是要保持两个数据库的状态自动同步.对任何一个数据库的操作都自动应用到另外一个数据库,始终保持两个数据库数据一 致. 这样做的好处多. 1. 可以做灾备,其中一个坏了可以切换到另一个. 2. 可以做负载均衡,可以将请求分摊到其中任何一台上
SQLServer 2005 数据库定阅复制实现双机热备(主要是sharepoint 内容数据库)
原文:SQLServer 2005 数据库定阅复制实现双机热备(主要是sharepoint 内容数据库) 场景 公司最近的sharepoint的数据库服务器老是出问题,并且在一旦出现问题,就导致无法正常工作.最主要的是我们要加班还原以前的数据库,这是最头疼的.于是在网上查找资料,实现主备机的同步,对于sharepoint而言我们只需做到sharepoint的内容数据库同步即可.这种技术有个专业名词叫做双机热备. 双机热备原理 双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可
程序中system()执行 exp 备份返回13,操作系统返回0,导致备份失败
问题描述 程序中system()执行 exp 备份返回13,操作系统返回0,导致备份失败 5C 程序是在linux下执行的exp命令 备份oracle. 查了下, system("xx.sh")返回值, 高八位是子进程执行命令行后退出值,第八位是命令执行过程中接收到的信号值. 根据日志返回结果来看, 返回值=13, 高八位肯定是0,低八位是13,对应的是SIGPIPE信号. 命令行的内容检查过,手动执行备份可以成功. 请问各位,程序执行exp备份过程中,为什么会一直收到这个信号?还是我
中断ORACLE数据库关闭进程导致错误案例
昨晚下班的时候,我准备关闭本机的虚拟机上的ORACLE数据库后准备下班,但 是由于我SecureCRT开了多个窗口,结果一不小心,疏忽之下在一个生产服务器上执行了shutdown immediate命令,大概过了6到7秒,发现该命令还没有响应,我才发现我这个命令执行错了服务器.一惊之下,想都没有想直接CTRL+C想中断这个 操作. 如下所示: SQL> shutdown immeidate; SP2-0717: illegal SHUTDOWN option SQL> shutdown imm
【数据蒋堂】第14期:计算封闭性导致臃肿的数据库
许多大型用户的数据库(仓库)在运行多年之后,都会积累出很多的数据表,严重者数以万计.这些数据表年代久远,有些已经忘记建设原因,甚至可能已不再有用,但因为很难确认而不敢删除.这给运维工作带来巨大的负担.伴随着这些表还有大量的存储过程仍在不断地向这些表更新数据,占用大量计算资源,经常要迫使数据库扩容. 这些表是真地业务需要吗需要吗?业务会复杂到需要成千上万的表才能描述吗? 有过开发经验的人都知道这不大可能,几百个表就能描述相当复杂的业务了.这些众多的表绝大多数都是所谓的中间表,并不是用来存储基础数据
Oracle 数据库针对表主键列并发导致行级锁简单演示_oracle
本文内容 •软件环境 •简单演示 Oracle 数据库并发导致行级锁 本文简单演示针对表主键并发导致的行级锁.并发是两个以上的用户对同样的数据进行修改(包括插入.删除和修改).锁的产生是因为并发.没有并发,就没有锁.并发的产生是因为系统需要,系统需要是因为用户需要. 软件环境 -------------------------------------------------------------------------------- •Windows 2003 Server •Oracle 1