【力荐】Exadata火线救援:10TB级数据修复经典案例详解!

凌晨1点半,朦胧中电话铃狂响,某Exadata严重故障…….

跟Salesforce巧合的是,大家都是运行在Exadata上,不幸的是Salesforce丢失了4个小时数据(后续没看到新闻稿,是否又追回了部分)业务停顿,那我今天遇到的要麻烦更多。

近期Exadata故障比较多,比较重要的是硬件生命周期所致,X2从2010年9月开始发布上线,到现在已经将近6年,就算传统“高端”小型机也到该下线的时候了。提醒使用Exadata的朋友们做好备份,否则,你可能也要经历一场难忘的救援经历。

问题发生得很不可思议,又很理所当然,细节就不说了。总之比较糟糕:存放数据文件的diskgroup不能加载(mount),celldisk状态是unknown,部分asm disk的header是invalid的,就连它自动备份的块也是invalid的,有磁盘物理损坏,物理损坏的磁盘没有的mirror也失效了。接近10TB的数据,想想也头疼吧。

再说具体数据抢救工作之前,还是提醒下使用ASM/Exadata的朋友们,至少搭建个Data Guard吧,刚好建荣也做了这方面的分享,赶紧去读读。

鉴于问题非常棘手,综合各方信息,我们做了如下的方案:

   

  1. 将数据库文件抽取出来
  2. 尝试open
  3. 如失败再DUL

  

要将数据库文件(控制文件、数据文件、日志文件)从没有加载的磁盘组中抽取出来,需要借助于AMDU。

AMDU: ORACLE针对ASM开发的源数据转储工具,其全称为ASM Metadata Dump Utility
抽取的具体步骤:

  • 从alert日志中找到启动参数(包括控制文件),编辑成新的参数文件/tmp/pfile
  • 从pfile中找到控制文件的位置,并用amdu抽取
  • 用抽取出来的控制文件,将数据库mount起来
  • 从mount库把所有数据文件找出来,可能有2种格式
  • OMF格式(数据文件带Oracle自动生成的数字)
  • 自定义格式(手贱的),处理起来麻烦一些
  • 日志文件同上处理

  抽取数据文件
第一步:抽控制文件

先从alert日志找到控制文件位置:

control_files string +DATA/exdb/controlfile/curren t.266.278946847955,
11g开始amdu不需要编译可以直接使用。到/data文件系统,开始操作

amdu -diskstring '/o/*/ *' -extract data.266
在当前目录下会生成一个DATA_266.f的文件和一个report.txt文件,DATA_266.f就是控制文件了。

第二步:找数据文件和日志文件

如果你有备份的pfile最好,如果没有,就从alert日志里去找启动的时候的初始化参数,实在没有,手工编辑一个也行,包含sga_max_size,db_name,control_file这几个参数。

然后把数据库启动到mount状态,查找数据文件和日志文件:

select name from v$datafile;select member from v$logfile;
运气好,都是这样的(OMF格式):

+DATA/exdb/datafile/system.256.278946847955 +DATA/exdb/datafile/sysaux.257.278946847955 +DATA/exdb/datafile/undotbs1.258.39804295139 +DATA/exdb/datafile/users.259.48049295141
运气不好,可能是有这样的(自定义格式):

+DATA/exdb/datafile/users_2013084.dbf +DATA/exdb/datafile/tbs_jifen_cx_0123.dbf
对于OMF格式的,仿照抽取控制文件,一个个抽:

amdu -diskstring '/o/*/ *' -extract data.256
对于自定义格式的,要从.6去抽取元数据,然后找到其对应的number

  1. amdu -extract DATA.6 -diskstring 'o/*/DATA' ,生成DATA_6.f 文件
  2.  

for (( i=1; i<15; i++ ))
do
kfed read DATA_6.f blknum=$i |egrep 'name|fnum'>>aa.out
done

再依照OMF格式抽取方式抽取出所有数据文件。

值得一说的是,我们遭遇了一个3T的bigfile,extract消耗了将近24小时= =。--NFS挂过去的文件系统速度特别慢= =

最后对所有的文件用dbv做一次校验,有没有物理坏块。

  尝试Open数据库

当到了这一步的时候,其实就跟寻常的数据库恢复类似了。 我们同样在open的时候遇到了ORA-1555、ORA-704错误。

记录下我们用到的参数和事件。

event:

隐含参数:

这里比较讨厌的是rollback segments不容易确定,因为你是mounted状态的数据库,连v$rollname都查询不了。

有两个办法来解决:

办法一,用strings去system文件里抓。

办法二,用DUL/AUL/ODU/GDUL等类似工具。相对来说这种方法得到的准确一些

 

把得出的SYS_UNDO.dmp导入普通用户,去除status为1和2的回滚段(还原段)后放入到上述空着的2个参数。

open的时候可能还会报ORA-1555,需要推进SCN,以upgrade模式open。

推进SCN的方法很多网友也有分享过,度娘或者谷哥都可以。这里需要重点提示后续有需要的小伙伴的是,搞了两下没起来也别灰心。

这次单就推进SCN这块,我们也折腾了好长时间,甚至一度两度打算放弃准备DUL了。

先看看oradebug poke的描述:

 

那首先是找到SCN的内存地址:

 

等号后面的值,就是当前显示的SCN了,不过,由于是mount状态,所以显示为0. 将当前的SCN(从v$datafile_header#查)随手加上100万,转为十六进制,推一把看看:

再次查看就能看到SCN的值了:

然后“alter database open uprade", 不断重复尝试.......

此外还用了bbed修改块,还去删除数据字典记录.......

终于,数据库总算open了,数据回来了。

  DUL和AMDU

万幸的是,没有走到最后一步,没有用DUL来抽数据,不然,以这龟速,少说也是一个星期的事情。

DUL和AMDU都是救命的稻草,我们有能力使用,不代表我们一定要去用。而且我们从不在这个时候跟客户谈收费,作为服务商我们坚持救急如救火!而这些救命工具就如同山洞里的核武器,我们希望每个客户都能做好前期规划、维护、备份和容灾,让它们静静地躺着,作为一种威慑手段就好了。

  关于exadata的维护
再好的东西,你不关心它,总会出问题的,Exadata也不例外。

摘抄《Exadata专家工具箱》里的几个工具,仅供参考:

sundiag

ExaWatcher

  • Diskinfo
  • IBCardino
  • Iostat
  • Netstat
  • Ps
  • Top
  • Vmstat

Exachk

CheckHWnFWProfile

这些命令两周做一次检查还是必要的。

  关于数据库运维管理工具

问题发生在别人身上的时候,我们听起来不可思议,觉得别人是不是傻啊,还是懒啊,其实不是,有的时候真是太忙太忙,忙不过来,这时候需要一套工具来帮助大家。

是的,说的就是你。还记得我们昨天的聊天么,你说,他们是不是傻啊,不做监控么,平时不去看么?我说,你要是管理几千个数据库,而你又没有合适的管理工具,一个边缘系统发生这种情况,是在所难免的。

那么什么样的数据库运维管理工具是合适的呢?

  • 数据库多维度监控
  • 日常运维场景化
  • 数据库实时性能分析
  • 应用性能追溯

这几个方面互为补充,逐渐让运维变得信手拈来。

1、数据库是一个非常专业的细分领域,传统的ITOM工具集成的监控功能往往太粗放,所以需要专业的数据库多维度监控,各项监控指标数据需要实时采集并存放,根据趋势进行告警。

就拿本案例来说,如果有对Exadata服务存活的监控,问题至少在故障发生前一星期就能得到预警,并及时处理。

2、日常运维场景化

太多的数据库意味着任何一个点的维护,都需要大量的时间消耗,因此需要集成、封装一些运维场景。比如:

  • 自动化日常数据库的巡检
  • 告警日志、跟踪日志的压缩和归档
  • 比如定时作业的维护
  • 容量趋势提醒及半自动扩容
  • 以及一些自定义的场景(一些客户几百套Data Guard的日志修复)
  • 历史数据自动归档
  • .......

有了这些功能,你是不是可以省下好多时间钻研新技术,为企业核心技能的更新换代贡献自己的能量,而不需要整天想着逃离苦海了呢。

3、数据库实时性能分析

此功能意义很大,看下面两个场景:

  • 比如一个电话打过来,小张,刚才小王说昨天下午2点22到2点30期间数据库很慢,他们自己重启了机器解决了,你分析下原因。这个时候你通常只能寄希望于dba_hist_sqlstat,但这个粒度太粗,结果就是往往没有结果;
  • 时间不要离这么久,数据库发生大量TX锁资源了,帮忙查看下源头是谁。你一去看源头进程是3456,不过人家是idle进程,是一条select语句,显然不是它锁的。

如果有一个工具,能帮你实时记录数据库的这些信息,而且不用查询数据库,而是直接读取SGA,那这一些问题都能够分分钟解决,是不是很爽?

4、应用性能追溯

有些问题,明显是应用的问题,可是如果你不明确告诉他,是哪个应用模块,哪个用户干的,你几乎就说不清楚是应用的问题。

如果运维管理工具不仅仅能够帮你发现是哪个SQL语句导致,说出program,而且能告诉你是从哪个路径爬过来的,是由哪个jar包发起,那是不是一切就显而易见了呢。让背锅的日子见鬼去吧。

那么,存在这样的数据库运维管理工具么?

答案是yes。

作者介绍  杨志洪

  • 【DBAplus社群】联合发起人,新炬网络首席布道师。Oracle ACE、OCM、《Oracle核心技术》译者。
  • 数据管理专家,拥有十余年电信、银行、保险等大型行业核心系统Oracle数据库运维支持经验,掌握ITIL运维体系,擅长端到端性能优化、复杂问题处理。现主要从事数据架构、高可用及容灾咨询服务。


时间: 2024-10-01 13:31:16

【力荐】Exadata火线救援:10TB级数据修复经典案例详解!的相关文章

Android热修复技术原理详解与升级探索

在2017云栖大会-上海峰会上手机淘宝资深无线开发工程师甘晓霖(万壑)作了题为<Android热修复技术原理详解与升级探索>的分享,如何实现客户端与开发节奏最快同步,阿里云为此开发了移动热修复框架Sophix.它在代码修复.资源修复.SO库修复中都展示了极高的能力,在于其他竞品的对比中,Sophix展示出来极大的优势,并且非常容易上手.

Linux系统下mysqlcheck修复数据库命令(详解)_Mysql

mysqlcheck客户端工具可以检查和修复MyISAM表,还可以优化和分析表. 实际上,它集成了mysql工具中check.repair.analyze.optimize的功能. 有3种方式来调用mysqlcheck: shell> mysqlcheck[options] db_name [tables] shell> mysqlcheck[options] ---database DB1 [DB2 DB3...] shell> mysqlcheck[options] --all--d

mysql表优化、分析、检查和修复的方法详解_Mysql

本文实例讲述了mysql表优化.分析.检查和修复的方法.分享给大家供大家参考,具体如下: 这里介绍对数据库的管理常规就是进行预防性的维护,以及修复那些出现问题的内容. 进行检查和修复通常具有四个主要的任务: 1. 对表进行优化 2. 对表进行分析(分析并存储MyISAM和BDB表中键的分布) 3. 对表进行检查(检查表的错误,并且为MyISAM更新键的统计内容) 4. 对表进行修复(修复被破坏的MyISAM表) 一.对表进行优化 优化表有很多方式实现: OPTIMIZE TABLE语句.mysq

chkdsk修复磁盘命令详解

一.命令说明 CHKDSK [volume[[path]filename]]] [/F] [/V] [/R] [/X] [/I] [/C] [/L[:size]] volume 指定驱动器(后面跟一个冒号).装入点或卷名 filename 仅用于 FAT/FAT32: 指定要检查是否有碎片的文件 /F 修复磁盘上的错误 /V 对于FAT/FAT32:显示磁盘上每个文件的完整路径和名称              对于NTFS:如果有清除消息,将其显示 /R 查找不正确的扇区并恢复可读信息(隐含 /

oracle Exadata火线救援:10TB级数据恢复—强制拉库篇

这个库的恢复有一些历史故事([力荐]Exadata火线救援:10TB级数据修复经典案例详解!):xx运营商x2的1/4配置的oracle exadata机器,跑了近6年,最近有一个cell节点主机异常,在rebalance过程中,只有两个节点的cell其中一个节点坏了一个硬盘导致.导致asm diskgroup无法正常mount,最后该运营商运维三方通过amdu把该一体机中的数据文件全部抽出来,然后在恢复过程中出现大量错误无法解决,请求我们支持 数据库open过程报ORA-01555错误 Thu

安信证券王铁铭被称高PE黑手曾力荐华锐风电

记者 高丽霞 李茵琳 在安信证券的大力包装下,"史上最贵"的沪市主板个股华锐风电(72.40,0.05,0.07%)(601558)1月13日盛装出炉.然而上市首日该股便破发,跌幅高达9.59%.在接下来的两个交易日,华锐风电连续下跌,上市前三日,该股累计下跌18.35%. 把一个面临竞争加剧,毛利下滑的公司推向投资者,却又给投资者描绘出一幅美妙的蓝图,然后在定价上极尽取巧之能事,华锐风电的保荐人王铁铭则是难咎其责.实际上,安信证券就是一个"炮制"高价股.高市盈率个

斯诺登力荐,号称史上最安全的即时通信应用Signal

为什么Signal会被认为是最安全的即时消息应用?这是由于它只会储存很少量的关于用户和事件的信息. 斯诺登力荐的Signal 尽管现在很多热门应用都实现了端到端加密,但这也不一定能保证安全.安全专家们之所以强烈推荐Signal来作为安全通信的工具,是因为在DNC(美国民主党全国委员会)黑客事件后,这款号称"斯诺登核准"的应用,也成为相关职员的指定即时通信应用. 如果在网上搜索Signal,大家可以看到斯诺登极力推荐过这款应用.斯诺登曾表示,使用OpenWhisper Systems的任

《天生我才》央一今开播杨澜力荐五岁小歌手

杨澜力荐小歌手 五岁小歌手阿迪 新浪娱乐讯 央视一套重磅推出的节目<天生我才>今日(2月10日)开播.<天生我才>是一档以青少年技能.创意为素材,强调全球化视野,彰显主流价值观传播和娱乐参与性的大型演播室综艺节目,每期邀请天才儿童上台秀出"超人技能".该栏目旨在通过全球青少年互动参与.天才技能展示.纯真气质塑造.以及对艺术效果的完美追求,展示天才创意的震撼和魅力,激发青少年的创造力. 杨澜力荐五岁小歌手阿迪 5岁的傈僳族小歌手阿迪和爸爸随口对唱了一首当地民歌&l

1月网友力荐:全球十大最佳虚拟主机提供商

中介交易 SEO诊断 淘宝客 云主机 技术大厅 虚拟主机托管,是近几年发展速度非常快的一种互联网模式,据资料显示,全球有80%的企业网站在使用虚拟主机.而依据HostingTop发布的1月最佳虚拟主机数据显示,业界知名IDC服务提供商BlueHost.HostMonster.JustHost等被业界媒体及网友力荐为虚拟主机最佳经销商.下面,IDC评述网与大家一起关注2011年1月备受网友好评的十大最佳主机服务提供商. 1 BlueHost BlueHost是一家美国的虚拟主机提供商,成立于199