你踩过dataguard的哪些坑?

话题

Topic

dataguard有什么缺点?话题发起人@Liangmao认为,dataguard的图形界面让人真不敢用,感觉很没底,而且命令行对于一般的操作人员要求太高。那么大家又是怎么看的呢?(本期话题贡献人:@Liangmao)

 
 

众说纷纭  
 

香草拿铁:物理DG不能单建索引,也不能跨平台。

 



 

FZJ111:我遇到了几个问题:1、standby的arch文件系统快到99%,不足以放下一个归档文件,依旧会产生不完整的归档文件,这个时候mrp就挂了。11203 psu5 rac的dg standby。

 

2、检查效验数据文件居然会失败,我还以为是坏块,dbv数据文件没问题。【parknkjun@江政恒:这个情况我也遇到过,重启就可以了。】

 

3、磁盘被lock了,dg居然报坏块。存储驱动异常导致磁盘lock很正常,dg却报坏。无非就是磁盘无法写和读,mrp挂了,报坏块,dbv数据文件正常。【djs数据库:我把DG库的db_block_checking设置为FULL了,主库也设置db_block_checking设置为FULL了。遇到归档日志有问题,MRP就会挂起。我这里遇到几次主库是RAC,DG库有坏块,必须全恢复情况(是底层光纤链路问题导致),但是同样环境,同样链路问题,单机的DG库没有坏块。】

 

4、备库有个数据文件比源库小,然后mrp挂了,报错有坏块,当时我们用dbv去检查,发现数据文件都有问题,检查归档无问题,从主库cp那个数据文件恢复启动mrp就好了,这个问题应该是数据文件头坏了。

 

5、曾经有个问题叫“磁盘io抖动”。san-lan-vios- lpar,复杂的存储架构,没折的sa,emc还是hds的,存储换块盘,哥都要紧张。我们10 rac是hacmp的,存储一搞,或者vios一搞,几十套rac趴店。还有网络交换机断几分钟,100余套rac要挂。我还测出11 g rac的磁盘心跳和网络心跳分别出现问题的场景。rac三个心跳参数(mc、dto、reboottime,10g rac和11g rac这三个值的关系)到底怎么整,我问过很多acs的人,他们让我看mos的那个文章。我测试过10,11g rac,貌似mos不完全对。我测过11g rac,网络心跳比磁盘心跳时间短,10g rac则相反。我可是断过集群网卡和磁盘,有一段时间就是研究rac的心跳的具体时间和危害。我对reboottime的意义不明白,可能就是说故障导致心态丢失到一定时间就会出现重启,io隔离。

 



 

天道酬勤:我遇到了一个问题:adg有时延迟达到十几分钟,但奇怪的是standby负载并不高,而且无规律地偶发。primary端设置的参数直接指定sercive和db_unique-name,有standby 10gfi1e,主库是rac备库当机,软件版本11.2.0.4。我现在装了osw,下次再发生我准备开sr。【djs数据库:ADG上RECOVER STANDBY DATABSE可以开并行,我用过PARALLEL 32。远距离ADG,还要采用网络加速,否则日志传输就慢。我们这里跨1000公里的远程DG效果还可以。】

 



 

小马:failover后不能回切。

 



 

周卫丰:不能跨版本,不能逻辑同步,有限支持跨平台。【杨建荣_北京:不能跨版本是数据库版本,子版本可以兼容,跨平台是操作系统平台,但操作系统版本可以兼容,是这个意思吧?】版本有vesion release psu bundle ml intermediate,最多支持到psu级别,而且不推荐。

 



 

韩璐:搭配只读应用有限制。我们这里的只读报表应用也是要记录用户登入、登出时间,及菜单操作轨迹的。dg纯只读无法实现,so这种需求我们就用gg了。【周卫丰:12c可以在备库建临时表及序列,辅助报表分析。】这个还真不了解。不过这样的话,需要修改应用程序代码。我们的只读应用不用对应用代码做任何修改,只需在数据库中删掉一些菜单配置项即可使用,然后修改应用用户的权限为只读权限。

 



 

杨建荣_北京:说缺点必然和版本也有关系,我说个前段时间碰到的一个bug,害我一宿没睡好。

 

在10.2.0.4前,主库如果有drop datafile的操作,备库的mrp起不来了, ORA-00600: internal error code, arguments: [3689], [21], [], [], [], [], [], []

Errors with log /U01/app/oracle/flash_recovery_area/STEST4/archivelog/2015_09_11/o1_mf_1_7414_bz598mqc_.arc

MRP0: Background Media Recovery terminated with error 600

文档上Bug 5623467 - Corrupt redo from ALTER TABLESPACE DROP DATAFILE (文档 ID 5623467.8)

 

10g的备库不是active的,每次有大查询都得开到read only,查完之后再应用日志,有一次开发忘了还是dba忘了,备库一直read only,RFS接收归档但没apply,dgmgrl查看都正常,结果时间太长,接收的归档也给删了。估计adg也是促使dg大量使用的一个动力,原来客户那边用的是bcv,存储快照复制弄的备库。

 



 

小白:adg有个缺点,日志断了就坏了,如果能在线增量,从主库同步就好了,不走日志,直接增量数据。

 



 

周亮:主机平台要求大小字节相同,偶见bug带来的性能问题,偶见主备切换带来的生产库损坏,偶见logic corruption 带来的备库损坏,偶见日志断档问题需人为修复,极端环境下DG不适用(主备网络环境差,备存储IO能力不足,生产库归档量巨大)。

 



 

公先生:以后数据库干脆像iPhone一样,oem里就一个home钮,管启动和关闭。

 



 

Javid:缺点是不是国产解决方案,缺少社会主义元素。

 



 

鸣 谢

在“DBA+社群”热议话题讨论活动中,得到了以下联合发起人以及群友们的积极参与和支持。在此,小编整理成文,并附上所有发表观点的人员头像汇总图,特此鸣谢!

  
 

本文来自合作伙伴"DBAplus",原文发布时间:2015-10-10

时间: 2024-09-10 09:20:39

你踩过dataguard的哪些坑?的相关文章

中小企业Docker实战:那些年我们踩过的五个坑

云栖TechDay活动第十八期中,来自南京路特软件有限公司的CTO戚俊带来了题为<中小企业如何巧用容器技术>的分享,主要分享了路特软件公司使用阿里云容器服务和Docker中遇到的问题,以及获得的经验教训,从业务的角度着重讲解了容器技术对生产过程及总体生产力带来的影响,对中小企业有着极大的借鉴意义. 幻灯下载地址:https://yq.aliyun.com/attachment/download/?filename=57b4e3fec55729378d21fe76850682e4.pdf 以下为

DBA菜鸟的进化简史:不忘初心,记工作中踩过的三个坑

我是一名大四的DBA实习生.   前几天时候,公司里带我做业务的导师让我到其他部门给一位开发人员解决一个DB问题,当时我是既激动又紧张,到了开发同学那,发现是一个存储过程执行有问题:   看到这个报错信息我第一个反应就是,原来是个很简单的问题,接着我人也就放松下来了,毕竟第一次让我去给别人解决问题,我要是连问题都看不懂,那可就丢人丢大了. 然后我便开始着手解决.表空间不足嘛,不外乎两个原因:要么没有开自动扩展:要么是开了自动扩展,数据文件到了最大的上限.   OK,自动扩展是开着的,那么只能是数

&quot;双11&quot;网购五大真实诈骗“坑”,求不要踩进去

今天,编辑正在列今年的"双11"购物清单时(老板,是午休时间写的,不要扣工资),360互联网安全中心的朋友发来微信:"听说你这次又想剁手了,需要我告诉你5个可能踩到的网络诈骗坑吗?""你发誓不是在给我安利你家?""不是!拍着胸脯保证!天地良心!" 作为一个资深购物节剁手党,编辑看过了这五个案例后,决定吃了这把"安利".另外,听说这些案例是由 公安部门与360互联网安全中心联合发起成立的猎网平台搜集,这是国内

运维专家:我在大数据项目中踩过的那些坑

一.主要讨论人员 提问:陈超,七牛云技术总监 回答:朱冠胤,百度资深大数据专家,连续两次百度最高奖得主. 二.引言 "坐而论道"是一个轮流问答的玩法.本文是大数据主题周中,几位国内一线专家激情问答的一部分内容.期间,各位群友也积极参与. 三.问题集锦 1.MongoDB在百度的使用场景及规模? 2.假设现在让你完全主导一个类似Hadoop的项目,你会选择哪种语言? 3.分享你在百度各种大数据项目中踩过的坑? 4.你所在团队在自研和使用开源方案的主要考虑因素? 5.新一代分布式数据库(N

对已存在的表进行分区时遇到的坑

在网上能够找到很多关于表分区的资料,可是大部分都是在介绍如何给一个新表创建表分区,而对已存在的表如何做分区的文章相对比较少,因此一些坑没有被"挖掘"出来或者"曝光率"比较低. 笔者最近遇到了一个这样的案例,刚好踩到了两个坑,现分享给大家. 对已存在的表进行分区最常见的方法就是重建聚集索引或者创建聚集索引(如果表上没有).因为聚集索引的页级就是实际数据,而重建或者创建聚集索引时会重新组织页,所以如果在重建或者创建索引时指定分区架构,那么该表上所有的数据就会按照分区架构

Jetson tx2刷机过程中的坑

暑假各种事忙得差不多后,终于有时间拿出早就申请到的tx2,开始刷机教程,这两天几乎踩边了所有的坑. 第一个坑,虚拟机 一般在安装VMware虚拟机时,建议的安装空间20GB,但是我从英伟达官网上下载下来的Jetpack3.1的刷机程序只有30MB,但下载完所有组件后会发现,文件夹内文件的大小变成了43.3G,所以建议分配给虚拟机超出50GB: 第二个坑,虚拟机的网络 在等待下来大半天下载完所有的组件后按照网上的教程进行将tx2和电脑连在同一个路由器上后,将tx2的micusb口通过安卓线和电脑相

使用开源项目的正确姿势,都是血和泪的总结!

软件开发领域有一个流行的原则:DRY,Don't repeat yourself,我们翻译过来更形象通俗:不要重复造轮子.开源项目主要目的是共享,其实就是为了让大家不要重复造轮子,尤其是在互联网这样一个快速发展的领域,速度就是生命,引入开源项目,可以节省大量的人力和时间,大大加快业务的发展速度,何乐而不为呢?   然而现实往往没有那么美好,开源项目虽然节省了大量的人力和时间,但带来的问题也不少,相信绝大部分同学都踩过开源软件的坑,小的影响可能是宕机半小时,大的问题可能是丢失几十万数据,甚至灾难性

三年0故障总结,提升代码质量的秘诀

该文章来自于阿里巴巴技术协会(ATA)精选文章. 个人经历 对我代码质量影响最大的是在一家外资企业,在这家公司我觉得有以下几个方面做的很不错. 团队编码风格统一 统一到什么程度? 不看代码作者,你很难区分代码是谁写的(在目前公司一些团队也能达到这个标准). 个人观点: 这样做有什么好处?团队中每个人阅读代码都很容易,减少很多沟通,维护成本( 代码阅读的次数远远大于变更的次数),并且心情非常愉悦.有人肯定觉得愉悦有点夸张,举个栗子: 有一些代码,如果不是由于与工作内容有关联,你是否有种这辈子都不情

阿里搜索业务容器化中的一些经验和思考

概要 参加了上一次CNUTCON 大会,有来自coreos的李响,分享了很多关于etcd的事情,以及关于k8s包括自己和coreos公司的一些观点:还有来自mesos的tim chen, 他分享了很多mesos的思路以及一些接入容器过程中踩过的一些坑:swarm kit的负责人陈东洛也分享了swarm的思路,这方面由于刚出来没多久以及分享的同学也只有他,所以东西并不多:总的来说,感触很深. 关于容器和编排,想到开源和创业 从会议分享者来看.相比去年,容器技术有了更大的发展:docker很热,每一