oracle备份恢复参考日志——实例恢复

http://blog.csdn.net/robinson_0612/article/details/5768233

一、Oracle实例失败

    Oracle实例失败多为实例非一致性关闭所致,通常称为崩溃(crash)。实例失败的结果等同于shutdown abort。

    实例失败的原因

        电源负载故障

        硬件故障

        后台进程失败

        异常关闭数据库

    实例失败后的状况

        数据库可能丢失已提交的事务以及存储了未提交的事务,导致数据库出现不一致的情况

    解决方案

        使用startup 重新启动实例。实例实现自动恢复,根据联机日志文件前滚提交的事务,回滚未提交的事务

        查看告警日志、跟踪日志等找出出现故障的原因

       

    更多常见的故障请参考:Oracle 常见故障及日常规划

   

二、检查点

    检查点在体系结构中已经讨论,实例的恢复与检查点息息相关,因此再次讨论检查点进程

   

    1.什么是检查点

        是一个数据库事件,用于减少崩溃恢复时间,检查点位置决定了实例恢复的起始位置

        由后台进程触发,触发时ckpt进程通知dbwn进程将数据缓冲区的脏数据写入到数据文件

        ckpt进程同时负责更新数据文件的头部信息及控制文件上的检查点信息

       

    2.检查点的触发条件

            在日志切换的时候(自动切换或手动切换)

            数据库用immediate ,transaction ,normal选项shutdown数据库的时候

            用户手动触发(alter system checkpoint)

            alter tablespace tablespace_name begin | end bakcup

            alter tablespace tablespace_name offline

            alter database datafile '<dir>' offline

            alter tablespace | datafile read only

           

    3.检测点队列

        是一个脏数据库链表

        检查点队列中的每一条修改过的记录包一个唯一的数据块标识符(日志文件号,块编号,偏移量)

        最早队列将被优先写入到数据文件(而不论期间是否被多次修改)

        最早队列被写入完成后将从队列中清除

       

    4.检查点的分类

        完全检查点

            在Oracle 8i 以前,当检查点发生时,Oracle将脏缓冲列表上的数据全部写入到数据文件,称为完全检查点,又称常规检查点

            特定的触发条件

                alter system switch logfile

                shutdown normal,immediate,transactional

                alter system checkpoint

        增量检查点(fast-start checkpoint)

            主要是引入了检查点队列机制,每s,ckpt将检查点队列中最老的RBA更新到控制文件,RBA(重做日志块地址)同时将作为实例恢复的起点

            增量检查点则细分了完全检查点,使得数据可以周期性按最老的数据块写入到数据文件

            每一个脏块会被移到检查点队列里面去,按照LRBA(Low RBA第一次对此块修改对应的redo block address)来排列

            最早写入检查点队列数据块的low rba值是最小的,即便该队列中的最小队列被修改多次,但修改后它在检查点队列里的顺序不会改变

            当执行增量检查点时,DBWn从检查点队列按照LRBA的顺序来保证先修改的数据可以按顺序优先被写出来实现检查点的增进

            此时ckpt进程使用轻量级的控制文件更新协议,将当前最低的RBA写入控制文件

            ckpt在进行轻量级更新时,并不会改写控制文件中数据文件的检查点信息及数据文件头信息

            仅仅是记录控制文件检查点SCN并根据增量检查点写出增进RBA信息

            通过将完全检查点转变为增量检查点将大大缩短实例的恢复时间

            注:更新数据文件头部及控制文件滞后于检查点事件的发生

            增量检查点的触发   

                满足初始话文件log_checkpoint_interval、log_checkpoint_timeout、

                              fast_start_io_target、fast_start_mttr_target的设置的值

                最小的日志文件的大小

                Buffer Cacha中脏块的数量

   

        部分检查点

            表空间的脏数据写入到磁盘

            由alter tablespace tablespace_name offline 触发

   

    5.完全检查点与增量检查点的差异

        完全检查点会将检查点的信息同时写入到控制文件及数据文件

        增量检查点则只将RBA写入到控制文件

   

    6.查看检查点的信息,设置LOG_CHECKPOINTS_TO_ALERT参数为true

        ALTER SYSTEM SET LOG_CHECKPOINTS_TO_ALERT = TRUE ;

   

    --查看log_checkpoints_to_alert参数

        SQL> SHOW PARAMETER log_checkpoints_to_alert

 

        NAME                                 TYPE        VALUE

        ------------------------------------ ----------- ------------------------------

        log_checkpoints_to_alert             boolean     FALSE

 

    --设置log_checkpoints_to_alert参数

        SQL> ALTER SYSTEM set log_checkpoints_to_alert = TRUE;

 

        System altered.    

       

    --清空告警日志文件的内容

        SQL> ho cat /dev/null > /u01/app/oracle/admin/orcl/bdump/alert_orcl.log

   

    --查看数据文件头部信息中控制文件的信息为3037172

    SQL> SELECT file#,status,tablespace_name ,

      2  dbms_flashback.get_system_change_number cur_scn,

      3  to_char(resetlogs_time,'yyyy-mm-dd hh24:mi:ss') rst_dt,

      4  resetlogs_change# rst_scn,

      5  to_char(checkpoint_time,'yyyy-mm-dd hh24:mi:ss') ckpt_dt,

      6  checkpoint_change# ckpt_scn,checkpoint_count ckpt_cnt

      7  FROM v$datafile_header;

 

         FILE# STATUS  TABLESPACE_NAME    CUR_SCN RST_DT                 RST_SCN CKPT_DT               CKPT_SCN   CKPT_CNT

    ---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------

             1 ONLINE  SYSTEM             3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        531

             2 ONLINE  UNDOTBS1           3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        493

             3 ONLINE  SYSAUX             3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        532

             4 ONLINE  USERS              3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        534

             5 ONLINE  EXAMPLE            3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        489

             6 ONLINE  TBS1               3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        412

             7 ONLINE  TBS1               3037641 2010-07-20 11:59:23    2837290 2010-07-25
19:05:30    3037172        407

    7 rows selected.

 

    SQL> save /u01/app/oracle/oradata/query_1.sql;

    Created file /u01/app/oracle/oradata/query_1.sql

   

        SQL> ALTER SYSTEM SWITCH LOGFILE;  --切换日志

 

        System altered.

                 

        SQL> ho cat /u01/app/oracle/admin/orcl/bdump/alert_orcl.log | more  --查看告警日志

        Sun Jul 25 19:14:29 2010

        Beginning log switch checkpoint up to RBA [0xd.2.10], SCN: 3037657

        Thread 1 advanced to log sequence 13

          Current log# 3 seq# 13 mem# 0: /u01/app/oracle/oradata/orcl/redo3a.rdo

          Current log# 3 seq# 13 mem# 1: /u01/app/oracle/oradata/orcl/redo3b.rdo

 

    SQL> @/u01/app/oracle/oradata/query_1.sql;   --数据文件头部滞后分钟后与告警日志记录的SCN相同

 

         FILE# STATUS  TABLESPACE_NAME    CUR_SCN RST_DT                 RST_SCN CKPT_DT               CKPT_SCN   CKPT_CNT

    ---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------

             1 ONLINE  SYSTEM             3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        532

             2 ONLINE  UNDOTBS1           3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        494

             3 ONLINE  SYSAUX             3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        533

             4 ONLINE  USERS              3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        535

             5 ONLINE  EXAMPLE            3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        490

             6 ONLINE  TBS1               3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        413

             7 ONLINE  TBS1               3037803 2010-07-20 11:59:23    2837290 2010-07-25
19:14:29    3037657        408

 

    SQL> SELECT TO_CHAR(sysdate,'yyyy-mm-dd hh24:mi:ss') FROM dual;  --时间滞后分钟 19:19:59
- 19:14:29

 

    TO_CHAR(SYSDATE,'YY'

    -------------------

    2010-07-25 19:19:59

 

        SQL> ALTER SYSTEM CHECKPOINT;  --产生检查点

 

        System altered.

 

        SQL> ho cat /u01/app/oracle/admin/orcl/bdump/alert_orcl.log | more  --查看告警日志中的SCN:
3037881

        Sun Jul 25 19:14:29 2010

        Beginning log switch checkpoint up to RBA [0xd.2.10], SCN: 3037657

        Thread 1 advanced to log sequence 13

          Current log# 3 seq# 13 mem# 0: /u01/app/oracle/oradata/orcl/redo3a.rdo

          Current log# 3 seq# 13 mem# 1: /u01/app/oracle/oradata/orcl/redo3b.rdo

        Sun Jul 25 19:19:34 2010

        Completed checkpoint up to RBA [0xd.2.10], SCN: 3037657

        Sun Jul 25 19:21:55 2010

        Beginning global checkpoint up to RBA [0xd.116.10], SCN: 3037881

        Completed checkpoint up to RBA [0xd.116.10], SCN: 3037881

 

    SQL> @/u01/app/oracle/oradata/query_1.sql;  --数据文件头部同步与告警日志记录的SCN相同,为3037881

 

         FILE# STATUS  TABLESPACE_NAME    CUR_SCN RST_DT                 RST_SCN CKPT_DT               CKPT_SCN   CKPT_CNT

    ---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------

             1 ONLINE  SYSTEM             3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        533

             2 ONLINE  UNDOTBS1           3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        495

             3 ONLINE  SYSAUX             3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        534

             4 ONLINE  USERS              3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        536

             5 ONLINE  EXAMPLE            3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        491

             6 ONLINE  TBS1               3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        414

             7 ONLINE  TBS1               3037890 2010-07-20 11:59:23    2837290 2010-07-25
19:21:55    3037881        409

 

    --查看完全检查点           

        SQL> SELECT addr,indx ,rtckp_scn,

          2    rtckp_tim,

          3    rtckp_rba_seq,rtckp_rba_bno

          4  FROM x$kccrt;

 

        ADDR           INDX RTCKP_SCN        RTCKP_TIM            RTCKP_RBA_SEQ RTCKP_RBA_BNO

        -------- ---------- ---------------- -------------------- ------------- -------------

        B7D59C10          0 3037881          07/25/2010 19:21:55             13           278      

 

        SQL> show parameter log_check  --查看log_checkpoint_timeout的值

 

        NAME                                 TYPE        VALUE

        ------------------------------------ ----------- ------------------------------

        log_checkpoint_interval              integer     0

        log_checkpoint_timeout               integer     1800

        log_checkpoints_to_alert             boolean     TRUE

       

        ho cat  /u01/app/oracle/admin/orcl/bdump/alert_orcl.log --告警日志文件中Incremental
checkpoint

        ----------------------------------------------------------------------------------     

        Sun Jul 25 19:22:46 2010

        Incremental checkpoint up to RBA [0xd.119.0], current log tail
at RBA [0xd.119.0]

        Sun Jul 25 19:52:51 2010

        Incremental checkpoint up to RBA [0xd.37a.0], current log tail
at RBA [0xd.420.0]

 

        ---------------------------------------------------------------------------------

        SQL> select CPDRT,CPLRBA_SEQ||'.'||CPLRBA_BNO||'.'||CPLRBA_BOF
"Low RBA",

          2  CPODR_SEQ||'.'||CPODR_BNO||'.'||CPODR_BOF "On disk RBA",CPODS,CPODT,CPHBT

          3  from x$kcccp where indx = 0;  --获得控制文件中增量检查点的信息

 

             CPDRT Low RBA             On disk RBA   CPODS   CPODT                  CPHBT

        ---------- ------------------- ------------- ------- --------------------   --------

               97 13.5574.0            13.6391.0     3041226 07/25/2010 22:16:37    725323317

              

            --CPDRT列是检查点队列中的脏块数目.

            --CPODS列是on disk rba的scn

            --CPODT列是on disk rba的时间戳

            --CPHBT列是心跳ITPUB个人空间

 

    7.更详细的检查点介绍:针对checkpoint的概要分析

                          晶晶实验九之详细论述增量检查点篇

   

三、实例恢复

    1.当打开非一致性关闭或shutdown abort数据库时,将导致实例恢复

    2.实例恢复过程为自动

    3.使用联机重做日志文件中的信息来同步数据文件

    4.涉及到两类不同的操作

        前滚:数据文件被还原到实例失败之前的状态

        回滚:已修改但未提交的数据将被撤销到修改之前的状态

       

四、实例恢复的过程

下面的图片来自Oracle官方教材

 

 

 

    1.首先Oracle会比较控制文件中检查点与数据文件头部信息,发现数据不一致

    2.从最后检查点之后到日志文件尾部将被重新应用到数据文件,同时产生undo信息(回滚),此阶段也称为cache recovery

    3.数据文件中包含已提交或未提交的数据,尽管存在未提交的数据,此时数据库已经被打开,允许用户连接

    4.未提交的事务将被回滚

    5.数据文件中仅包含已提交的数据

   

五、调整实例恢复

    1.为参数文件中对恢复过程有影响的联机日志记录数量和数据块设置合适的大小

    2.调整联机日志文件的大小来影响检查点发生的频率

    3.使用SQL 命令发生检查点事件

    4.使用Fast-start fault recovery

    5.几个恢复相关的参数

        LOG_CHECKPOINT_TIMEOUT        -->两次checkpoint之间间隔的时间(单位是秒) ,该参数现已很少使用

        LOG_CHECKPOINT_INTERVAL       -->两次checkpoint之间redo block 数据块的个数(不是db_block),

                                            --   redo block size = os block size 该参数现已很少使用

        FAST_START_MTTR_TARGET        -->指定多长时间完成实例恢复(单位是秒) (后面演示中重点讨论)

        RECOVERY_PARALLELISM          -->指定前滚时的并发度

        FAST_START_PARALLEL_ROLLBACK  -->回滚阶段时预先UNDO需要使用的块,然后增加回滚并发度

                                            -- 2路CPU建议设置为LO,四路CPU建议设置为HI,否则缺省置为false

        FAST_START_IO_TARGET          -->数据库宕机所要做的恢复所需的IO的数量,10g之后很少使用

 

六、实例恢复相关的视图     

    V$INSTACE_RECOVERY                -->查看fast_start_mttr_target设置以及系统MTTR相关信息

    V$FAST_START_SERVERS              -->事务回滚时相关并发信息

    V$FAST_START_TRANSACTION          -->正在恢复的事务的相关信息

    完全检查点

        select * from X$KCCRT where indx=0;

           

    增量检查点

        SQL> select * from X$KCCCP where indx=0;

 

七、实例恢复演示       

    --删除告警日志

        SQL> ho rm -f /u01/app/oracle/admin/orcl/bdump/alert_orcl.log          

 

        SQL> SELECT * FROM scott.emp WHERE ename = 'SCOTT';

 

             EMPNO ENAME                          JOB              MGR HIREDATE         SAL     DEPTNO

        ---------- ------------------------------ --------- ---------- --------- ---------- ----------

              7788 SCOTT                          ANALYST         7566 19-APR-87       7100         20

             

    --更新SCOTT的薪水且提交事务

        SQL> UPDATE scott.emp SET sal = sal / 2 WHERE ename = 'SCOTT';

 

        1 row updated.

 

        SQL> COMMIT;

 

        Commit complete.

   

    --插入两条新记录且不提交事务

        SQL> INSERT INTO scott.emp(empno,ename,job) SELECT '2001','Mark','Develpoer' FROM dual;

 

        1 row created.

 

        SQL> INSERT INTO scott.emp(empno,ename,job) SELECT '2002','Mary','Designer' FROM dual;

 

        1 row created.

 

        SQL> SELECT * FROM scott.emp WHERE empno IN (2001,2002);

 

             EMPNO ENAME                          JOB              MGR HIREDATE         SAL     DEPTNO

        ---------- ------------------------------ --------- ---------- --------- ---------- ----------

              2001 Mark                           Develpoer

              2002 Mary                           Designer

   

    --强制关闭实例并重启实例,则实例将自动回滚

        SQL> SHUTDOWN ABORT;

        ORACLE instance shut down.

        SQL> STARTUP

        ORACLE instance started.

 

        Total System Global Area  251658240 bytes

        Fixed Size                  1218796 bytes

        Variable Size              88082196 bytes

        Database Buffers          159383552 bytes

        Redo Buffers                2973696 bytes

        Database mounted.

        Database opened.

   

    --从告警日志中获得回滚的相关信息

    SQL> ho ls /u01/app/oracle/admin/orcl/bdump

    alert_orcl.log  orcl_arc0_4016.trc  orcl_arc1_4018.trc  orcl_lgwr_3995.trc

 

    SQL> ho cat /u01/app/oracle/admin/orcl/bdump/alert_orcl.log

 

        ----------------------------------------------------------------

 

        ALTER DATABASE   MOUNT

        Thu Jul 22 12:44:40 2010

        Setting recovery target incarnation to 10

        Thu Jul 22 12:44:40 2010

        Successful mount of redo thread 1, with mount id 1252833332

        Thu Jul 22 12:44:40 2010

        Database mounted in Exclusive Mode

        Completed: ALTER DATABASE   MOUNT

        Thu Jul 22 12:44:41 2010

        ALTER DATABASE OPEN

        Thu Jul 22 12:44:41 2010

        Beginning crash recovery of 1 threads  --开始crash recovery

        Thu Jul 22 12:44:41 2010

        Started redo scan                      --扫描redo

        Thu Jul 22 12:44:42 2010

        Completed redo scan

         142 redo blocks read, 58 data blocks need recovery

        Thu Jul 22 12:44:42 2010

        Started redo application at

         Thread 1: logseq 4, block 3156

        Thu Jul 22 12:44:42 2010

        Recovery of Online Redo Log: Thread 1 Group 3 Seq 4 Reading mem 0

          Mem# 0 errs 0: /u01/app/oracle/oradata/orcl/redo3a.rdo

          Mem# 1 errs 0: /u01/app/oracle/oradata/orcl/redo3b.rdo

        Thu Jul 22 12:44:42 2010

        Completed redo application

        Thu Jul 22 12:44:43 2010

        Completed crash recovery at         --完成恢复

         Thread 1: logseq 4, block 3298, scn 2921577

         58 data blocks read, 58 data blocks written, 142 redo blocks read

        Thu Jul 22 12:44:43 2010

        LGWR: STARTING ARCH PROCESSES

        ARC0: Archival started

        ARC1: Archival started

        LGWR: STARTING ARCH PROCESSES COMPLETE

        ARC1 started with pid=17, OS id=4018

        ARC0 started with pid=16, OS id=4016

        Thu Jul 22 12:44:45 2010

        Thread 1 advanced to log sequence 5

        Thread 1 opened at log sequence 5

          Current log# 1 seq# 5 mem# 0: /u01/app/oracle/oradata/orcl/redo1a.rdo

          Current log# 1 seq# 5 mem# 1: /u01/app/oracle/oradata/orcl/redo1b.rdo

        Successful open of redo thread 1

        Thu Jul 22 12:44:45 2010

        MTTR advisory is disabled because FAST_START_MTTR_TARGET is not set --FAST_START_MTTR_TARGET未设置

 

        --------------------------------------------------------------------------------------------------

        --对scott用户已提交,故恢复之后为已提交的状态

        SQL> SELECT * FROM scott.emp WHERE ename = 'SCOTT';

 

             EMPNO ENAME                          JOB              MGR HIREDATE         SAL     DEPTNO

        ---------- ------------------------------ --------- ---------- --------- ---------- ----------

              7788 SCOTT                          ANALYST         7566 19-APR-87       3550         20

 

        --新增加的两条记录未提交,实例恢复之后被回滚     

        SQL> SELECT * FROM scott.emp WHERE empno IN (2001,2002);

 

        no rows selected

 

八、设置FAST_START_MTTR_TARGET参数

/*

    FAST_START_MTTR_TARGET参数的作用就是减少cache recovery的恢复时间。

    当设定了FAST_START_MTTR_TARGET值后,数据库管理增量检查点写入尝试达到设定的目标恢复时间

    如果设定的值合理,则整个恢复过程将接近所设定的时间

    注:当使用FAST_START_MTTR_TARGET参数时,应当关闭FAST_START_IO_TARGET, LOG_CHECKPOINT_INTERVAL,

        LOG_CHECKPOINT_TIMEOUT 参数。如果设定这些参数将会妨碍cache recovery满足指定的FAST_START_MTTR_TARGET值

    应当为FAST_START_MTTR_TARGET设置合理的时间值

        缺省值为0,表示关闭检查点自动调整功能

        最大值为3600,当设定值大于3600,将被自动取整为3600

        最小值为1,当设定为时1,事实上不切合实际因此,恢复时间也不能达到设定的目标值 */

       

    更多关于FAST_START_MTTR_TARGET参数的优化:Instance Recovery Performance Tuning: Fast-Start
Fault Recovery

          

    --将fast_start_mttr_target的值置为0

        SQL> alter system set fast_start_mttr_target = 0;

 

        System altered.

 

        SQL> CREATE TABLE tb_test AS SELECT * FROM all_objects WHERE 1=2; --新建一张表

 

        Table created.

 

        SQL> INSERT INTO tb_test SELECT * FROM all_objects;  --插入记录到新表

 

        49945 rows created.

 

        --下面的查询中可以看到ESTIMATED_MTTR为28

            SQL> SELECT recovery_estimated_ios,actual_redo_blks,target_mttr,estimated_mttr,

              2  optimal_logfile_size  FROM v$instance_recovery;

 

            RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE

            ---------------------- ---------------- ----------- -------------- --------------------

                               762            11661           0             28

 

            SQL> COMMIT;   --提交事务

 

            Commit complete.

           

            SQL> SELECT recovery_estimated_ios,actual_redo_blks,target_mttr,estimated_mttr,

              2  optimal_logfile_size  FROM v$instance_recovery;

 

            RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE

            ---------------------- ---------------- ----------- -------------- --------------------

                               767            11669           0             28     

 

        --由上可知,commit仅仅是将日志缓冲区的内容更新到日志文件

       

            SQL> ALTER SYSTEM CHECKPOINT;  --手动更新检查点

 

            System altered.

 

            SQL> SELECT recovery_estimated_ios,actual_redo_blks,target_mttr,estimated_mttr,

              2  optimal_logfile_size  FROM v$instance_recovery;

 

            RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE

            ---------------------- ---------------- ----------- -------------- --------------------

                                 0                0           0             28     

               

        --上面的查询可以看到字段RECOVERY_ESTIMATED_IOS和ACTUAL_REDO_BLKS 的值已经减少到0

        --检查点的产生将database buffer中的脏内容写入到了数据文件中

        --ESTIMATED_MTTR没有发生变化,因为该列为非实时更新列

时间: 2024-12-03 06:43:15

oracle备份恢复参考日志——实例恢复的相关文章

Oracle 10g RAC RMAN备份异机单实例恢复

本文通过将Oracle 10g RAC RMAN的完整的备份进行异机恢复的过程,可以对在恢复的过程中可以发现备份时的一些问题.比如规档日志的冗余,控制文件与参数文件的自动备份的利用等,本示例是拿了rman的备份集进行备份的,所以在最后的启动数据库的过程中出现了问题,提示控制文件过旧等问题,所以备份需要经过详细高可用的设计,才能在恢复过程中降低风险. Oracle 11g R2 RAC on OEL5.8 x64安装笔记 http://koumm.blog.51cto.com/703525/128

Oracle 备份恢复概念

--====================== -- Oracle 备份恢复概念 --======================       数据库维护中,备份或恢复是重中之重的问题.尽管很多时候数据库系统运行缓慢,但对数据库数据的丢失而言,显然后者损失的代价是 不言而喻的.因此DBA至少在保证数据不丢失的情况下来提高系统的性能是最起码的要求.关于什么是备份与恢复,在此不做赘言.   一.物理备份与逻辑备份     物理备份         是所有物理文件的一个副本,比如数据文件,控制文件,

Oracle恢复内部原理:实例恢复

实例恢复用于恢复崩溃失败或者并行服务器环境中的实例失败,所以实例恢复既可以指崩溃恢复也可以指并行服务器环境中的实例恢复(只要有一个存活的实例就可以恢复其他一个或多个失败的实例). 实例恢复的目标就是还原失败实例在数据缓冲区中的数据块并关闭还开着的线程.实例恢复只用联机归档日志和当前联机数据文件(不需要还原历史备份).实例恢复一次只能恢复一个线程,它从该线程最近的线程检查点开始恢复直至线程的结束. 5.1  检测是否需要实例恢复 当Oracle内核发现一个实例死掉而对应线程在控制文件中的线程打开状

Oracle实例恢复

Oracle实例恢复原理 首先从事物说起,当执行update开启一个事物的时候,首先需要在buffer cache中找到可用的块(block)更新数据,然后构造cr块,将update之前的数据放入到undo中,同时会在log buffer内写日志,log buffer内数据每隔3秒通过lgwr进程将往redo log写日志,在这个过程更改的数据还在内存中,产生脏数据,直到dbwr进程将脏数据写入到磁盘,如果脏数据还未写入磁盘,脏数据中包括提交或未提交的,这个时候由于掉掉或其他原因导致数据库意外宕

Oracle实例恢复机制

整理自<OCP/OCA认证考试指南> 001      实例恢复不仅可以重新构成在崩溃时未被保存至数据文件的任何已提交事务,而且可以回滚已被写至数据文件的任何未提交事务.这种恢复是完全自动的,我们无法随意停止实例恢复过程.如果实例恢复失败,那么唯一的可能是在实例失败的同时还存在介质失败,此时只有在使用介质恢复技术还原和恢复受损文件后才能打开数据库.介质恢复的最后一个步骤是自动的实例恢复. 002 实例恢复机制     大体上,实例恢复只不过是使用联机日志文件的内容将数据库缓冲区缓存重新构建至崩

Oracle数据库备份恢复的概念:错误类型、实例恢复方法等

1.明确Oracle数据库中可能发生的错误类型;  2.描述实例恢复的方法;  3.明确checkpoints,redo log files和archive log files的重要性;  4.配置快速闪回区;  5.配置归档模式; Part of Your Job DBA的职责就是要保证数据库是可使用的而且是高效的;  1.避免数据库发生常规错误:比如用户无权限,表空间不足等等;  2.增加MTBF(Mean Time Between Failures),即两次发生故障的时间间隔;  3.使用

Oracle实例恢复和介质恢复

Oracle恢复基础概述  一.恢复解决方案 错误类型及解决方案 错误分类 恢复解决方案 介质失败 如果是少量的块损坏,使用块介质恢复:如果是大量的块.数据文件.表空间的损坏,可能需要对损坏的数据文件或者表空间执行完全恢复:如果是归档Redo日志文件或者联机Redo日志文件的丢失,那么只需要不完全恢复方式. 逻辑损坏 如果是程序员错误导致出现的问题,可通过补丁应用修复问题.对于无法修复的问题,也可采用介质恢复手段来恢复数据. 用户错误 根据不同用户错误,选择不同的Flashback技术恢复,使用

【RAC】将RAC备份集恢复为单实例数据库

[RAC]将RAC备份集恢复为单实例数据库 1.1  BLOG文档结构图   1.2  前言部分   1.2.1  导读 各位技术爱好者,看完本文后,你可以掌握如下的技能,也可以学到一些其它你所不知道的知识,~O(∩_∩)O~: ① rac数据库的备份集是如何恢复到单实例的数据库 ② ASM文件系统到OS文件系统的转换 ③ 一般的备份恢复过程       本文如有错误或不完善的地方请大家多多指正,ITPUB留言或QQ皆可,您的批评指正是我写作的最大动力. 1.2.2  实验环境介绍   源库:1

Oracle 实例恢复

--======================= -- Oracle 实例恢复 --=======================   一.Oracle实例失败     Oracle实例失败多为实例非一致性关闭所致,通常称为崩溃(crash).实例失败的结果等同于shutdown abort.     实例失败的原因         电源负载故障         硬件故障         后台进程失败         异常关闭数据库     实例失败后的状况         数据库可能丢失已提