前一章我们实践了一把streams同步单表的过程,看起来很简单是不是(如果你觉着复杂,那不是因为streams本身操作复杂,而是为了配置好streams前期的准备工作较复杂),事实上也确实很简单,由小能见大,我们从上述示例中应该也能看出streams的操作方式就是捕获(capture)->传播(propagation)->应用(apply),不管是表也好,schema也好,database也好,都是遵循这个操作过程,下面逐一介绍捕获传播和应用进程,俺尽可能做到清晰简单直白,但限于个人理解和自身水平,如描述有误请自行鉴别:))。另,本章文字描述较多,内容相对枯燥,阅读前要做好准备,如有心直接上手更高级的实践配置,可跳过本节,浏览第二部分。
捕获(Capture)
众所周知,数据库的修改操作均会被记入redolog(表钻牛角尖,俺指通常情况下),以便在发生错误时,能有途径修正。而Capture进程做为oracle的一个后台进程天生就拥有读取redolog的本领,因此它也就具有了捕获dml,dll修改操作的能力。
Capture进程将修改格式化为指定的格式存入message定义为LCRs并将其置入队列(queue)。由于运行中的capture进程自动基于其自己的规则捕获修改,因此又被称为:隐式捕获(implicit capture)。
提示:什么是LCR
capture进程捕获数据库的操作,例如表/schema甚至整个数据库的修改等。这些修改都会记入redo,而capture进程就是根据redolog分析数据库中的修改并格式化保存为message,这些message即被称为:logical change record (LCR)。捕获进程通过定义的rule来确定哪些修改会被捕获,这些被捕获的修改称为captured messages。
因此:Messages->LCRs->Captured message
LCRs也分两种:
A>.row LCR:包括DML操作产生的修改信息,注意由于单条dml sql语句也有可能触发多条记录的修改,因此一条dml修改操作也可能产生多条row LCR,另外对于单行中大字段类型的修改比如long,lob也可能产生多条row LCR;
每条rowLCR被封装成LCR$_ROW_RECORD的对象类型,包含下列属性:
n source_database_name:触发修改操作的数据库
n command_type:触发修改操作的命令类型,比如:INSERT, UPDATE, DELETE, LOB ERASE, LOB WRITE, or LOB TRIM。
n object_owner:对象属主
n object_name:对象名称
n Tag:标签,可用于追踪LCR
n transaction_id:触发修改的DML语句所属事务ID
n Scn:发生修改时的SCN(system change number )
n old_values:DML修改前的值,不过注意不同的dml操作产生值也不同,比如UPDATE or DELETE的旧值就是修改前的值,而对于INSERT则该列为空
n new_values:DML修改后的值,基于相同的原因,不同的dml操作也会产生不同的值,比如UPDATE or INSERT的值即修改后的值,而DELETE操作则该列为空
B>.DDL LCR:包括ddl操作产生的对象修改信息,DDL LCR包括下列的信息:
n source_database_name:同rowLCR
n command_type:同rowLCR
n object_owner:同rowLCR
n object_name:同rowLCR
n object_type:对象类型,比如TABLE/VIEW/PACKAGE
n ddl_text:执行的DDL语句
n logon_user:执行DDL语句的用户
n current_schema:执行DDL语句的schema
n base_table_owner:基表属主(如果有的话,当然通常没有,但是对于某些操作比如触发器触发的的修改,则基表即是触发表)
n base_table_name:基表名称,其它同上。
n tag:同rowLCR
n transaction_id:同rowLCR
n scn:同rowLCR
提示:
不管是rowLCRs或DDL LCRs都包括源数据库名称,为避免在propagation或apply时出现问题,ORACLE建议不要随便修改源数据库名称。
1、捕获方式
Capture进程即可以在本地捕获,即本地捕获进程(local capture process),也可以在远程其它数据库执行捕获,即下游捕获进程(downstream capture process),执行下载捕获的数据库也被称为downstream数据库,甚至还可以同时配置本地捕获和下游捕获。
本地捕获比较简单,是指capture进程运行于本地,如图所示:
下游捕获就要复杂一点点,因为它要涉及到将本地产生的redologs发送至远端执行捕获的数据库,说到发送redologs让回忆起了standby是吧,对,此处确实与standby有所关联,发送redologs应用的技术是一样的(正好趁此机会再复习一下),因此下游捕获也不得不被分成两类:
查看本栏目更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/database/Oracle/