物化视图实现的特殊数据复制(r11笔记第42天)

  今天开发同事碰到一个有些复杂的数据复制需求,想让我帮忙看看能否实现,当然猛一听需求是不可能实现的。不过还是耐着性子和他们讨论了一下,不过我想了下,似乎还是有改进的余地,也算是拨云见雾吧。

  目前有一个表做了拆分,即分库分表。在统计业务中还是需要把数据整合起来查询。大体就是下面的架构方式。


源端是一些分库,存在一些不同的用户,里面存放着相同结构的表。数据根据拆分规则进入不同的分库。

目标端是统计业务所用,没有使用OGG,而直接使用物化视图的方式做了数据刷新复制,当然目标端由此就有了相同数量的物化视图,为了让应用端查取方便,于是建立了一个同名的视图,这样就达到了一个基本的数据拆分到整合的过程。

但是数据有一些问题。假设表中存在下面的字段,那么其中一个字段modify_date就是数据记录的修改时间戳。


应用端可以根据这个时间戳来进行数据的统计分析,而且目前来看只有增加和部分修改,没有删除操作,但是恰恰不如意的是,这个字段因为不同产品的期望,目前是可为空的,而对于统计业务来说又是必须的。

对于统计业务来说,不会可以关注精确的时分秒,精确到日即可。于是我们就有了一些讨论。

开发同学

有个疑惑,BI这边是今天取昨天的增量数据,假设今天取数据的时候出错了,过了几天我想修复历史数据,还能知道前天增加了哪些数据吗?

goldengate也是使用主键吗

DBA:

这是两个问题,如果取数的时候出错了,按照目前的数据一致性,那么剩下没有应用到的数据是肯定不会应用到目标库的,所以数据层面的修复是平滑的。 

第二个是查看之前增加的历史数据,Oracle有些辅助功能可以实现,不过得看你的需求,不一定能完全实现。

开发同学:

就像现在这个数据,很多modify_date是空的,我们就很想知道2008年01月01日的增量数据

就是每一天的增量,好实现吗?

DBA:

你说的增量是新增的还是修改的也算,新增的那就简单了,可以用分区,如果是修改的,这个还比较麻烦。

那样得确认一点

比如1月1日 新增了100条数据

1月5日,新增了200条数据,

同是修改了1月1日的2条数据。

那这两条数据是算在1月1日还是算在1月5日。

开发同学:

恩·是这个问题,算1月5日的

因为BI这边会按这个时间建分区,虽然1月1日的分区里也有这条数据,但是不会导致丢失,这边可以取最新的使用

DBA:

对,按照时间建分区,分区设置上做一些特定的设置,可以的。(其实就是开启row movement,可以跨分区更新)

但是想起来思路是通,但是这就有两个大问题需要解决了。目标是物化视图刷新,因为物化视图是只读的,如何修改modify_date的值就是个大问题。

如何得到这些增量变化的数据,目前来看,时间的部分只能依赖于系统时间了。但是增量的数据如何鉴别,我一个设想就是根据modify_date来分区。

这样一来,架构方式就是如下的形式:

根据分区的方式,数据就能够区分开来了。但是增量的数据如何鉴别,这是个很实际的问题,这个时候我们就可以联系一些更具体的信息了,那就是物化视图日志,在源端,每个表开启增量刷新,必然要创建一个物化视图日志,这个物化视图日志里面的数据说不上完整,但是有主键ID和基本的时间戳,这就够了。我们可以在增量刷新之前得到一个基本的id列表,然后关联分区的方式修改数据为系统时间,这样一来,数据就会从默认分区流动到指定的分区中。后续供统计分析所用。

看起来不大可能的需求还是有一些的应用场景,估且算是一个特殊的刷新场景吧。

个人微信公众号如下,欢迎扫描关注。

时间: 2024-11-08 23:49:05

物化视图实现的特殊数据复制(r11笔记第42天)的相关文章

MySQL中的半同步复制(r11笔记第65天)

关于MySQL的复制架构,大体有下面三种方式,异步,全同步复制,半同步复制. 三种复制方式     第一种是异步复制,是比较经典的主从复制,搭建主从默认的架构方式,就是属于异步的,相对来说性能要好一些.但是还是会有丢失数据的情况.     第二种是全复制,比如说MySQL Cluster这样的方式,是属于全复制的,实际上MySQL Cluster其实发展并不大顺利,更多时候是一个实验室产品,但是时间定格在2016年12月12日,MySQL  5.7.17 GA的重大特性group replica

oracle 物化视图详解

原文转自:http://www.itpub.net/thread-1308625-1-1.html 物化视图(Materialized View)在9i以前的版本叫做快照(SNAPSHOT),从9i开始改名叫做物化视图.其实无论是快照还是物化视图,都能体现出这个对象的特点.物化视图中的数据来自于基表某个时刻(物化视图的创建时刻,或刷新时刻),因此可以认为是基表都个时刻的快照. 物化视图和视图类似,反应的是某个查询的结果,但是和视图仅保存SQL定义不同,物化视图本身会存储数据,因此是物化了的视图.

ORACLE中的物化视图(OCM复习总结)

1.  基本概念 视图是一个虚拟表,基于它创建时指定的查询语句返回结果集.每次访问它都会导致这个查询语句被执行一次.为了避免每次访问都执行这个查询,可以将这个查询的结果集存储到一个物化视图.也就是说,物化视图只是对已经存储于别处的数据的转换和复制.         执行创建物化视图的语句实际上会创建一个物化视图和一个容器表,容器表是一个普通的表,它与物化视图拥有同样的名称,并且这个表可以像任何其他表一样被查询.执行计划中的MAT_VIEW_ACCESS_FULL表明使用了物化视图,直接使用容器表

oracle创建物化视图报错:无效数字

问题描述 oracle创建物化视图报错:无效数字 oracle创建物化视图报错:无效数字.查询语句正常.求解答,谢谢! 解决方案 Oracle创建物化视图oracle 物化视图简单创建Oracle--大数据量创建 物化视图 解决方案二: 查询是否执行完了,应该是存在为非数字的字符

MySQL中的online DDL(第一篇)(r11笔记第3天)

记得有一天快下班的时候,一位开发同事找到我说,需要对一个表做变更,数据量据说有上千万,而当时是使用的MySQL版本是5.5,这可如何是好,对于在线业务要求高的情况下,这种需求真是让人头疼. 而在早期的版本中,这种问题就更让人无语了.在Oracle中这个问题解决的较早,当然在很多技术实现细节上,Oracle和MySQL还是蛮大的差距.Oracle中有在线重定义的方案物化视图prebuilt和在线重定义 (r10笔记第25天),而且本身对于一些DDL的操作代价要比MySQL低.不过在碰到添加字段且加

oracle物化视图同步两个数据库间的数据

两个oracle 10g 数据库,通过物化视图同步数据的具体实施流程 源库是 192.168.1.81 目标库是192.168.1.96 统计库用的服务器是 81 在统计库81上创建只读用户snap_query,用于查询 conn /as sysdba create user snap_query identified by snap_query default tablespace users temporary tablespace temp; grant connect to snap_q

oracle 11g-基于rowid的物化视图没有数据?????

问题描述 基于rowid的物化视图没有数据????? 本人刚刚接触物化视图,有些地方不太清楚,刚创建好的物化视图没有数据是几个意思啊? select 后面是多个表左连接,用的是(+)而不是left join ,哪位大神搭救一下??谢谢 create materialized view V_SHIPOWNER_ALL_TEST refresh complete on demand start with to_date('07-09-2015 12:00:00', 'dd-mm-yyyy hh24:

[20150610]使用物化视图同步数据.txt

[20150610]使用物化视图同步数据.txt --昨天听别人的一个需求要同步一个表的数据,要求使用golden gate有点小题大作.实际上物化事务就可以了,自己以前做过一些测试,也 --许没做记录,这次做一个记录. 1.建立测试环境: --源数据库10g  10.2.0.4.0  IP=192.168.100.89 --同步表T. create table t ( id number CONSTRAINTS pk_t primary key , name varchar2(20)); in

ORACLE中的物化视图

oracle|视图 ORACLE中的物化视图         物化视图是包括一个查询结果的数据库对像,它是远程数据的的本地副本,或者用来生成基于数据表求和的汇总表.物化视图存储基于远程表的数据,也可以称为快照.        物化视图可以查询表,视图和其它的物化视图.        通常情况下,物化视图被称为主表(在复制期间)或明细表(在数据仓库中).        对于复制,物化视图允许你在本地维护远程数据的副本,这些副本是只读的.如果你想修改本地副本,必须用高级复制的功能.当你想从一个表或视