[转载]数据集成之主数据管理(一)基础概念篇

问题描述

转自:http://blog.csdn.net/woohooli/archive/2009/01/07/3726040.aspx数据集成是当下比较热门的话题,相关的产品和平台也越来越多。很多CIO都在各种数据集成平台和产品之间犹豫不决。因此对数据集成平台的框架体系有全面的理解,对各个厂家产品所提供的功能有深入的认识才能为数据平台选型的决策提供可靠的保证。我有幸参与了国内一个知名企业的集成平台的设计工作,并主导了数据集成平台的需求分析和产品选型工作。这次工作中,研究了很多新的技术方向和产品,下面我主要讲一下数据集成领域的一种新兴的产品平台主数据管理平台MDM(MasterDataManagement)。主数据的概念首先介绍一下什么是主数据。这里借用其他网站的一个数据分类模型,我们可以看到有元数据(metadata),引用数据(ReferenceData),主数据(MasterData),企业结构数据(EnterprisestructureData),交易活动数据(TransactionActivityData),交易审计数据(TransactionAuditData)这六大类数据。简要解释一下这六大类的数据,关于这些数据分类的定义可以在网上很容易的找到。元数据:数据的数据,平时我们设计表时,大部分属性字段就是元数据。比如,性别,国籍,出生省份等。这个是最接近自然意义的的数据。引用数据:元数据的可能取值范围,我们设计表时所说的数据字典往往就是引用数据。比如,性别只能是男和女,男和女就是引用数据。国家的引用数据就是世界上这100多个国家和地区;主数据:在我们数据库设计中最重要的一些实体,是由元数据和引用数据实例的集合。DMReview专栏作家JaneGriffin将主数据定义为“...用于为核心业务实体创建和维护全企业‘记录系统’,以记录业务交易并评定这些实体的业绩所需的信息。”平时我们常碰到的客户信息,产品信息都属于主数据。对于主数据的介绍,我们会在后面详细展开说明。企业结构化数据:企业业务中所需的数据实体,可能是多个主数据的集合。不同行业的结构化数据会有很大不同。交易活动数据:主数据之间活动产生的数据。比如客户购买产品的交易记录就是交易活动数据,工厂生产产品,生产记录也是交易活动数据。交易审计数据:我们对数据的所有活动都通过交易审计数据进行记录。比如我们对客户信息修改的操作,对交易的增加和删除操作,这些活动在很多关键系统(比如银行)都需要记录,以合符相应法规的要求(如BaselII、萨班斯—奥克斯利法案)。下图中数据模型中的蓝色越深代表语义相关性越强和数据质量越重要,而黄色越深代表数据的数据数量越多、更新的频率越快、实时抓取的数据越快、数据的生命越短。下图可以看到,元数据的数据语义性最强,几乎不更新,数据量最少,生命周期最长。http://www.dmreview.com/issues/20060401/1051002-1.html主数据是企业应用系统中最基本的业务单元,下面是一段英文的原文:MasterDataarethefundamentalbusinessdatainthecompany,typicallylong-livedandusedacrossmultipleapplications。CoreMasterDataareoperationalentities,supportingallfundamentalbusinessactivitytransactionsbeingexecutedonthislevel.TheCoreMasterdataarecommonandshareablewithintheorganization。我觉得很好理解,比如一个产品系统,它处理的基本数据就是生产数据。HR系统处理的基本数据是雇员;CRM系统是客户一般来说核心主数据包含:Customers,Contracts,Suppliers,Distributors/Partners,Employees等等。另外,各个行业对于主数据的管理的需求和期望会有很大不同,因此行业经验对于主数据管理也是很重要的。主数据管理的概念从上面的介绍可以了解,主数据并不是什么新的概念,但为什么之前没有主数据管理的产品呢?其实,解释这个问题和解释数据集成出现的原因很类似。因为之前主数据依附于各个单独的业务系统,比如HR,ERP,SCM,企业的网站,商业合作伙伴的系统都可能对某一个主数据有存储,比如某个产品。问题随之来了,如系统间数据编码不一致;数据的冗余;某些系统数据的不完整。举个实际的例子,如果我们新建一个BI的系统,那么有可能我需要从生产系统,财务系统,物流系统,企业合作伙伴系统多个系统拿到一个完整的关于主数据的信息。显然,需要一种解决方案,能够提供一个单一的主数据访问接口,以提高主数据访问的效率;为企业的市场、销售、客户关系管理等活动提供可靠的数据,提高企业的敏捷性。主数据管理:主数据管理是数据管理的一种高级形式,它必须构建于ETL或者EII(EnterpriseInformationIntegration)等技术之上,因此很多主数据管理平台本身就包含了数据抽取、数据加载、数据转换、数据质量管理、数据复制和数据同步等功能。也有某些厂商把MDM作为数据集成产品的一个模块交付给客户。主数据分散在各个系统造成的问题:数据在各个系统冗余,造成数据访问繁琐;编码不统一;数据不同步,缺乏一致性;给企业业务带来了如下影响:延误产品面市时间;产品供不应求;不准确的订单交付;销售效能低下;客户满意度降低;生产力降低。主数据管理平台带来的好处:有统一的主数据访问平台;企业能够提供一致的完整的共享信息平台;集中的内容丰富和干净的数据中心;为使用数据的应用,企业业务流程和决策系统提供了一个真实的数据访问通道。我个人感觉MDM平台建立之后,最受益的还是BI相关的应用。主数据管理平台的功能模块MasterRepositories(主数据资源库)::X-RefDB,MastersDB,MasterDataApplications;DataQuality(数据质量保证):源数据的质量检查,从源数据系统传输到数据缓储区的所有数据都应首先接受质量检查后才能导入,源数据的质量检查应包括接口数据文件格式是否标准化的确认、文件大小确认,记录数、文件生成时间的确认等内容;ETL系统质量检查,包括对主外键关系、编码规范的检查。每次数据的抽取、转换和加载都必须有完整的日志记录,并在加载完成后确认记录数前后一致。Dataenrichment(数据深度分析,关联性分析):企业内部分析;SystemIntegration(集成组件):主数据管理器;服务总线(提供dataservice);异常处理;映射(mapping)/转换(Transforming)/加载(loading);数据交换(Dataexchange);同步流程(Workflow);BusinessSystem;元数据/主数据访问控制;数据录入控制;数据采集;管理/安全主数据管理平台项目的实施和很多集成项目一样,项目的实施最重要的是制定好业务的策略和规划,业务人员,业务需求和行业专家对数据的理解和分析是关键,技术平台只是我们思想实现的重要工具,不会起决定性的作用。提供主数据管理平台的产商传统ERP厂商:SAP和ORACLE都基于自己的产品经验,在它们的ERP套装软件产品中加入了主数据管理产品。基于他们行业的经验,他们的产品有比较完整的主数据管理比较好的数据模型和主数据管理的经验。Oracle基于自身在CRM和制造行业的深厚经验,提供非常全面的客户主数据产品UCM8.0和制造业主数据产品PIM12.0,中间件厂商:TIBCO有专门的MDM产品,我看到的是他们一年前的产品介绍,感觉功能还比较欠缺,缺少很多重要的功能,当然我还没有时间研究他们最新的产品。ORACLE在MDM产品上有着比较明确的战略和路线图。在收购BEA后,相信在MDM产品上,ORACLE会结合原本就功能强大的ODI工具,加上BEA在数据集成领域产品的特点,基于自己原有的行业经验,提供更全面的产品,巩固自己在中间件产品的领先地位。IBM收购了一个MDM产品,我一向不太愿意研究IBM的产品,所以也没有发言权。我SoftwareAG(WebMethod)做的也可以,有专门的产品,功能也相对完善。但在实施团队的力量上,要差一些。

解决方案

解决方案二:
Oracle的能量毋庸置疑了!中间件发展前景还是很乐观的!
解决方案三:
当然,收购之后对BEA也不是没有好处!最后的受益方还是很难说的!不过中间件做好了市场还是很大的!
解决方案四:
关于中间件有很多新资料现在可以在官网下载,还有今年的一些免费活动都开始报名了:http://wmdata.com.cn/oracle/iwom-OFM/index.asp?frm=1
解决方案五:
MDM的发展已经成为趋势,希望能更完善
解决方案六:
Oracle的产品还是值得相信的,关注中!!!
解决方案七:
是啊Oracle的产品性价比确实很高!!
解决方案八:
Oracle和IBM之间我也比较看好Oracle!
解决方案九:
。。。忘记说了!仅限于中间件这个领域!!!
解决方案十:
我最近也在关注SOA,但是始终研究不透。
解决方案十一:
Oracle融合中间件全球增长最快。
解决方案十二:
OracleBPEL,Oracle业务规则引擎,Oracle企业服务总线……Oracle的精华都体现在这里了。
解决方案十三:
楼主说的这是来自中间件的新成果,并且还是一个新的机会,而这样的新机会在以前可能是不会有的。
解决方案十四:
Oracle的精华都体现在这里了

时间: 2024-08-02 14:08:13

[转载]数据集成之主数据管理(一)基础概念篇的相关文章

C++面试题(一)——基础概念篇

C++面试题--基础概念篇 http://blog.csdn.net/worldwindjp/ 面试C++程序员的时候一般都是3板斧,先是基础问答,然后一顿虚函数.虚函数表.纯虚函数.抽象类.虚函数和析构函数.虚函数和构造函数.接着拷贝构造函数.操作符重载.下面是STL,最后是智能指针.        都能挺过去那基本知识这关应该算是过了,下面就是项目背景和算法了.      1,C++和C相比最大的特点                    1)面向对象:封装,继承,多态.          

haproxy小结(一)基础概念篇

HAProxy是法国人Willy Tarreau个人开发的一个开源软件,目标是应对客户端10000以上的同时连接,为后端应用服务器.数据库服务器提供高性能的负载均衡服务.HAproxy可以实现基于TCP(四层 例如:SSH,SMTP,MYSQL)和HTTP(七层 例如:web服务器)应用的代理软件,同时也可以作为负载均衡器使用,并且是开源完全免费的.HAproxy完全可以支持数以万计的并发链接,它的工作模式可以将其简单而安全地整合到当前的服务架构中,同时可以保护你的WEB服务器不暴露到网络上(设

主数据管理详解

什么是主数据管理(Master Data Management ,MDM) 主数据是指在整个企业范围内各个系统( 操作/事务型应用系统以及分析型系统)间要共享的数据,比如,可以是与客户(customers), 供应商 (suppliers), 帐户(accounts)以及组织单位(organizational units)相关的数据.主数据通常需要在整 个企业范围内保持一致性(consistent).完整性(complete).可控性(controlled),为了达成这一目标 ,就需要进行主数据

大数据更看重数据质量 主数据管理挖掘隐藏价值

提起大数据,人们想到的是数据的海量.变化的快速.内容的庞杂,但这就是大数据的全部吗?其实在企业内部,还有这样一些被誉为"主数据"的数据形态,它们变化不快.看似与交易无关,它们可能是客户的订单信息,也可能是供应商的基本资料,但为什么这些数据如此重要?记者近日采访了Informatica高级副总裁兼主数据管理业务部门总经理Dennis Moore,作为主数据管理业务部门负责人,他告诉记者:"大数据的核心问题不是数量大,而是质量高,而主数据管理确保数据的质量和真实性,企业通过主数据

INFN为大数据、社会、云计算等业务提供主数据管理

http://www.aliyun.com/zixun/aggregation/13822.html">Informatica Corporation (NASDAQ:INFA)是世界头号的数据集成软件独立的 供应商, 今天公布nformatica MDM 9.5在为社会传媒.云计算.移动和大数据提供主数据管理能力方面取得重大突破.Informatica MDM 9.5是行业领先的数据管理技术,通过四大趋势来对行业进行重新定义同时推动业务增长. (责任编辑:蒙遗善)

jfinal druid-JFinal2集成Druid,管理页面没有数据?

问题描述 JFinal2集成Druid,管理页面没有数据? http://www.oschina.net/question/1863482_2144810 具体可看这个链接... 解决方案 same question

数据集成工具领域,TOP10厂商优劣分析

数据集成是把不同来源.格式.特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享.在企业数据集成领域,已经有了很多成熟的框架可以利用.架构师或开发人员对数据集成工具的效率应该有所要求.好的数据集成工具是具有分布式处理能力,可读取,分析,交互,在具有分布式处理能力的动态模型中快速对本地和外来数据做出反应. 1.Actian Actian位于加利福尼亚州雷德伍德市,通过Actian DataConnect和Actian DataCloud提供数据集成功能.Actian的数据集成工具

广东横琴新区地税局打造“大数据下纳税遵从管理”

广东横琴自贸区自挂牌成立以来,登记注册企业已超20000家,其中已引进和在洽谈的世界500强企业52家,国内500强投资企业76家,各类企业总部858家."自贸区效应"带来了区域发展的提速增效,为横琴税收可持续增长奠定了坚实的经济基础. 随着今年5月营改增的全面实施,"互联网+税务"的深入推进,横琴地税人深深地认识到:打造创新驱动发展的税务信息和服务平台,加快创新资源集聚,推动税收体制创新驱动发展,既是促进辖区企业发展的重要途径,又是实现税收稳定.持续增长的必由之路

为什么要进行现代数据集成?核心驱动程序和特性

从商业角度来看,现代数据集成已经变得有用,因为很多可用于组织的数据只有非常短的保存期限.业务流程,计划,以及其他活动必须能够尽快利用数据.企业需要开发数据管理策略,专注于生成业务就绪和业务可用的数据.为此,组织需要一种全新的思维模式,各种类型的孤岛被分解,企业和IT团队继续发展合作伙伴关系,改进所有集成流程,以更快地满足动态业务需求. 为了与业务需求相关,现代数据集成必须确保业务用户参与无数的数据管理活动.业务团队是业务专家,他们对于显示数据使用的关键信息,数据对特定业务流程的重要性以及数据质量