介绍IBM InfoSphere MDM Reference Data Management Hub v10.0功能

本文描述了关键参考数据概念、">数据模型概述和高层次架构,详细介绍了一个创建参考数据集和映射的场景,就如何将参考数据导出和分发到外部系统提供了一些初步见解。

简介

尽管企业 MDM 系统本身注重主数据管理,不过有一种称为参考数据的特殊类型可用来定义所捕获的主数据实体的各个方面(比如允许某个属性使用的值的范围)。参考数据的示例包括状态代码集、员工类型、州/省/国家代码、账簿代号等。由每个属性的一系列允许值组成的这种参考数据集通常位于一些专用表中,比如查找表、代码表、检查表或域表。

参考数据与元数据和主数据有所不同。首先,元数据描述了一个实体的结构,而参考数据仅描述实体属性的一系列允许值。与主数据相比,参考数据随时间的推移变化得不那么频繁。此外,参考数据往往在行(或实例)级有语义含义,而主数据有实体级语义。最后,参考数据语义更能会随时间而发生变化。例如,与数据仓库(存储过去十年的记录)中一个实体相关的组织代码可能是指兼并前或兼并后的组织。

参考数据代码在以下领域得到了应用:控制数据库列的允许值,相关实体的分类,执行域查询,或将受控的术语词汇表与其有效范围相关联。

尽管在由各个操作系统和应用程序使用之前,往往会将企业参考数据标准化,但在不同的孤立应用程序之间,表示法或语义通常是不同的。这一语义差别是无法避免的,因为应用程序通常需要其本地表示法才能提高处理效率。例如,在图 1 中,Source 和 Target 中的列 C2 表示国家代码集,这是一种参考数据。但是,经观察发现,源表和目标表对同样的国家代码有不同的表示法。

图 1. 国家代码的不同表示法

鉴于这个原因,在执行数据集成或分发之前(将数据从源系统迁移到目标系统),需要将源系统中的表示转换为目标系统能理解的表示。这一过程称为参考数据转码,是主数据集成和分发管道中的在一个重要步骤。

这一通用场景激发了一组需求,任何全面参考数据管理解决方案都应基于这组需求。下一节将探究一个参考数据管理系统的高级模型。

参考数据逻辑模型

一个参考数据管理系统有一组关键实体,帮助管理总体参考数据生命周期。图 2 显示了这些关键实体及其高层关系。这一节将详细介绍这些实体和相关概念。

图 2. 参考数据逻辑模型

托管实体

一个托管实体是一个抽象实体蓝图,该抽象实体包含足够的必要信息(属性),以便管理对其进行扩展的任何实体的生命周期。

这些属性包含名称和/或描述、所有者、版本、生命周期状态、时间戳(有效、过期、审核等)和类型。前面的图 2 显示的模型中的实体(数据集、映射集、层次结构)都共享了托管实体定义的常见属性,如图 3 所示。

图 3. 托管实体

时间: 2024-09-22 12:57:56

介绍IBM InfoSphere MDM Reference Data Management Hub v10.0功能的相关文章

IBM InfoSphere MDM在复杂环境中提供数据集成流程自动化和可靠的信息

借助 IBM® InfoSphere® MDM Reference Data Management (RDM) 中心,客户可以运用主数据管理 (MDM) 方法管理自身的参考数据.RDM 中心会通过有效的集中创作和审批点来替换遍布多款应用程序的代码表筒仓.同时还会提供一些 MDM 功能,比如治理.流程.安全和审计控制. 和任何初始的 MDM 实现项目一样,人们将大部分精力用于 RDM 中心与现有的应用程序和流程的集成.整个企业 IT 基础架构的应用程序都引用了代码表.为获得主引用数据的优势,RDM

使用IBM InfoSphere MDM工作流改进主数据治理

借助跨许多行业分部的经验,作者还提供了跨许多不同的 MDM 风格的专家经验,本文中的信息旨在帮助企业架构师了解确保 MDM 系统的工作流功能得到适当考虑的重要性.正如您在整篇文章中所发现的那样,要最充分地发挥 MDM 给企业带来的优势,您不仅应该将 MDM 工作流视为在 MDM 系统内部的数据提供者,还应该将它视为整个企业外部的广泛企业流程的数据提供者. MDM 风格 通常,MDM 用例可分为 4 种不同风格.每种风格可单独使用:但是,在业务利益相关者进一步领会主数据实现所带来的好处后,某种风格

介绍IBM InfoSphere Streams平台的典型拓扑结构

本文特别适合流计算应用的开发人员阅读,对需要了解和设计流计算架构的人员也有很大的参考价值. 进入 21 世纪,由于处理器性能的大幅提升以及网络技术和应用的日新月异, 数据的传播和交换正经历革命性的变化.图灵奖获得者吉姆·格雷(Jim Gray)认为,网络环境下每 18 个月产生的数据量等于过去几千年的数据量之和.不仅如此,数据还具有实时.异构.非结构化等一系列特点.目前大多数数据分析平台如 Hadoop,采用离线计算的方式来处理具有上述特征的数据,耗费的时间少则数天,多则数月,极大地延误了业务决

Optim Test Data Management Solution的InfoSphere DataStage作业验证步骤

简介:验证 DataStage 作业的需求 如今,企业正在实施以信息为中心的项目来转型其业务,并实 现成本节省.许多数据集成或信息集成应用程序或流程都包含 ETL 并作为其中一个组件. 通常,一个 ETL 流程(工作单元)旨在完成以下工作: 提取:从源系统提取数据并进行整理. 转换:将数据转换为可在下一步中使用的所需格式.通常,这将涉及到应用核心业务逻辑来将数据转换为 信息. 加载:通常,将数据加载到数据库表/仓库中,以供报告引擎用于从转换的数据中获取洞察. 一个数据集成应用程序中的作业会经历两

介绍IBM Workload Deployer用于中间件和云计算领域

无论您的组织是刚开始使用云还是已使用一段时间,您都会看到 IBM Workload Deployer 提供了在云中成功运行企业应用程序所需的功能. 自诞生以来,IBM Workload Deployer(以前称为 IBM WebSphere® CloudBurst Appliance)一直是用于中间件和中间件应用程序的云计算领域的最先进技术.最新的 IBM Workload Deployer 版本 v3.1 继续在其强大功能的基础上扩展功能和平台支持.但在介绍新功能之前,让我们大体了解以下 IB

IBM Infosphere Data Replication产品族Replication Server与Change Data Cap

IBM Infosphere Data Replication产品族Replication Server与Change Data Capture的异同比较 一,简介 在如今信息快速变化的商业时代,必须在第一时间做出商业决策并采取行动才能在激烈的竞争中保持领先地位.如果商业数据不能保证同步,那么生产和利润势必会遭受损失,但是,面对信息量激增并且分布存储的特点,保证数据的可信性并非易事. IBM 的 InfoSphere Data Replication 产品族针对这一问题为应用提供了一系列数据同步

实现InfoSphere Master Data Management行为扩展

基于事件操作主数据实现业务价值 开始之前 本教程针对 InfoSphere Master Data Management Server.当您实现这个全面的 MDM 解决方案时,您的某些业务需求可能要求修改开箱即用的 MDM 业务服务的默认行为.MDM 业务服务用于维护主数据,比如客户.产品.帐户.合同或位置.本教程演示如何使用 InfoSphere Master Data Management Server 为可用的 MDM 业务服务实现行为扩展. 目标 本教程的目标为: 理解如何扩展 Info

基于IBM InfoSphere DataStage和IBM InfoSphere Change Data Capture集成的解决方案

传统上,通过在非操作时间段内使用一个 ETL 流程批量处理,每年.每月或每周对http://www.aliyun.com/zixun/aggregation/8302.html">数据仓库更新一次.在今天的业务环境中,一线业务用户需要根据每小时.每分钟甚至每秒更新的信息制定决策.这些实时数据需求使得批处理窗口萎缩,并需要一个高效的解决方案来解决这个问题. IBM InfoSphere DataStage 和 IBM InfoSphere Change Data Capture 的集成是通过

监控和审计IBM InfoSphere BigInsights和Cloudera Hadoop的访问权限

您也将学习一个仅适用于 IBM InfoSphere BigInsights 的快速启动监控实现. 大数据骚动主要集中在支持极限容量.速度和多样性的http://www.aliyun.com/zixun/aggregation/13748.html">基础架构和该基础架构支持的实时分析功能中.虽然像 Hadoop 这样的大数据环境是相对较新的,但事实是在大数据环境中数据安全问题的关键是预先解决.哪里有数据,哪里就有可能存在隐私泄密.非授权访问或特权用户的不恰当访问. 整个大数据环境和更多传