使用IBM InfoSphere MDM工作流改进主数据治理

借助跨许多行业分部的经验,作者还提供了跨许多不同的 MDM 风格的专家经验,本文中的信息旨在帮助企业架构师了解确保 MDM 系统的工作流功能得到适当考虑的重要性。正如您在整篇文章中所发现的那样,要最充分地发挥 MDM 给企业带来的优势,您不仅应该将 MDM 工作流视为在 MDM 系统内部的数据提供者,还应该将它视为整个企业外部的广泛企业流程的数据提供者。

MDM 风格

通常,MDM 用例可分为 4 种不同风格。每种风格可单独使用;但是,在业务利益相关者进一步领会主数据实现所带来的好处后,某种风格的实现往往会不断演化,变为更多实现风格的组合。

主数据是业务部门操作的信息的重要部分。客户、产品、帐户、患者、提供商、车辆、员工和资产只是主数据领域的几个示例。这部分重要数据通常分散在多个系统中。与同一个客户、产品或提供商相关的信息可能在多个系统中不一致,结果导致基于不完整数据的糟糕决策、不准确的数据带来了糟糕的客户服务,或者数据变得不可信赖并且未被业务人员充分利用。

IBM InfoSphere® MDM 提供了丰富的、动态的功能为组织内的主数据创建一个受信任的视图。它在匹配、可疑重复数据处理、数据管理、安全和绩效领域提供了行业领先的功能。IBM InfoSphere MDM 还为将任务关键型数据推送到业务线使用而提供了单一的基础,确保业务用户绝对信任他们的数据。这意味着这些用户可快速制定决策,并且知道他们手头拥有用来制定决策的最准确的信息。

协作式 MDM

在创作和协作是重要需求的地方,协作式 MDM 提供了创建和管理主数据的能力。协作式 MDM 通常与产品相关联,但适合管理任何具有创作的、充实和工作流用例的领域。在协作式 MDM 内创建的主数据通常被导出到利用受信任信息来实现特定举措的消费系统(或渠道)中。主数据也可以导出到某个多领域操作系统中,以支持与其他领域的更大型的并发操作和关系。零售等行业可能会引入和更新大量产品,而且流线化的业务流程至关重要,这时通常非常适合使用协作式的主数据创作方法。

在这种实现风格中,季节性调整和市场需求变更经常会创建庞大的产品目录和引入新产品。通常,需要让解决方案足够灵活,以便跟上快速变化的形势。协作式 MDM 风格使得 MDM 系统能够轻松地适应不断变化的需求,引入的新产品受到适当的控制(批准、流程流、分层管理、属性更改等)。IBM InfoSphere MDM Collaborative Edition 提供了一个功能丰富的平台来解决这些用例。它允许产品作者创建新产品并充实从提供商收到的信息。这些信息流经可定制的工作流,以管理这些产品的引入和维护。通过业务规则、新产品分层结构以及新属性的验证和审批流程,还可以执行额外的主数据治理。签入/签出功能和并行处理特性可确保执行了数据完整性,允许多个作者同时操作目录或产品的不同部分。

在某些情况下,可将协作式 MDM 风格与操作风格相集成,从而允许业务线在消费点利用不同领域之间的海量事务和关系。

注册表 MDM

注册表风格的 MDM 常常被视为创建主数据系统的第一个入口点,也是最简单的入口点。在此风格中,可引用来自多个来源的数据,并将它们加载到主数据中心内。一旦进入数据中心,记录就可以匹配和链接,以便提供数据的单一的、一致的黄金视图 (golden view)。在此风格中,源系统仍然是记录系统,用于捕获对数据的任何更新。匹配的 MDM 数据可视为一个参照系统,允许系统查看主数据的实时计算的视图(临时的黄金视图)或从包含主数据实体(链接记录的索引)的源系统识别记录。通常,人们认为注册表 MDM 实现对业务没有多大破坏性,因为数据源保持不变,而且 MDM 系统成为了一个使用现有数据的额外系统和业务线的一个消费点。

实现风格各不相同;但是源系统每天都会将几乎所有更新导入 MDM 注册表中。然后再一次将更新的数据与现有 MDM 数据进行匹配,MDM 系统中匹配和重复的服务会更新数据的黄金视图。

IBM InfoSphere MDM Standard Edition 提供了一个行业领先的平台,在组织内创建注册表 MDM 实现。借助高级的自动匹配和重复数据删除功能,它可以为分散在整个组织的数据创建单个一致的黄金视图。IBM InfoSphere MDM Standard Edition 还提供了丰富的功能,供数据管理团队执行手动干预,为自动匹配和重复数据删除算法提供一个额外的治理层。

作为 IBM InfoSphere 平台的一部分,它为您的第一个 MDM 服务活动提供了一个轻松的切入点,为不断完善您的 MDM 实现提供了基础。

操作性 MDM

与注册表实现相比,操作性 MDM 风格在 MDM 实现上更进一步。在操作性 MDM 实现中,MDM 系统变成了记录系统。来自源系统的数据从现有的数据源转移到了 MDM 系统中,该数据的所有权也从现有的数据源转移到了 MDM 系统。进入操作性 MDM 系统后,数据不仅会由其他业务线系统读取,还会由任何需要更改该数据的系统更新。

IBM InfoSphere MDM Advanced Edition 提供了为创建一个操作性 MDM 系统来创建高性能的、安全的健全平台的能力。利用 Standard Edition 中存在的相同的匹配和重复数据删除功能,Advanced Edition 提供的平台允许更改 MDM 中心中存储的数据,以便将它们快速集成到一个黄金数据系统中。还提供了丰富、灵活的业务服务,为业务线提供了一种使用操作系统中数据的安全的、健全的方式。

混合 MDM

在混合 MDM 实现中,MDM 系统变成了业务部分的记录系统。来自源系统的数据从现有的数据源转移到了 MDM 系统中,该数据的所有权也从现有数据源的一部分转移到 MDM 系统。所有现有的数据源都可以保留它们的主数据所有权;但是,对于不会向 MDM 系统贡献主数据的现有或新的流程和应用程序,混合的记录系统将拥有它们的所有权。

IBM InfoSphere MDM Advanced Edition 构建于 IBM InfoSphere MDM Standard Edition 所提供的注册表风格 MDM 功能之上,还增加了实现混合风格的 MDM 或者(如果需要)全面操作风格的 MDM 的能力

工作流和主数据治理

工作流能够协调人类和系统与主数据的交互。主数据治理就是通过实施策略来提高数据质量的过程。有效的主数据治理战略要求 MDM 工作流协调与数据的交互,以确保数据质量。

MDM 工作流

所有 InfoSphere MDM 版本都提供了适合支持这些用例的工作流功能。MDM 工作流是在 MDM 引擎中原生提供的,而且与一个嵌入式的 IBM Business Process Manager 版本相集成。IBM Business Process Manager 是一款行业领先的 BPM 产品,它允许您在组织内快速构造、测试和部署业务流程。它还提供了可与其他系统集成的高级功能。

利用嵌入式 IBM BPM 版本,您可以轻松地使用主数据充实业务流程,确保业务流程始终处理着组织最信任的、最准确的信息。还支持对 MDM 系统应用一个数据治理层,确保数据的质量尽可能的准确,允许通过业务流程编排来指导数据管理员执行纠正 MDM 系统中的数据不准确性所需的步骤。MDM Application Toolkit(IBM 作为 IBM InfoSphere Master Data Management 平台的一个组件提供)提供了高级的加速器,可用于促进利用主数据的业务流程的快速构造。

在考虑主数据管理实现的同时考虑业务流程管理 (BPM) 会获得显著收益。在将两种战略当作一个绿地项目一起考虑时,或者在为一个现有的 MDM 或 BPM 实现提供补充时,您应该考虑充分利用协调这些实现的好处。

数据治理的类型

与 MDM 工作流相关联时,可将数据治理划分为两个主要区域:

被动数据治理

被动数据治理是应用数据质量的治理作为组织内的一项持续的操作任务。通常,一个数据管理员团队会响应 MDM 系统能够触发的事件,提醒他们已检测到一个数据质量问题并需要解决该问题,或者一部分数据违背了业务策略,需要通过人为干预来修复该数据,以保持该数据的完整性。被动数据治理是反应性地解决主数据中已出现的数据质量问题的过程。

主动数据治理

主动数据治理是在数据使用者的消费或创建点应用数据质量治理的过程。无论是使用 MDM 系统中存储的数据还是通过业务线最初创建主数据,都允许业务线通过确保企业流程得到了主数据的完善并基于该数据采取行动来提高数据质量,这些都会显著提高您数据的质量和信任水平。业务用户和他们与代表主数据的人员、组织、产品和帐户的接触点,是在一个已执行的业务流程中使用数据采取正确行动的最佳位置,因为他们是该数据的专家。在采用主动数据治理时,有效的业务流程对确保在创建新流程时没有产生不应有的风险至关重要;但是,任何主动数据治理实现都应始终受可靠的被动数据治理战略支持。

图 1 显示了主动和被动数据治理之间的区别:

典型用例和实现风格

具有 MDM 工作流的操作中心

在一个操作性 MDM 实现内,MDM 工作流可使用嵌入式的 IBM Business Process Manager 功能实现。

时间: 2024-09-22 12:58:00

使用IBM InfoSphere MDM工作流改进主数据治理的相关文章

IBM InfoSphere MDM在复杂环境中提供数据集成流程自动化和可靠的信息

借助 IBM® InfoSphere® MDM Reference Data Management (RDM) 中心,客户可以运用主数据管理 (MDM) 方法管理自身的参考数据.RDM 中心会通过有效的集中创作和审批点来替换遍布多款应用程序的代码表筒仓.同时还会提供一些 MDM 功能,比如治理.流程.安全和审计控制. 和任何初始的 MDM 实现项目一样,人们将大部分精力用于 RDM 中心与现有的应用程序和流程的集成.整个企业 IT 基础架构的应用程序都引用了代码表.为获得主引用数据的优势,RDM

介绍IBM InfoSphere MDM Reference Data Management Hub v10.0功能

本文描述了关键参考数据概念.http://www.aliyun.com/zixun/aggregation/14208.html">数据模型概述和高层次架构,详细介绍了一个创建参考数据集和映射的场景,就如何将参考数据导出和分发到外部系统提供了一些初步见解. 简介 尽管企业 MDM 系统本身注重主数据管理,不过有一种称为参考数据的特殊类型可用来定义所捕获的主数据实体的各个方面(比如允许某个属性使用的值的范围).参考数据的示例包括状态代码集.员工类型.州/省/国家代码.账簿代号等.由每个属性的

利用Linux通道捆绑来提升IBM InfoSphere Streams性能

本文将从较高的层次介绍通道绑定的概念,如何设置测试环境和我们观察到的结果.在我们的实验中,通道绑定将带宽提高达 68%. 本文探讨 Red Hat Enterprise Linux 上的通道绑定对 IBM InfoSphere Streams 吞吐量和延迟的影响.将介绍如何使用 Red Hat Enterprise Linux 系统设置和配置通道绑定环境,可从在此环境中运行的 InfoSphere Streams 应用程序获得怎样的性能改进.目标读者为熟悉 InfoSphere Streams

监控和审计IBM InfoSphere BigInsights和Cloudera Hadoop的访问权限

您也将学习一个仅适用于 IBM InfoSphere BigInsights 的快速启动监控实现. 大数据骚动主要集中在支持极限容量.速度和多样性的http://www.aliyun.com/zixun/aggregation/13748.html">基础架构和该基础架构支持的实时分析功能中.虽然像 Hadoop 这样的大数据环境是相对较新的,但事实是在大数据环境中数据安全问题的关键是预先解决.哪里有数据,哪里就有可能存在隐私泄密.非授权访问或特权用户的不恰当访问. 整个大数据环境和更多传

IBM杰出工程师:如何集成和治理大数据?

文章讲的是IBM杰出工程师:如何集成和治理大数据,"大数据治理"在IBM杰出工程师Ron Ben Natan博士的眼中要比传统结构化数据的治理难度大得多.他认为大数据治理既有基于传统的编程模式,又有大数据下特有的方式,是没法利用传统数据治理方式来操作的.同时,在大数据的模式下,出现大量新的数据结构和新技术,如聚合型数据结构和JSON和Avro技术等.以上种种都体现出大数据的治理更具有挑战性. 在北京国家会议中心举办的"见智,见未来--IBM 2013技术峰会"上,I

使用Java编程语言构建IBM InfoSphere Streams应用程序

简介 IBM InfoSphere Streams( 以下简称 Streams) 是 IBM 于 2009 年推出的具有高可靠性,高可扩展性,分布式流计算平 台,前瞻性地把支持每秒 6G 或者每小时 21600G(相当于互联网上所有网页数量之和)数据处理能力作为系统设计的指标 ,实现了流数据"永恒分析"的能力.它包含一个运行时环境 ( 或者称为实例 ) 和编程模型来简化需要对大批量连续流数 据进行提取.过滤.分析以及关联的应用程序的开发,能够广泛的应用于制造.零售.交通运输.金融证券以

IBM Infosphere Data Replication产品族Replication Server与Change Data Cap

IBM Infosphere Data Replication产品族Replication Server与Change Data Capture的异同比较 一,简介 在如今信息快速变化的商业时代,必须在第一时间做出商业决策并采取行动才能在激烈的竞争中保持领先地位.如果商业数据不能保证同步,那么生产和利润势必会遭受损失,但是,面对信息量激增并且分布存储的特点,保证数据的可信性并非易事. IBM 的 InfoSphere Data Replication 产品族针对这一问题为应用提供了一系列数据同步

如何从 IBM InfoSphere Streams 调用 Python 代码

概述 IBM InfoSphere Streams 是一个高性能的实时事件处理中间件.它独特的优势在于能够从各种不同的数据来源获取结构化和非结构化数据,以用于执行实时分析.它通过将一种称为 SPL(Streams Processing Language,流处理语言)的易于使用的应用程序开发语言与一个分布式运行时平台相结合来完成此任务.这个中间件还提供了一个灵活的应用程序开发框架,将使用 C++ 和 Java 编写的代码集成到 Streams 应用程序中.除了 C++ 和 Java,许多构建真实

从IBM InfoSphere Streams应用程序调用Python代码

还可以在一个 Streams 应用程序的上下文内调用 Python 代码.学习如何直接从 IBM InfoSphere Streams 应用程序调用 Python 代码. IBM InfoSphere Streams 是一个高性能的实时事件处理中间件.它独特的优势在于能够从各种不同的数据来源获取结构化和非结构化数据,以用于执行实时分析.它通过将一种称为 SPL(Streams Processing Language,流处理语言)的易于使用的应用程序开发语言与一个分布式运行时平台相结合来完成此任务