灵活有效的数据仓库解决方案:第1部分:客户互动和项目计划

简介

商业智能(Business Intelligence)已经进化为包括越来越多的数据分析技术。无论采用哪种数据分析方法,数据仓库都仍然是利用信息资产的重要基础。本系列文章将帮助您使用 IBM DB2 Data Warehouse Edition(DB2 DWE)交付某种数据仓库基础设施,该基础设施对于随需应变的商业智能至关重要。本文将关注数据仓库计划,其中包括客户互动过程、业务发现、项目建议以及项目计划。

目标读者

本文是为需要知道如何交付数据仓库解决方案的 IT 专业人士撰写的。本文假定您已经熟悉系统和数据库的概念。有许多主题未在本文中进行介绍,但它们同样是交付良好数据仓库解决方案的基础,包括系统和数据库设计、管理、性能调优等。本文仅仅关注与数据仓库密切相关的问题。

商业智能是什么?

商业智能(Business Intelligence,BI)是对于大量数据的收集和分析,以便洞悉如何驱动战略性和策略性商业决策。BI 是用于将数据转换成信息的过程和技术的集合。它包含了种类繁多的技术,包括数据仓库、多维分析或在线分析处理(OLAP)、数据挖掘和数据可视化,以及简单的查询和很多种用于制作报表的分析工具。这些技术允许业务用户收集、存储、访问和分析数据以提高做出业务决策的能力。

图 1. 商业智能是什么?


数据仓库是什么?

数据仓库(data warehouse)是一个集中式的存储库(repository),包含了综合详细的数据和概要数据,用于从不易变的历史角度提供客户、供应商、业务过程和事务的完整视图。

另一方面,数据集市(data mart)包含数据仓库中所存储数据的一个子集,这些数据是特定商业社区、部门或用户群所感兴趣的(例如:市场促销、财政或帐户集合)。

数据集市是由其用户的功能范围而非数据集市数据库的大小定义的,意识到这一点十分重要。在结构良好的 BI 系统中,数据仓库充当多个数据集市的一个源。

数据仓库是什么?

数据仓库(Data warehousing)是用于管理和交付用于进行决策的完整、及时、正确和可理解信息的过程和工具的设计和实现。它包括使企业可以创建、管理和维护数据仓库或数据集市的所有活动。数据仓库(Data warehousing)处理对于数据仓库(data warehouse)或数据集市的开发、实现和操作的管理。它包括元数据管理、数据采集、数据清理(data cleansing)、数据集成、存储器管理、数据分布、数据归档、操作报表制作、分析报表制作、安全性管理、备份和恢复计划等等。

下面的小节提供了对于数据仓库(除了报表制作和分析)的简介。将特别关注为分析准备数据 —— 该任务通常占大多数数据仓库项目计划的 80%。

为何选择 IBM DB2 Data Warehouse Edition?

IBM DB2 DWE 是一个功能强大且完整的商业智能(Business Intelligence)基础设施产品,其中包括了 DB2、集成的 OLAP、高级数据挖掘、数据提取、转换和装入(Extraction、Transformation and Loading,ETL)、报表制作工具等。DB2 DWE 操纵并提高诸如 DB2 OLAP Server 和来自 IBM 合作伙伴的高级桌面 OLAP 工具的性能。

DB2 DWE 是最具成本效益的数据仓库工具之一。据 Market Magic Ltd 在 2004 年的研究报告所称(参阅 参考资料),DB2 DWE 在 5 年多对于数据仓库实现的 Probable Cost of Ownership(PCO)要低于 Oracle 和 NCR Teradata 的。

可预见的伸缩能力以及没有限制是商业智能(Business Intelligence)平台的关键标准。DB2 通过其独特的无共享(shared-nothing)架构的实现来满足该需求。可伸缩性同时适用于大型和小型数据库。

可伸缩性和价格都很重要,但是它们无法单独解决构建 BI 平台的挑战。DB2 DWE 通过同样交付关键的分析和挖掘技术完成了该蓝图。DB2 与用于 OLAP 应用程序的 DB2 Cube Views、在数据库中用于实时数据挖掘的 Intelligent Miner Scoring 以及在深嵌于 DB2 的诸如空间扩展器(spatial extender)和 XML 查询等新工具完全集成,从而确保无缝的集成和优化的性能。

时间: 2024-08-04 04:25:58

灵活有效的数据仓库解决方案:第1部分:客户互动和项目计划的相关文章

灵活有效的数据仓库解决方案,第3部分:设计并实现仓库ETL过程

简介 数据集成是数据仓库中的关键概念.ETL(数据的提取.转换和加载)过程的设计和实现是数据仓库解决方案中极其重要的一部分.ETL 过程用于从多个源提取业务数据,清理数据,然后集成这些数据,并将它们装入数据仓库数据库中,为数据分析做好准备. ETL 过程设计 尽管实际的 ETL 设计和实现在很大程度上取决于为数据仓库项目选择的 ETL 工具,但是高级的系统化 ETL 设计将有助于构建高效灵活的 ETL 过程. 在深入研究数据仓库 ETL 过程的设计之前,请记住 ETL 的经验法则:"ETL 过程

交付有效且灵活的数据仓库解决方案:第2部分:仓库设计和数据建模

简介 业务环境是在快速变化的,而业务数据的类型也是如此.一个成功的数据仓库解决方案的基础就是灵活的设计,这种设计可以适应不断变化的业务数据.数据仓库的架构和仓库数据的建模是仓库设计中的核心过程. 数据仓库的架构 当使用数据模型捕获业务需求时,您就已经完成了数据仓库设计中的部分工作.然而,正式的数据仓库设计应该从数据仓库的架构开始. 仓库架构是基于一些因素所做的关键决策,这些因素包括当前基础设施.业务环境.期望的管理和控制结构.实现工作的承诺和范围.企业所采用的技术环境的功能以及可用的资源等. 架

数据仓库解决方案指南

解决|数据 作者:Sybase软件(北京)有限公司 市场部副总监 夏红 内容:数据仓库概念,Sybase的数据仓库解决方案 -------------------------------------------------------------------------------- 数据仓库的概念 任何一个公司和企业,在订货.存货清单.票据清单.帐目清算.客户服务以及 财务报告等方面都存在大量的业务应用和技术环节.数据仓库的作用在于:从这 些应用系统中获取信息并转换到一个新的数据库,通过对新库

开源MySQL高效数据仓库解决方案:Infobright详细介绍_Mysql

Infobright是一款基于独特的专利知识网格技术的列式数据库.Infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/group by之类),infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个.mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,

MySQL数据仓库解决方案 Infobright 详解

Infobright是一款基于独特的专利知识网格技术的列式数据库.Infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/group by之类),infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个.mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,

解读基于数加的大数据仓库解决方案

数加是阿里云为企业大数据实施提供的一套完整的一站式大数据解决方案,覆盖了企业数仓.商业智能.机器学习.数据可视化等领域,助力企业在DT时代更敏捷.更智能.更具洞察力.数加平台构建在阿里云云计算基础设施之上,简单快速接入MaxCompute等计算引擎,支持ECS.RDS.OCS.AnalyticDB等云设施下的数据同步. 数加平台采用了先进的"可用不可见"的数据合作方式,并对数据所有者提供全方位的数据安全服务,数据安全体系包括:数据业务安全.数据产品安全.底层数据安全.云平台安全.接入&

2015建投数据大数据解决方案发布暨核心客户研讨会落幕

ZD至顶网软件频道消息:10月25日,为期两天的"新启航 新产品--2015建投数据大数据解决方案发布暨核心客户研讨会"在北京成功举办.本次研讨会议由建投数据科技股份有限公司主办,汇聚来自全国各地数十家金融行业客户.会议分享了大数据在互联网征信领域的应用,建投数据在金融辅助营销和工业4.0这两个领域打造大数据应用实践.通过传播行业最佳管理实践,提供行业优秀解决方案,促进业内经验的交流,助力行业企业实现战略转型! 一. 互联网征信现状 今年互联网金融最热门的风口当属互联网征信了,特别是央

intelligentminer数据仓库解决方案

当用户的数据积累到一定数量时,这些数据的某些潜在联系.分类.推导结果和待发现价值隐藏在其中,我们可以使用数据发掘工具帮助发现这些有价值的数据,ibm在这方面的工具就是intelligentminer.ibmintelligentminer被选为业界最佳数据采集工具,赢得了dm读者奖.除了数据仓库和数据挖掘解决方案,ibm还在此基础上开发了一系列行业解决方案及应用程序. 1.ibm数据挖掘工具 intelligentminer通过其世界领先的独有技术,例如典型数据集自动生成.关联发现.序列规律发现

Sybase数据仓库解决方案在贵州电信的应用

概述 随着电信市场的逐步开放,新兴的运营商不断产生,电信市场的竞争日趋激烈.一方面,为了能够在竞争中生 存和持续发展,各电信运营商都对企业的经营和管理提出 了更高的要求.另一方面,电信运营商原来为支撑各种业 务运营所建立的计算机管理系统,由于功能比较单一,已 无法全面满足企业经营管理工作的需要,突出表现在: 单一系统产生的报表难以满足企业管理的要求; 相对固定的报表不能跟上市场形势的变化; 庞大的数据库系统不能有效地产生企业知识.电信企业迫切需要寻找到一种新的经营管理支撑手段,使管理人员能够及时