什么是企业数据仓库?

如今,数据分析已经成为帮助企业做出战略决策的关键。软件工具可以帮助企业发现模式或者发现各种流程的洞察。用于实施这些策略的数据系统通常作为供应商特定的企业数据仓库解决方案而存在。在这些应用程序中,信息被加载和结构化,以便从非常大的数据集合中提供最有效的结果。

数据仓库

数据仓库是用来提供新的业务洞察力的数据中心存储库。这些数据代表了业务的全面一致的观点。通常,这些历史数据集具有以下特征::

·面向主题:数据仓库通常提供特定的主题或业务需求,如销售或生产效率。

·时变性:数据是历史性的,因此可以用特定的时间框架来分析结果,例如在过去两年中按每月或按季度计算。企业数据仓库通常是由事务系统中封装的数据提供的,其中只有最近的数据是必需的。例如,事务系统可能只反映客户最近的电话号码,而数据仓库将包含所有以前使用的号码。

·集成性:数据仓库将来自多个不同来源的信息整合到同一视图中。例如,不同的商店可能具有相同产品的不同名称,但它们仍将具有相同的库存单元(SKU)或零件号。

·非易失性:存储在企业数据仓库中的信息不会改变。为了保持历史数据的完整性,它是只读的,从不改变。

什么样的数据加载到数据仓库?

业务数据操作几乎是实时的,例如从连锁商店在POS机终端捕获的销售信息。每日销售数据由系统捕获并送入数据文件。然后,这些文件将得到ETL(提取,转换和加载)软件或脚本的管理,或将该数据“归一化”到可直接上传到数据仓库表中的字段。

例如,一家大型零售连锁店将要捕捉销售商品的数据,例如,销售人员,商店,时间,付款方式,特别优惠或优惠券等等。另一家公司可能更有兴趣收集客户服务活动以进行定期绩效分析。

大多数存储的数据是关系型的。这意味着信息以能够与单个表链接的数字ID字段的形式存在,例如链接到文本的产品名称的产品ID列表和每个不同ID的描述。这可以节省企业数据仓库的空间,同时在数据报告中提供更有意义的信息。

数据仓库与传统数据库的区别

数据库通过捕获信息(无论是电子自动的还是人工采集的)来支持日常操作。这些也称为事务或操作数据库。它们主要用于从源头捕获信息。数据库还允许对信息进行编辑,以更加密切地反映真实世界的变化。它们针对数据输入进行了优化:协调小型而频繁的更新和添加。数据被组织成行或单个记录。

虽然这两个系统都可以用于报告,但数据仓库是为聚集大量固定信息而设计的。从事务数据中运行的报表中的信息可能会发生更改。

数据仓库主要用于报告和分析业务操作,以便识别模式。信息通常从一个或多个数据库中提取,成为数据仓库中的历史记录。数据仓库将反映所有的变化。大多数企业数据仓库解决方案要求以列或以维度(如时间或位置)的方式存储信息,以检索一系列度量单位,如美元或数量。这允许在相同的报告工具中深入了解各种细节。

数据集市

规模较小的公司,甚至大公司当接近一个特定的数据项目,可能将数据分割更小的、更有限的数据集,被称为“数据集市”。这样可以消除过多或不相关信息的运营开销。数据集市可以根据需要从数据仓库中提取,或者单独存在。

新公司或小公司可能不需要维护数据仓库。但是在大中型企业中,通常每天都使用事务性数据库和数据仓库。重要的区别是,企业数据仓库解决方案是只读和优化的,用于分析不断增长的业务数据,以支持业务决策。

本文作者:Harris

来源:51CTO

时间: 2024-08-01 22:17:14

什么是企业数据仓库?的相关文章

基于ERP建立企业数据仓库

企业的信息化正如火如荼地展开着,有人说中国加入WTO后随之而来的是ERP的时代,这话一点不假,越来越多的企业在考虑实施ERP,越来越多的ERP厂商在角逐ERP市场,目前的ERP已成为企业信息化软件中最优秀的应用之一.但同时,我们也应该看到,ERP对于企业的信息化管理来说并不能提供全部的答案,我们既要看到ERP的优势,又要看到它的不足.长期以来,ERP的发展致力于面向企业的事务处理,对于企业资源的充分利用.最优调配.流程化管理等提供了好的解决方案,为企业提供了集成和规范化的管理,对于改善企业的业务

大数据下的企业数据仓库建设

为何要建数据仓库 数据仓库整体架构 数据仓库-分层                      数据仓库-STG层 数据仓库-ODS层 数据仓库-DWD层 数据仓库-DWS层 dws层示例                                      数据仓库-DWS层 数据仓库-DIM层 数据仓库处理流程 数据治理    数据平台整体架构 数据仓库建设的价值

卷烟工业企业的数据仓库构建方法

目前,卷烟工业企业以信息化带动工业化,信息技术向企业全面渗透,运用于各个流程,支持产品设计.生产.管理和运营的各个环节.通过"行业卷烟生产经营决策管理系统"平台,实现了卷烟计划取码和物流数码跟踪,以及生产打码.销售扫码的实物数据日报和工商数据采集.卷烟工业企业积累了大量的运营管理数据,但分散存储在不同的应用系统中,因此,传统的数据库应用系统已不能很好地支持决策,企业需要新的技术来弥补原有数据库系统的不足.数据仓库技术能跨越多个应用系统,集成.转换和汇总所需要的数据,表达完整的数据视图,

以云为基础的数据仓库打造企业商业智能的高速公路

近日,享誉全球的第12届Teradata数据仓库暨企业分析峰会在苏州召开,分会以"数据价值极致演绎"为主题,深入探讨企业如何充分利用最新数据仓库和企业分析技术,借助数据源所提供的洞察力,快速制定最佳业务决策,把握商业先机. 在发布会上, Teradata 动态企业数据仓库平台 6690 (Active EDW 6690) 平台开始供货,提供最新一代的混合存储,进一步增强了数据仓库的能力,帮助公司制定最佳决策. Teradata 天睿公司利用智能存储管理软件-- Teradata Vir

什么是数据仓库

数据 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作<Building the Data Warehouse>一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented).集成的(Integrate).相对稳定的(Non-Volatile).反映历史变化(Time Variant)的数据集合,用于支持管理决策.对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它

数据仓库——在“啤酒与尿布”中挖掘

数据 数据仓库--在"啤酒与尿布"中挖掘01-5-21 下午 04:19:25 对话者:主持人:程鸿--<计算机世界>报记者专家:孟晓峰--中国人民大学信息学院教授祁国辉--"数据仓库之路"网站主持人IT厂商:杨顺生--NCR大中华区市场及合作伙伴总经理用户:陈道斌--工商银行信息管理部处长(博士)对话主题:数据仓库在中国的应用前景如何?  数据仓库的门槛有多高?主持人:自从"啤酒和尿布"的故事

数据仓库集成设备选型指导

选择合适的数据仓库技术从来都不简单.无论是传统的企业数据仓库软件还是 目前非常流行的数据仓库集成设备,如何选择合适的方案来满足企业的业务需求 是每一位管理者都要面对的,这其中不仅涉及到一些步骤和注意事项,同样存在 着许多挑战. 目前介绍数据仓库设备的资料有很多,比如媒体报道的文章 .厂商提供的白皮书.产品的Demo等等.但有些时候,太多的信息会对产品本身 造成一定的影响,用户如何才能从众多的数据中找到他们想要的点?这些产品都有 什么样的区别?它们能不能真正解决企业中存在的数据仓库问题? 在进行数

考虑两种数据仓库架构共存的可行性

在Google上搜索"Inmon和Kimball",你会和轻松地找到这两个名字的概念,它们是两种著名的数据仓库架构方式.然而在这信息的海洋中,你会发现几乎所有的内容几乎都能得出一个结论,那就是要在Bill Inmon和Ralph Kimball两者之间选择其一. 但是,"数据仓库之父"Bill Inmon却告诉我们,在一定的环境这下,其实这两种架构完全可以共存,且协作良好.对此,来自电力公司的BI系统架构师Bill Harrison表示:"两种架构都有各自

当前数据仓库建设过程

一个典型的企业数据仓库通常包含数据采集.数据加工和存储.数据展现等几个过程,本篇文章将按照这个顺序记录部门当前建设数据仓库的过程. 1. 数据采集和存储 采集数据之前,先要定义数据如何存放在 hadoop 以及一些相关约束.约束如下: 所有的日志数据都存放在 hdfs 上的 /logroot 路径下面 hive 中数据库命名方式为 dw_XXXX,例如:dw_srclog 存放外部来源的原始数据,dw_stat 存放统计结果的数据 原始数据都加工成为结构化的文本文件,字段分隔符统一使用制表符,并