DB2数据仓库环境的物理数据库设计：设计物理数据模型

为">数据仓库设计物理数据模型时，应集中精力关注各表的定义以及表之间的关系。

在为物理数据模型设计表时，应考虑使用以下指导原则：

为各维度表定义一个主键，确保最细粒度的级别键的惟一性，并在必要时促进引用约束的实现。
避免在事实表上使用主键和惟一索引，在涉及大量维度键时尤为如此。在摄取大量数据时，这些数据库对象会导致性能成本。
将所连接的各维度对之间的引用约束定义为信息型约束，帮助优化器生成有效的访问计划，从而提高查询性能。
使用 NOT NULL 子句来定义一些列。认识到 NULL 值是指示数据库内数据质量问题的一个好的指标，应该在将数据插入数据库之前研究它。
尽可能将外键列定义为 NOT NULL。
对于 DB2 版本 9.7 或更早的版本，应该为各外键定义单独的索引，以提高星形连接查询的性能。
对于 DB2 版本 10.1，应定义拥有多个外键列的复合索引，以提高星形连接查询的性能。这些索引支持优化器利用全新的 zigzag 连接方法。
在适当的时候，可以使用 NOT NULL 子句、基于单一整数列定义维度级别键。这种定义级别键的方法支持高效的连接和分组。对于雪花维度，级别键通常是主键，而该主键通常是一个整数列。
在数据仓库设计中实现标准数据类型，在编译查询计划时为优化器提供更多的选项。举例来说，如果将一个包含数字的 CHAR(10) 列连接到 INTEGER 列，则需要使用强制转换功能。这种连接会导致性能下降，因为优化器可能无法选择恰当的索引或连接方法。例如，在 DB2 版本 9.7 或更早的版本中，优化器无法选择散列连接，可能也无法利用恰当的索引。

定义和选择级别键

级别键就是一个表中的一个列或多个列的组合，它惟一地标识了维度表中的层级级别。层级级别的一个示例就是日期维度中的 DAY、WEEK、MONTH 和 YEAR。另一个示例就是用来存储零售店铺数据的 STORE 维度表的列。更为复杂的级别键示例是同一个 STORE 表中 CITY、STATE 和 COUNTRY 列的组合级别键在数据仓库内的应用极为广泛，用于将维度表连接到事实表，同时支持聚合表和 OLAP 应用程序。良好的级别键设计能够优化数据仓库查询的性能。

级别键可能属于以下类型之一：

根据来源识别数据源内记录的自然键。举例来说，如果 CITY_NAME 列在维度表中拥有惟一值，那么可以将它用作自然键，表示 CITY 维度的级别。
使用代理键作为标识，帮助减小维度较低的表或事实表的大小。大多数情况下，代理键是一个整数列。您也可以对较大的代理键使用 BIGINT 或 DECIMAL 数据类型。例如，STORE_ID 是生成的惟一整数值，用于标识一家店铺。如果使用整数而非大字符串来表示店铺名称或多列的组合（如 STORE_NAME、CITY_NAME 和 STORE_ID），那么所需占用的事实表空间将会更少。

对所有维度级别列使用代理键能够为以下领域提供帮助：

通过降低 I/O 来提高性能。
降低大型事实表中的外键存储要求。
支持缓慢变化的维度 (SCD)。举例来说，CITY_NAME 可能会发生变化，但 CITY_ID 仍保持不变。

如果维度是非规范化的，那么我们倾向于不使用代理键。这个示例展示了创建某些级别上无代理键的 STORE 维度表的语句：

CREATE TABLE STORE_DIMENSION
( STORE_ID INTEGER NOT NULL,
STORE_NAME VARCHAR(30),
CITY_NAME VARCHAR(30),
STATE_NAME VARCHAR(30),
COUNTRY_NAME VARCHAR(30));

STORE 维度能保持正常功能，因为可以将级别键定义为惟一地标识各级别。举例来说，要惟一地标识 CITY 级别，可以这样定义一个键：[COUNTRY_NAME, STATE_NAME, CITY_NAME]。遗憾的是，在表连接或 GROUP BY 子句中，由三个字符列组成的键的执行方式与单一整数列并不相同。

可以考虑为各级别显式定义一个整数键的方法。对于使用 GROUP BY CITY_ID、STATE_ID、COUNTRY_ID 子句的查询（而非使用 GROUP BY CITY_NAME、STATE_NAME 和 COUNTRY_NAME 子句），这种方法也非常适用。下面的示例展示了通过这种方法创建 STORE 维度表的语句：

CREATE TABLE STORE_DIMENSION
( STORE_ID INTEGER NOT NULL,
STORE_NAME VARCHAR(30),
CITY_ID INTEGER,
CITY_NAME VARCHAR(30),
STATE_ID INTEGER,
STATE_NAME VARCHAR(30),
COUNTRY_ID INTEGER,
COUNTRY_NAME VARCHAR(30));

使用 RUNSTATS 命令收集“列组统计信息”，除了 CITY_NAME、STATE_NAME 和 COUNTRY_NAME 列之间的关系之外，还能捕获代理键列之间的统计关系。

时间： 2024-08-02 05:53:58

DB2数据仓库环境的物理数据库设计：设计物理数据模型的相关文章

DB2数据仓库环境的物理数据库设计：简介

良好的http://www.aliyun.com/zixun/aggregation/8302.html">数据仓库设计是最大程度地提高和加速数据仓库实现的投资回报的关键所在.良好的数据仓库设计能带来在可伸缩性.平衡性.灵活性方面都足以满足当前和未来需求的数据仓库.按照本文中提供的最佳实践建议,您可以在设置数据仓库时保证高效的查询性能.简化的维护和健壮的恢复选项,从而获得长期成功. 数据仓库设计分为两个阶段:设计逻辑数据模型和设计物理数据模型. 数据仓库设计的第一个阶段是创建逻辑数据模型,

DB2数据仓库环境的物理数据库设计：DB2 10.1数据仓库设计特性

在您的http://www.aliyun.com/zixun/aggregation/8302.html">数据仓库中,利用 DB2 版本 10.1 的新特性进一步简化数据生命周期管理.优化存储利用率,并存储和检索基于时间的数据.DB2 版本 10.1 引入了以下新特性: "存储优化""多温度带数据存储"第 32 页介绍的"自适应压缩"第 32 页介绍的"使用时态表实现时间旅行查询" 存储优化在 DB2 版本

DB2数据仓库环境的物理数据库设计：设计聚合层

聚合或汇总数据有助于提高查询性能.您可以利用 DB2 数据库对象,这有助于您聚合数据,例如物化查询表 (MQT).视图或视图 MQT. MQT 也称为汇总表,它能预先计算开销较高或使用频繁的某个(或一组)查询的结果.结果集会存储在专用表中,随后可利用此表来应答常用的查询或类似的查询.在填充或刷新 MQT 中的数据时,引用的源表称为基表. 使用物化查询表通过利用 MQT 聚合不同级别的数据,可以支持分析数据的应用程序,无需设计多个基表,也无需牺牲数据的原子粒度. 分析查询的次优性能往往是使用 M

DB2数据仓库环境的物理数据库设计：样例场景

这一节介绍了一个物理http://www.aliyun.com/zixun/aggregation/14208.html">数据模型,此模型是针对一家销售大量产品的虚构企业的数据仓库样例场景而设计.该企业数据仓库存储所有这些产品的日常销售数据. 本文中的示例基于样例场景. 物理数据模型设计下图中的物理数据模型展示了样例数据仓库中使用的表和关系. 图 5. 样例数据仓库的物理数据模型维度表样例场景的物理数据模型包含以下维度表,其中存有日期.产品和店铺数据: TB_DATE_DIM TB

DB2面向OLTP环境的物理数据库设计：表

DB2 数据库将数据存储在表中.有几种类型的表可以存储永久性数据,如多维集群表.分区表和范围集群表.除了用于存储永久性数据的表之外,也有一些表可用来展示结果.汇总表.临时表. 根据数据的显示形式和事务类型,您可能会找到一个表类型,提供可以为您的环境优化存储和查询性能的特定功能. 选择合适的表类型表类型的选择取决于业务和应用程序的需求.表中存储的数据的性质和查询的性能要求.下节描述了每种表类型适合在何时使用. 基表基表可以保存永久性数据.DB2 数据库的基表有以下几种类型: 常规表有索引的常

DB2面向OLTP环境的物理数据库设计：数据库操作和维护

在数据库系统进入生产环境之后,工作重点会转向对数据库系统的日常维护.日常运营方面包括性能管理.问题诊断和维护,它们必须继续满足业务http://www.aliyun.com/zixun/aggregation/14189.html">服务水平协议. 面向 OLTP 环境的物理数据库设计应包括运营和维护任务的时间表.本节提供了此类活动的总结. 恢复策略作为 RAS 整体策略的一部分,恢复策略在满足您的 RAS 目标中发挥着重要作用.虽然事实上在许多层次上都存在冗余,但在定义恢复点目标 (R

DB2面向OLTP环境的物理数据库设计：数据类型

为一个数据库设计表,这涉及到选择一个合适的http://www.aliyun.com/zixun/aggregation/14208.html">数据模型和数据类型.数据类型是一个列属性定义,它指示了应该将什么类型的数据存储在一个表列中. 根据所存储的数据的性质小心选择正确的数据类型,这有助于最大限度地减少存储需求. 最大限度地减少数据行消耗的空间,这有助于将更多行放在一个数据页面中.如果一个数据页面中有更多的行,那么这样可以提高缓冲池命中率,减少 I/O 成本,并实现更好的查询性能.DB

DB2面向OLTP环境的物理数据库设计：查询设计

在最基本的层面,包括选择.插入.更新和删除在内的 SQL 操作是应用程序与 DB2 数据库进行交互的方式.应用程序的总体性能和体验受到该应用程序所用的 SQL 操作的影响. 设计.维护.监视和调优 SQL 查询的完整处理超出了本文的范围.然而,我们从较高层次概述了查询设计的工具和一般准则,因为查询设计和物理数据库设计彼此密切相关. 大多数物理数据库设计的特征对 SQL 语句并不明显,但为了更好地使用 DB2 特性,在编写查询时需要考虑到数据库的物理特征,如索引.例如,使用范围分区表时,选择查询即

DB2面向OLTP环境的物理数据库设计：数据和索引压缩

您可以通过使用内置在 DB2 for Linux, UNIX and Windows 数据库中的压缩功能来减少表.索引和备份映像的大小,从而减少数据所需的存储量. 表和索引通常包含重复信息.这种重复可能是单独或合并的列值,也可能是列值的共同前缀,或者是在 XML 数据中的重复模式.压缩方法可以使用短字符串或符号来代替重复的信息. 您可以使用一些压缩功能来减少存储表和索引功能所需的空间,同时也可以采用一些功能来确定压缩可以提供的节省.您还可以使用备份压缩来减少备份的大小. DB2 Version

猜你喜欢

设置小技巧让Excel 2007用得更顺手

Excel2007用起来还不是很顺手,感觉还是用以前的版本习惯,笔者今天教你设置一下,适应以前的操作习惯. 招式一:把"快速访问工具栏"请下来. 设置方法如下:点击Office按钮 ...

核心关键词选取有什么原则？

关键词对网站的重要性不言而喻,它是确立网站内容扩展的方向.而选取合适的核心关键词,就相当于选择了一条通往成功的道路.笔者在之前一篇文章中也简单阐述了seo关键词分析的重要性.那么,又该如何选取正确的关 ...

网页（HTML）中的特殊字符

网页一般来说,在HTML中,一个特殊字符有两种表达方式,一种称作数字参考,一种称作实体参考. 所谓数字参考,就是用数字来表示文档中的特殊字符,通常由前缀"",加上数值,再加上后缀 ...

windows远程桌面端口修改

window|远程桌面远程桌面服务所使用的通信协议是Microsoft定义RDP(Reliable Data Protocol)协议,RDP协议的TCP通信端口号是3389.为了安全起见,我们常需要 ...

用PHP实现自动把纯文本转换成Web页面

最近,我的一个老朋友向我打电话求助.他从事记者的职业有多年了,最近获得了重新出版他的很多早期专栏的权利.他希望把他的作品贴在Web上;但是他的专栏都是以纯文本文件的形式保存的,而且他既没有时间也不想去 ...

oracleRAC无备份情况恢复ocr和olr

今天是2014-04-01,忙碌了一天终于有时间写点东西了.前段时间写了RAc中ocr存在备份的情况下如何恢复,今天写一下在没有备份情况下如何去重建ocr和olr呢? 最大的悲剧莫过于数据库坏了备 ...

C# 判断两张图片是否一致的快速方法

这篇文章主要介绍了C# 判断两张图片是否一致的快速方法,需要的朋友可以参考下代码如下: #region 判断图片是否一致 /// <summary> /// 判断图片是否一致 / ...

Photoshop合成创意的星空装饰的猫咪

本教程主要使用Photoshop巧用素材和混合模式制作星空猫咪效果,这两个效果主要就是用图层混合模式来完成,效果非常的强大, 先看看效果图首先,打开你的Photoshop,然后打开星空素材,由于 ...

php查询ip所在地的方法

具体实现方法如下: 代码如下: <?php /** *@ date 2010.12.21 注:文件头 [第一条索引的偏移量 (4byte)] + [最后一条索引的偏移地址 ...

origin和uplay哪个好

origin和uplay对比介绍: origin介绍: origin主要针对EA的游戏,算是和steam分庭抗礼吧,看你是喜欢BF还是喜欢CS了.游戏比steam少,但是目前在steam上玩不到b ...

如何在win7电脑中共享打印机？

使用打印机服务,在电脑操作中并不少见,特别是用于办公的电脑,打印机更少不可获取的,对于如何在win7 32位系统中添加打印机服务,小编曾在之前的文章中介绍过一些,今天,小编就再来介绍关于在win7 ...

U盘启动盘进入PE后如何重装系统？

硬盘重装系统当然是最方便的,但是也是有弊端的,比如我需要对电脑重新进行分区,这是就需要PE系统下格式化硬盘.所以也就需要在PE系统中重装系统. 1 相信在看这边文章前,或许你已经进入了PE系统. 2 ...

xlueops.exe进程是什么？

xlueops.exe作用是什么? xlueops.exe是迅雷公司的BOLT界面引擎Bolt界面引擎,是由迅雷公司提供的面向下一代交互设计的解决方案.致力让UI开发有更快的开发与修改相应速度,更 ...

apache-vsftpd虚拟账户出现500 OOPS: cannot change directory

问题描述 vsftpd虚拟账户出现500 OOPS: cannot change directory 1.宿主用户如果是apache,ftp所有虚拟账户目录(权限用户是apache)不起作用,出现50 ...

简单了解WordPress开发中update_option()函数的用法_php技巧

函数介绍 update_option()用于更新数据表中存在的选项值.该函数可取代add_option,但不及add_option灵活.update_option会检查并判断选项是否已经存在.如果不存 ...

js转html实体的方法_javascript技巧

方法一: 用的浏览器内部转换器实现转换,方法是动态创建一个容器标签元素,如DIV,将要转换的字符串设置为这个元素的innerText,然后返回这个元素的innerHTML,即得到经过HTML编码转换的 ...

雷军豹变

转自微信人物周刊点击打开链接从起点金山到终点小米,从少年得志到大器晚成,从朱熹到王阳明,雷军给自己重刷了一个操作系统. 文|吴达采访|吴达张悦杜寻梦蒲劲秋编辑|张悦摄影|吕海强图片统筹 ...

黑科技：利用机器发热盗取数据

互联网没有绝对的安全,除非你不上网.所以对保密要求高的场合,如军事系统.支付网络.工控系统等往往会采用所谓的气隙系统-即本身与互联网隔绝,而且也不与上网的其他计算机连接.要想攻破这样的系统通常需要能物 ...

真正的可穿戴

一月份,拉斯维加斯变成了发现消费类电子产品最新趋势的地方.在3721.html">2014年的消费电子展(CES)上,可穿戴设备吸引了大多数人的注意力.这包括许多可穿戴在身上的小设备, ...

c语言-C语言,请问这两行代码是什么意思

问题描述 C语言,请问这两行代码是什么意思请问 else printf("^%-4c",ch+64);和 if(i%8 == 0) printf("n");这 ...

spring 静态filed-spring 中怎样给静态Filed注入值

问题描述 spring 中怎样给静态Filed注入值 public class SpringMailSender { static JavaMailSenderImpl mailSender; } 在 ...

java c# 加密与解密对照

原文 java c# 加密与解密对照最近一直烦恼,java , c# 加密的不同,然后整理了一下,留个备份的轮子: 其中在 java.c#加密转换时,最重要的是 IV 的确定,我常常用如下方法使得 ...

@微博汇

杨红旭:近些年,中国楼市中的预言者太多,但很多人从不回顾.总结.反思自己的预言.甚至有些人,已经错了很多年,仍在顽固不化的瞎预测,严重误导了舆论,伤害了购房者.既然这些人从不认错,有些人总是为了哗众取 ...

李彦宏：技术改变世界

武严美国<时代>周刊日前启动了一年一度的100位"全球最具影响力人物"评选并公布了200名候选人名单,百度总裁李彦宏就是入围者之一.这个笃行"把事情做到极致 ...

js/jquery解析json和数组格式的方法详解_javascript技巧

在解析之前,我们必须弄清楚几个概念:数组,关联数组以及json之间有哪些区别和联系点? 一.概念介绍1.数组语法: ECMAScript v3规定了数组直接量的语法,JavaScript 1.2和J ...

关于整机柜服务器几个你可能不知道的细节

摘要:传统服务器在散热子系统设计上同样采用的独享设计,单机配置独立风扇进行散热. 传统服务器在散热子系统设计上同样采用的独享设计,单机配置独立风扇进行散热.目前业界的主流散热设计方案,单台机器往往配置 ...

asp.net 中gridview能左右滑动吗？

问题描述 asp.net中gridview能做成像有的app中的那样固定前面两列,后面的列设置宽度,当所有列宽度超过gridview的宽度有,能左右滑动(前两列不动).有点像类似虎扑看球里面,查看球员 ...

Web前端开发中的MCRV模式

摘要针对前端开发中基于ajax的复杂页面开发所面临的代码规模大,难以组织和维护,代码复用性.扩展性和适应性差等问题,本文尝试以MVC思想为基础,结合Web前端开发中"内容-结构-表现-行为 ...

建材类企业的产品需要在互联网上发展

百度权重查询站长交易友情链接交换网站监控服务器监控 SEO监控随着互联网的快速发展,各种类型的中小企业都在网上建立了企业网站,企业通过网站展示自己的产品.新闻.知识等,并将这些信息放在搜索引 ...

高亮久：站长日常工作必备的十张记录单

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅目前站长行业里的基本情况是大家各自 ...

热搜