这份白皮书提供了一个关于分析服务(Analysis Services)设计和在Project REAL中的最佳实践的技术讨论。它深入的讨论了每一类对象的细节,例如数据源、数据源视图、维度、层次、属性、度量组、分割表等等。并指出如何在关系型数据库分割表的基础上创建一个能自动创建度量组分割表的SQL Server 2005集成服务程序包。
关于Project Real
Project Real是微软为创建商业智能应用程序提供最佳实践而所做的努力。这些程序都是在Microsoft SQL Server 2005基础上,在真实的客户背景上构建实施的。这就意味着真实客户数据是可以代入系统内部,并且可以应对客户在开发过程中将会遇到的同样的问题。这些问题包括:
◆模式设计- 关系型模式和分析服务型模式
◆数据抽取、数据转换、数据加载(ETL)过程的实现
◆客户端系统的设计与开发,包括数据报表和交互式的分析
◆产品系统的分级
◆运营系统的管理和维护,包括数据资料的不断更新
通过在这种真实部署环境中的工作经历,我们获得了如何使用这些工具的完整理解。我们的目标是全方位的关注大公司在他们自己实际部署过程中所遇到的所有问题。
这份白皮书提供了一个关于分析服务(Analysis Services)设计和在Project REAL中的最佳实践的技术讨论。我们深入的讨论了每一类对象的细节,例如数据源、数据源视图、维度、层次、属性、度量组、分割表等等。并指出了我们在前进过程中遇到的重要问题。
若要查看Rroject REAL的概述信息,可查看 Project REAL: Technical Overview 白皮书。有相当大一部分的资料、工具、和例子,都是在Project REAL的生命周期中产生的。为了找到最新的信息,可以到Project REAL Web site这个连接来察看相关的信息(http://www.microsoft.com/sql/bi/ProjectReal/)。
备注:这篇文章仅仅是一个草案,它包括了一些建设性的实践方法,这些方法都是基于我们早先在SQL Server 2005的Community Technology Preview (CTP)工作中获得的经验。到产品发布之前,白皮书中所描述的都是准确的。文档中描述的产品功能性可能会有所变化。在将来,可能会提供更好的实践方案。SQL Server 2005是在我们对这些好的练习例程中用的开发工具。
绪论
这篇文章回顾了关于Project REAL分析服务的技术性设计,并且讨论了各种影响设计的问题。我们假定读者已经比较熟悉分析服务设计,并且实践过Project REAL所采用的模式。例如,我们假定读者已经知道多对多厂商维度的存在。我们的讨论主要关注为什么它会存在(以及我们在对设计进行定案之前所考虑的可供选择的办法)。
在本文中,我们检验了在多维度设计中应用到的各种类型的分析服务对象。从物理模式对象入手,例如数据源和数据源视图。接下来我们讨论在逻辑对象,例如维度,用户自定义的层次关系、属性层次、和度量组等等。接下来深入到度量组特征,例如分割、集合(aggregate)设计、以及前摄缓存(proactive caching)。这部分内容最后讨论了其它的逻辑设计,包括计算、关键性能指示器(KPIs)、活动、透视、定制程序集、用户自定义函数(UDFs)和MDX脚本等等。
最后一个章节中,我们详细讨论了在分析服务模式设计阶段,两种可选的、合理的设计方案。我们提供了目标,也是我们考虑要做的事情,也正是我们所实现的。
本篇以介绍服务端设置来结束,主要讨论了我们为什么要改变这些配置。
Project REAL设计强烈依赖于分割(partitioning),在所有的度量组中,定义了几百个这样的分割表,在附录A中,我们将展示我们是如何解决我们在各种数据库中创建和管理分割表带来的管理问题。