IBM InfoSphere Warehouse(简称 ISW)是一套集成的软件包,提供了一整套的工具(">design studio,Cubing service 等), 满足企业的 DB2 数据库管理、数据处理转换、多维建模等需求,提供了完善的数据仓库生命周期管理的解决方案。随着国内数据仓库系统的不断发展,ISW 在企业中的应用越来越广泛。
数据仓库和 BI 系统会随着业务量和企业规模的变化,面临各种压力和挑战。对于系统的调优就成为数据仓库系统生命周期中的重要部分。本文结合具体的业务场景和实践经验,介绍了通过 ISW 来进行数据仓库系统和 OLAP 模型调优的主要方法。
电力系统业务分析
数据仓库的开发和模型的设计,往往和具体的业务背景紧密结合。在电力行业数据仓库的建设过程中,常要考虑到各个主题要满足的业务特点,才能设计出更好的业务模型,并满足用户的分析需求。
电力系统业务特点
在本次开发过程中,我们以发电单位成本分析主题为例。在这个主题中,主要分析的是发电成本的构成、各个成本之间的相互影响。主要具有以下特点:
成本之间相互关联。例如固定成本就由水费、职工薪酬、材料费、检修费、折旧费和其他费用组成。因此固定成本就由这些基本费用汇聚的来,某个费用的异常,往往会导致汇聚费用的异常。这种逻辑往往是用户分析的业务重点,用户可以通过这种指标间的关联,直观的看到业务情况的好坏,并迅速定位业务异常点。在电力行业,这种成本之间的组成关系直接影响后面单位成本的计算。下图是各成本之间的关系图。
图 1. 成本之间的关联
大量的单位成本。在电力行业中的成本控制中,一类很重要的分析需要通过单位成本来完成。用户对成本的控制好坏,在成本总量上往往不够明显,单位成本值能够更好的衡量企业的成本控制效果。
同比、环比和平均值的计算。为了能够宏观上对业务情况进行分析,需要同时分析各个指标的同比值、环比值和平均值。在多维分析中,同比值和环比值需要在同一个维度中选择不同的时间来进行比较,平均值则需要通过一定的运算得到,因此相对来说更复杂,而且在上下钻取的过程中不能简单的进行汇聚得来。