企业的信息化正如火如荼地展开着,有人说中国加入WTO后随之而来的是ERP的时代,这话一点不假,越来越多的企业在考虑实施ERP,越来越多的ERP厂商在角逐ERP市场,目前的ERP已成为企业信息化软件中最优秀的应用之一。但同时,我们也应该看到,ERP对于企业的信息化管理来说并不能提供全部的答案,我们既要看到ERP的优势,又要看到它的不足。长期以来,ERP的发展致力于面向企业的事务处理,对于企业资源的充分利用、最优调配、流程化管理等提供了好的解决方案,为企业提供了集成和规范化的管理,对于改善企业的业务流程起到不可低估的作用。但ERP这种面向事务处理的企业业务处理系统, 由于其数据库和应用软件技术长期偏向于面向事务,在信息分析领域存在着不足,与企业高层经理人员的决策分析要求存在一定的差距。
数据仓库弥补ERP的分析缺陷
面向事务处理的数据存储的是操作细节数据和即时数据,在操作当时记录准确的信息,对数据的处理速度要求高,统计查询信息一般从操作数据汇总得到;面向分析的数据一般包括历史信息、汇总值、多个抽样值等,每次操作的数据量大,分析包括几年来的数据比较分析和未来趋势分析,不但数据量惊人,其涉及的信息范围也宽广得多。对企业来说,面向事务处理和面向决策分析的信息化系统同等重要,将二者结合起来,可以管理整个企业的日常运作,通过基于数据仓库技术的决策支持系统分析企业未来的发展趋势,制定决策方案。在企业事务处理领域以ERP为代表,在决策分析领域以数据仓库为代表,在多年的发展过程中两种技术各有侧重,在企业信息化不断成熟和深入应用的基础上,两种技术应该联合起来共同为企业管理作出贡献。
因此基于ERP系统建立企业的数据仓库是未来信息技术的发展方向之一。
创建数据仓库
数据仓库构建方法同一般数据库构建方法最大的不同在于数据仓库的需求分析是从用户的决策问题入手,其目的是直接针对问题的主题,而一般数据库系统是以事务处理为出发点。一般来说,数据仓库的建立有以下几步。
1. 确定终端用户的需要,为数据仓库中存储的数据建立模型。通过数据模型,可以得到企业完整而清晰的描述信息。数据模型是面向主题建立的,同时又为多个面向应用的数据源的集成提供了统一的标准。
2. 分析数据源,完成数据仓库的设计工作。基于用户的需求,着重于某个主题,开发数据仓库中数据的物理存储结构,即设计多维数据结构的事实表和维表。
3. 确定从源数据到数据仓库的数据模型所必须的转化/综合逻辑。
这涉及到应该合并转化多少数据;是综合所有的数据文件还是综合发生变化的操作文件;转化/综合过程应该多长时间执行一次等问题。决定数据转化与更新频率是重要的商业事件,无论数据仓库的更新是采用事件驱动还是时间驱动,当某种事件发生时就需要更新数据。
4. 生成元数据。元数据描述了数据的转化与综合逻辑,描述了数据仓库的数据模型。
5. 生成物理的数据仓库数据库,并从各种源系统中获取数据装入数据仓库之中。