九大数据仓库方案特点比较

比较|数据

九大数据仓库方案特点比较

    中国电子设备系统工程研究所 王建新 刘东波 

    IBM、Oracle、Sybase、CA、NCR、Informix、Microsoft、和SAS等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案,BO和Brio等专业软件公司也在前端在线分析处理工具市场上占有一席之地。下面针对这些数据仓库解决方案的性能和特点做分析和比较。

    1.IBMIBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse(VW)、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。Essbase/DB2 OLAP Server支持“维”的定义和数据装载。Essbase/DB2 OLAP Server不是ROLAP(Relational OLAP)服务器,而是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2 UDB数据库中。
严格说来,IBM自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。例如,它的前端数据展现工具可以是Business Objects的BO、Lotus的Approach、Cognos的Impromptu或IBM的Query Management Facility;多维分析工具支持Arbor Software的Essbase和IBM(与Arbor联合开发)的DB2 OLAP服务器;统计分析工具采用SAS系统。

    2.OracleOracle数据仓库解决方案主要包括Oracle Express和Oracle Discoverer两个部分。Oracle Express由四个工具组成:Oracle Express Server是一个MOLAP (多维OLAP)服务器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;Oracle Express Web Agent通过CGI或Web插件支持基于Web的动态多维数据展现;Oracle Express Objects前端数据分析工具(目前仅支持Windows平台)提供了图形化建模和假设分析功能,支持可视化开发和事件驱动编程技术,提供了兼容Visual Basic语法的语言,支持OCX和OLE;Oracle Express Analyzer是通用的、面向最终用户的报告和分析工具(目前仅支持Windows平台)。Oracle Discoverer即席查询工具是专门为最终用户设计的,分为最终用户版和管理员版。
在Oracle数据仓库解决方案实施过程中,通常把汇总数据存储在Express多维数据库中,而将详细数据存储在Oracle关系数据库中,当需要详细数据时,Express Server通过构造SQL语句访问关系数据库。但目前的Express还不够灵活,数据仓库设计的一个变化往往导致数据库的重构。另外,目前的Oracle 8i和Express 之间集成度还不够高,Oracle 8i和Express之间需要复制元数据,如果Oracle Discoverer(或BO)需要访问汇总数据,则需要将汇总数据同时存放在Oracle和Express中,系统维护比较困难。值得注意的是,刚刚问世的Oracle 9i把OLAP和数据挖掘作为重要特点。

    3.SybaseSybase提供的数据仓库解决方案称为Warehouse Studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。其中,Warehouse Architect是PowerDesigner中的一个设计模块,它支持星形模型、雪花模型和ER模型;数据抽取与转换工具包括PowerStage、Replication Server、Carleton PASSPORT,PowerStage是Sybase提供的可视化数据迁移工具。

Adaptive Server Enterprise是Sybase企业级关系数据库,Adaptive Server IQ是Sybase公司专为数据仓库设计的关系数据库,它为高性能决策支持系统和数据仓库的建立作了优化处理,Sybase IQ支持各种流行的前端展现工具(如Cognos Impromptu、Business Objects、Brio Query等);数据分析与展现工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等,PowerDimensions是图形化的OLAP分析工具,它支持SMP和多维缓存技术,能够集成异构的关系型数据仓库和分布式数据集市,从而形成单一的、新型的多维模式;数据仓库的维护与管理工具包括Warehouse Control Center、Sybase Central、Distribution Director,其中Warehouse Control Center是为数据仓库开发人员提供的元数据管理工具。

Sybase提供了完整的数据仓库解决方案Quick Start DataMart,具有良好的性能,并支持第三方数据展现工具。从Quick Start DataMart的名称不难看出,它尤其适合于数据集市应用。另外,Sybase可以提供面向电信、金融、保险、医疗保健这4个行业的客户关系管理(CRM)产品,在这4个产品中,有80%的功能是共性的,有20%的功能需要Sybase与合作伙伴针对不同需求共同开发。

    4.InformixInformix于1998和1999年相继收购了国际上享有盛誉的数据仓库供应商Red Brick System和数据管理软件供应商Ardent,并提供了完整、集成的数据仓库解决方案。该解决方案还包括一个“快速启动”咨询服务,能够帮助用户快速完成数据仓库或数据集市的开发。Informix产品能够集成Microsoft IIS或Netscape Enterprise/FastTrack服务器,从而支持基于Web的数据仓库应用。
    Informix没有提供自己的报表和数据挖掘工具,但他们与Brio和SAS公司建立了战略联盟,并推出了“Informix商务智能联盟计划”。该计划以Informix为主,结合Brio的前端数据分析和报表功能,以及SAS的数据挖掘功能,形成了一个“BI中心”打包方案。
   (今年4月Informix Software已被IBM公司收购,此举将给IBM公司数据库及数据仓库产品,从技术和市场占有率上带来极大的提升。)

    5.CACA于1999年收购了Platinum Technology公司后,得到了完整的数据仓库解决方案,包括:Erwin数据仓库设计工具、InfoPump数据转换与抽取工具、InfoBeacon ROLAP服务器、Forest&Trees前端数据展现工具、Provision系统监视与作业调度工具和DecisionBase元数据管理工具等。
    与Informix解决方案相似,CA解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、基于关系数据库的在线分析服务器、系统监视与作业调度、前端数据展现等功能,同时还支持Web应用。不同之处是Informix提供了专门为数据仓库设计的高性能目标数据库(Red Birck),而CA解决方案则提供ODBC接口,并将数据存储在第三方关系数据库(如Oracle、Sybase、SQL Server、Informix和IBM DB2等)中,其性能要打一些折扣,但开放性要好些。另外,CA的OLAP服务器目前只能与Microsoft的IIS Web服务器集成。

    6.NCR TeradataNCR Teradata是高端数据仓库市场最有力的竞争者,主要运行在NCR WorldMark SMP硬件的Unix操作系统平台上。1998年,该公司也提供了基于Windows NT的Teradata,试图开拓数据集市(Data Mart)市场。总的来看,NCR的产品性能很好,Teradata数据仓库在100GB、300GB、1TB和3TB级的TPCD指标测试中均创世界纪录。但是,NCR产品的价格相对较高,中小企业用户难以接受。

    7.MicrosoftMicrosoft将OLAP功能集成到Microsoft SQL Server 7.0中,提供可扩充的基于COM的OLAP接口。它通过一系列服务程序支持数据仓库应用。数据传输服务DTS(Data Transformation Services)提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与Microsoft Repository集成,共享有关的元数据;Microsoft Repository存储包括元数据在内的所有中间数据;SQL Server OLAP Services支持在线分析处理;PivotTable Services提供客户端OLAP数据访问功能,通过这一服务,开发人员可以用VB或其他语言开发用户前端数据展现程序,PivotTable Services还允许在本地客户机上存储数据;MMC(Microsoft Management Console)提供日程安排、存储管理、性能监测、报警和通知的核心管理服务;Microsoft Office 2000套件中的Access和Excel可以作为数据展现工具,另外SQL Server还支持第三方数据展现工具。

    8.SASSAS公司在20世纪70年代以“统计分析”和“线性数学模型”而享誉业界,90年代以后,SAS公司也加入了数据仓库市场的竞争,并提供了特点鲜明的数据仓库解决方案,包括30多个专用模块。其中,SAS/WA(Warehouse Administrator)是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现等;SAS/MDDB是SAS用于在线分析的多维数据库服务器;SAS/AF提供了屏幕设计功能和用于开发的SCL(屏幕控制语言);SAS/ITSV(IT Service Vision)是IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等。SAS系统的优点是功能强、性能高、特长突出,缺点是系统比较复杂。

    9.Business ObjectsBusiness Objects(BO)是集查询、报表和OLAP技术为一身的智能决策支持系统。它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种数据库,同时它还支持基于Web浏览器的查询、报表和分析决策。虽然BO在不断增加新的功能,但从严格意义上说,BO只能算是一个前端工具。也许正因为如此,几乎所有的数据仓库解决方案都把BO作为可选的数据展现工具。
    虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止,国内基本上没有成熟的数据仓库解决方案。

 

时间: 2024-12-01 16:59:54

九大数据仓库方案特点比较的相关文章

九大数据仓库开发软件软件功能比较

请问市面上可供选择的数据仓库解决方案软件有哪些?有什么差别吗?能对它们的性能和特点进行分析和比较吗? IBM.Oracle.Sybase.CA.NCR.Informix.Microsoft.和SAS等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案,BO和Brio等专业软件公司也在前端在线分析处理工具市场上占有一席之地.下面针对这些数据仓库解决方案的性能和特点做分析和比较. IBM IBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Visual Wareh

阿里淘咖啡火了 全球九大无人便利店物联网技术方案详解

最近阿里展示了无人售货的场景,让人大开眼界,自去年电商巨头亚马逊推出Amazon Go无人商店,在零售行业掀起了一股技术革新的热潮,在今年6月初,缤果盒子首家无人智能便利店在上海开业,一时之间,无人商店如雨后春笋般不断涌现.下面小编就国内外九大无人商店方案进行了整理,并对其所采用的物联网技术进行简单解读. 亚马逊Amazon Go 亚马逊推出的Amazon Go,除了顾客无需结账,即买即走,免去了顾客排队的苦恼外,Amazon Go跟普通的零售店几乎没有区别,其商品摆设与普通零售店亦基本一致,主

想把我唱给你听:体验“戴尔技术”九大方案亮相

戴尔上海解决方案中心是遍布全球各大城市的一系列技术中心.您可以在配有最先进的实验室和解决方案专家团队的专用实际操作环境中,体验戴尔的解决方案并使用戴尔技术.   上海解决方案中心一直致力于推陈出新,为大家呈现戴尔最新的解决方案,从利用物联网网管丰富接口的户外气象站系统."+VMware NSX"的开放网络解决方案."+vVNX"的灾难备份解决方案到VGPU桌面虚拟化解决方案--戴尔端到端家族一口气新添九大利器,大量新技术拼图齐亮相.     下面,就请大家跟随小编的

红帽2015年九大技术预测

红帽高管及业内专家们提出了他们对2015年IT行业的看法,具体涉及如下九大方面:大数据.技术引领业务.云计算.容器.开发人员和应用开发.物联网.移动.安全.软件定义的数据中心. 1. 大数据 企业数据科学家的地位越来越高 Greg Kleiman,红帽存储与大数据部门战略总监 大数据和数据之间的界限将日益模糊.CIO将会把传统数据源(如数据仓库).商业智能分析以及数据集与新的"大数据"技术如Hadoop进行整合.通过对大数据的分析和掌控,将会产生新的颠覆性业务和市场细分.此外,基于开源

DB2 9的九大新特性_DB2

正在看的db2教程是:DB2 9的九大新特性. 这款新型数据服务器率先实现了可扩展标记语言(XML)和关系数据间无缝交互,而无需考虑数据的格式.平台或位置.来自8个国家的750多名软件开发人员为"Viper"的问世做出了努力,他们进行了精心设计和调试,力求将其打造成SOA环境下的首选信息引擎.? DB2 9取得了十项重大进步,包括已获得专利的"pureXML"技术.突破性的"Venom"存储压缩以及增强的自动化数据管理能力等. 1.新的XML特性

Docker实践者不能错过2014 Container技术大会的九大理由!

摘要:2014年10月18日,CSDN&<程序员>主办的2014 Container技术大会将在北京召开,目前议题已经基本确定.为帮助更多同学进一步了解本次大会,主办方总结了技术团队不应错过2014 Container技术大会的九大理由. Container技术已经出现了十几年,但直到2013年Docker项目的出现,才逐渐火热起来,广为人知.如今,Docker拥有超过500个代码贡献者,20个核心Maintainer,超过8000个创建在GitHub上的Docker相关项目,30多个

对象存储九大关键特征

 对象存储是一个相对较新并且在持续稳步增长的市场部分.对于新手而言,对象存储用于保存大量非结构化数据,其中每个"对象"实际上是一个没有特定格式的文件(也称二进制文件).实际上,从小的对象(人类可读取文件)到媒体(音频和视频)或其它行业特定格式(石油&天然气,医学成像等),对象存储可以保存任何类型的数据. 与传统存储相比,采用对象存储的好处良多.基于块的系统(例如光纤通道和iSCSI)无法很好地向外扩展,并且没有真正的了解所存储的数据.它们是以低延迟和高粒度提供内容的"

联通专家详解WoCloud前世今生:已实现九大能力提供

以云计算PaaS替代原有的平台,可充分实现云技术以下特性:开放.简单.一致架构.多层次的多租户.多类型的数据存储.多类型的中间件.敏捷开发.统一监控及计量. 基于此,近年来,以云计算PaaS为服务的综合平台在互联网公司得到了广泛的应用,Amazon.eBay.Google.淘宝都纷纷利用云计算技术升级改造原有的平台,以便更好实现商业价值. 与此同时,运营商也充分认识到开发以云计算PaaS为服务的综合平台的必要性,作为三大运营商,中国联通率先推出云计算平台WoCloud 1.0版本,并于2012年

指引大数据未来方向的九大真理

文章讲的是指引大数据未来方向的九大真理,笔者总会时不时沉浸在对大数据原则的思索当中,这里讨论的并不是Hadoop与关系数据库或者Mahout与Weka的对抗,而是更具根源性的智慧--将数据作为"新时代货币"的思维方式.不过也许将数据描述成"新时代的石油"更加贴近,或者,我们还需要一种新的比喻更全面地诠释数据的价值与内涵. 比喻本身既非事实也难以证明,但它们确实能够创造出指引我们找到真理的话题.比喻让复杂的概念变得更易理解,正如本文中所引用的经典语录--它们有助于解释