过去的这几年里,随着交易型IT向交互型IT过渡,企业数据开始呈现爆炸性的增长。而由于社交媒体的兴起、数字传感器的大量应用和移动设备的大面积普及等因素直接导致了各类海量大数据的迅速产生。这一类多结构化的数据市场价值并不高,但是其中庞大的数据量却蕴含着一笔隐藏的巨大财富。由此可见,应该如何对大数据进行高效的治理已经越来越成为业界关注的话题了。
据2011年Unisphere Research的调查显示,未来三年企业非结构化的大数据还将继续快速增长,其中隐藏的客户行为和业务运营等重要信息,也将对企业的未来业务发展产生重大影响。无独有偶,麦肯锡全球研究机构在2011年5月发布的《大数据:创新、竞争和生产力的下一个前沿领域》 (Big Data–The next frontier for innovation, competition and productivity)中也表示,充分利用大数据可帮助全球个人定位服务提供商增加1000亿美元收入、帮助欧洲公共部门的管理每年提升2500亿美元产值、帮助美国医疗保健行业每年提升3000亿美元产值,并可帮助美国零售业获得60%以上的净利润增长。 因此可见,充分使用大数据和挖掘大数据商业价值将为企业带来强大的竞争力,但目前在企业数据仓库和企业智能应用中,这些大数据并没有得到充分有效地利用,反而给企业带来了巨大的挑战。例如,如何获取实时非结构化数据流;如何组织大数据并集成到数据中心;使用哪些技能和工具来分析大数据并提供实时的共享,从而进行更好更全面的业务决策等。
甲骨文公司副总裁及大中华区技术总经理喻思成
随着Oracle大数据机的推出,甲骨文公司成为了业界首个以全面、软硬件集成的产品满足企业关键大数据需求的公司。它可帮助客户进一步提高效率、简化管理并洞察数据的内在本质,从而最大限度地挖掘数据的商业价值。在Oracle大数据与极致分析媒体交流会上,甲骨文公司副总裁兼大中华区技术总经理喻思成表示:“Oracle大数据机与Oracle Exalogic中间件云服务器、Oracle Exadata数据库云服务器以及Oracle Exalytics商务智能云服务器一起组成了甲骨文最广泛、高度集成化系统产品组合,为企业提供了一个端到端的大数据解决方案,可满足企业对大数据治理的所有需求。” 针对大数据需求而专门设计的集成化系统Oracle大数据机是一款集成设计的系统,旨在简化大数据项目的实施与管理。该数据机采用18台Oracle Sun服务器的全机架式配置,总共拥有864 GB主内存、216核CPU、648 TB原始磁盘存储空间,并在节点和其他Oracle集成化系统之间采用40 Gb/s的InfiniBand网络连接以及10 Gb/s的以太网数据中心连接,可通过InfiniBand网络连接多个机架进行横向升级扩展,使其能够获取、组织和分析超级海量的数据。 Oracle大数据机集成了Cloudera公司的Distribution Including Apache Hadoop(CDH)和Cloudera Manager软件,还能够快速便捷的与Oracle数据库11g、Oracle Exadata数据库云服务器和Oracle Exalytics商务智能云服务器集成,并通过提供企业级的应用性能、可用性、可支持性和安全性,对所有数据类型提供极高的数据分析能力。 领先技术,全面应对大数据应用挑战Oracle NoSQL数据库:为了快速、实时地捕获所有大数据,企业需要处理大数据量、低密度的信息,需要频繁更改应用程序,而且还必须横向扩展以满足急剧扩张的部署计划。作为一款分布式、高度可扩展并能够提供关键价值的数据库,Oracle NoSQL数据库专门为管理海量数据而设计,可以帮助企业存取非结构化数据,并可横向扩展至数百个高可用性节点。同时,该产品能够提供可预测的吞吐量和延迟时间,而且更加容易安装、配置和管理,支持广泛的工作负载。 分析沙盒:目前,企业所面临的挑战包括拥有现有Oracle数据仓库、对大数据进行分析、不允许对数据仓库SLA产生负面影响等。通过分析沙盒,企业可获得分析工作区,控制对资源和数据的访问,而且完全不影响生产系统。它还可以将沙盒功能与安全、可伸缩、易于安装的Oracle企业管理器进行集成,从而帮助企业高效利用服务器、通过付费方式进行自我管理。 针对Hadoop 架构的系统:大数据组织和提取面临的挑战还包括将大数据转换为易于分析的内容、避免编写大量 Hadoop代码以及数据快速载入 Oracle 数据仓库等,Oracle大数据机中的开源Apache Hadoop、Oracle数据集成Hadoop应用适配器、Oracle Hadoop装载器、Oracle Direct Connector,可以帮助企业充分应对这些挑战。 Oracle数据集成Hadoop应用适配器通过Oracle数据集成器易于使用的界面,自动生成Hadoop MapReduce代码,简化了Hadoop应用与Oracle数据库的数据集成。Oracle Hadoop装载器使客户能够利用Hadoop MapReduce处理功能建立优化的数据集,从而在Oracle数据库11g中进行高效率加载和分析。Oracle Direct Connector可通过SQL语言从Oracle数据库直接访问Hadoop分布式文件系统上的数据。 R语言:在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle数据库11g的集成,分析师和统计人员可以运行现有的R应用,并利用R客户端直接处理存储在Oracle数据库11g中的数据,从而极大地提高可扩展性、性能和安全性。Oracle数据库11g与R开源统计环境的整合为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。 加快决策,最大限度地挖掘大数据的商业价值通过Oracle大数据机快速获得、组织大数据之后,企业还需要根据对大数据全面实时的分析做出最恰当的业务决策。作为业界首款集成设计的内存硬件与软件系统,Oracle Exalytics商务智能云服务器能够以前所未有的速度运行数据分析应用,为客户提供实时的、快速的可视分析。Oracle Exalytics实现了新型分析应用,可用于异构IT环境,并能存取和分析来自任何Oracle或非Oracle的关系型、OLAP或非结构化数据源的数据。 凭借在软硬件双方面的创新,Oracle Exalytics商务智能云服务器实现极致数据分析性能,其亚秒级性能可以支持快速的数据分析,还能提供建模、规划、预测和预测性分析,同时使企业规划应用能够以更快的、更准确的规划周期在整个企业内扩展,可有效帮助企业加快业务决策,最大限度地挖掘大数据的商业价值。 喻思成总结道:“通过整体设计、测试、部署、管理和升级支持,Oracle大数据产品,可横跨IT架构的所有层面与其他产品进行创新集成,进一步帮助客户获得卓越的数据获取、组织和分析性能,同时为其提供更好的业务决策,实现更高的可靠性、可扩展性、安全性和可管理性。Oracle大数据解决方案是未来企业构建云计算基础架构及应对大数据挑战的理想选择。”