大数据处理仅有Hadoop是不够的

  自从三大数据库厂商甲骨文、IBM和微软在2011年不约而同地宣布支持Hadoop后,在企业级市场上,Hadoop基本上也充当着大数据的代名词。时至今日,这种状况或许应该改变了。

NoSQL日渐重要

  由于Hadoop的高调,很少有人注意到,在宣布支持Hadoop的同一年,这三大关系型数据库厂商还分别宣布支持非关系型数据库NoSQL。

  作为开源软件,NoSQL(Not only SQL,不仅仅是SQL)的诞生和发展也是为了满足Web 2.0特别是社交网络对于数据库“三高”的需求,即对数据库高并发的读写、对海量数据的高效存储与访问、对数据库的高可扩展。这些恰好是关系型数据的短板所在。

  然而,要把在互联网上如鱼得水的NoSQL,应用到企业级市场有点令用户不能完全放下心来。毕竟,互联网极少跑关键业务应用,而且哪个互联网巨 头没有中断过服务,但宕机对于互联网公司来说,更多的是灰头垢面,比较难堪而已。但对于那些把企业的身家性命都搭在IT之上的企业级用户而言,其关键业务 应用是容不得半点闪失的。

  “Oracle NoSQL Database分为免费和付费两个版本,同时提供商业支持。作为可扩展、高度可用的键值数据库,Oracle NoSQL Database通过与Oracle Event Processing集成,提供可扩展的键/值存储,从而可高效捕获实时大数据。”甲骨文公司副总裁及大中华区技术总经理喻思成表示,

  喻思成介绍说,基于近几年的发展,在真正企业级的应用层面,付费商用版更多地被客户认可。如Visa公司最近部署了NoSQL,来检测盗刷卡情 况的发生。“很多企业在发展到了Hadoop层面时,或者大数据技术带来一定价值后,业界需要一家厂商,来全面支持以上所有的架构,这也同时证明了甲骨文 在大数据层面的行业领袖地位。凭借Hadoop、NoSQL和SQL的共存与融合,大数据技术将会有更高的成熟度。”

整体解决大数据

  “结构化数据和非结构化数据彼此间是并存、包容的关系,对两者处理的整合构成了完整的大数据处理。”喻思成认为,“收购SUN后,甲骨文具备了软硬件的整合能力,进而形成集成系统,为客户提供具备大数据完整处理能力的解决方案。”

  据介绍,NoSQL在非结构化处理上,是通过与Oracle Event Processing(OEP)集成,实现高效捕获实时大数据,然后通过MapReduce的方法进行处理和查询。OEP构建的实时筛选、关联和处理事件 的应用,有助于消除、整合、关联和筛选数据,避免数据仓库杂乱不堪,从而具备实时分析大量数据流的能力。

  Hadoop出现后,甲骨文通过Hadoop企业版和Oracle NoSQL数据库,构建大数据处理平台。

  之后,甲骨文又通过融合数据库引擎(DBE)、存储、服务器和光纤,形成了Oracle Exadata处理结构化数据的数据库云平台。再通过Oracle 大数据连接器优化了 Hadoop 与 Oracle 数据库和 Exadata 之间的集成,将Hadoop系统无缝地连接到Oracle数据库系统中,实现非结构化和结构化数据的拼接,从而形成完整的大数据解决方案。

  在数据分析上,Oracle Exalytics商务智能云服务器采用业界标准硬件、商务智能软件和内存数据库技术而开发,是全球首款专门为提供高性能分析、建模、发现和规划而设计的 集成系统。它通过超高带宽的infiniband总线从Oracle Exadata上加载和读取数据。

  在决策支持阶段,信息从不同的源系统加载,存储在可动态支持变化数据的分面数据模型中。作为企业信息探索的利器,Oracle Endeca information Discover被用于对这些多维多变数据进行高级、直观的探索和关联分析。

  “凭借全面、软硬一体化、高性能和高性价比的突出特点,目前,Oracle大数据解决方案已获得众多企业用户的支持。”喻思成表示。

时间: 2024-10-25 22:47:16

大数据处理仅有Hadoop是不够的的相关文章

如何为大数据处理构建高性能Hadoop集群

越来越多的企业开始使用Hadoop来对大数据进行处理分析,但Hadoop集群的整体性能却取决于CPU.内存.网络以及存储之间的性能平衡.而在这篇文章中,我们将探讨如何为Hadoop集群构建高性能网络,这是对大数据进行处理分析的关键所在. 关于Hadoop "大数据"是松散的数据集合,海量数据的不断增长迫使企业需要通过一种新的方式去管理.大数据是结构化或非结构化的多种数据类型的大集合.而Hadoop则是Apache发布的软件架构,用以分析PB级的非结构化数据,并将其转换成其他应用程序可管

怎么为大数据处理构建高性能Hadoop集群

越来越多的企业开始使用Hadoop来对大数据进行处理分析,但Hadoop集群的整体性能却取决于CPU.内存.网络以及存储之间的性能平衡.而在这篇文章中,我们将探讨如何为Hadoop集群构建高性能网络,这是对大数据进行处理分析的关键所在. 关于Hadoop "大数据"是松散的数据集合,海量数据的不断增长迫使企业需要通过一种新的方式去管理.大数据是结构化或非结构化的多种数据类型的大集合.而 Hadoop则是Apache发布的软件架构,用以分析PB级的非结构化数据,并将其转换成其他应用程序可

大数据处理利器:Hadoop具有五大优势

现在,如果你没有听说过Hadoop,那么你一定落伍了.作为一个全新的开源项目,Hadoop提供了一中新的方式用来存储和处理器数据.大型的http://www.aliyun.com/zixun/aggregation/3518.html">互联网公司,如谷歌.Facebook都使用Hadoop来存储和管理它们庞大的数据集.Hadoop也通过在这些领域的应用证明了其五大优势: 高可扩展性 Hadoop是一个高度可扩展的存储平台,因为他可以存储和分发横跨数百个并行操作的廉价的服务器数据集群.不同

如何低成本、高效率搭建Hadoop/Spark大数据处理平台

随着人们逐渐认识到 "大数据"的价值,互联网.电商到金融业.政企等各行业开始处理海量数据.如何低成本.敏捷高效地搭建大数据处理平台,成为影响大数据创新效率的关键. 为了让用户以最简便地方式享用阿里云全球资源,在云端构建敏捷弹性.高可靠和高性价比的大数据平台,近日,阿里云在成都云栖大会上发布了一款Hadoop/Spark场景专用的ECS存储优化型实例D1规格族,单实例提供最高56核CPU,224GB内存,168TB本地盘容量,5GB/S总吞吐,PPS达120万+.这对Hadoop/Spa

为什么hadoop对你大数据处理的意义重大

Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取.变形和加载(ETL)方面上的天然优势.Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储,对例如像ETL这样的批处理操作相对合适,因为类似这样操作的批处理结果可以直接走向存储.Hadoop的MapReduce功能实现了将单个任务打碎,并将碎片任务发送(Map)到多个节点上,之后再以单个数据集的形式加载(Reduce)到数据仓库里. 但是对于Hadoop,特别是Hadoop分布式文件系统(HDFS)来说,大数据处理至少需要三

零基础搭建Hadoop大数据处理-初识

在互联网的世界中数据都是以TB.PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数据分析,学习,如双十一淘宝的交易量的实时展示. 大数据什么叫大?4个特征: 体量化 Volume,就是量大. 多样化 Variety,可能是结构型的数据,也可能是非结构行的文本,图片,视频,语音,日志,邮件等 快速化 Velocity,产生快,处理也需要快. 价值密度低 Value,数据量大,但单个数据没什么意义,需要宏观的统计体现其隐藏的价

0基础搭建Hadoop大数据处理-初识

在互联网的世界中数据都是以TB.PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数据分析,学习,如双十一淘宝的交易量的实时展示. 大数据什么叫大?4个特征: 体量化 Volume,就是量大. 多样化 Variety,可能是结构型的数据,也可能是非结构行的文本,图片,视频,语音,日志,邮件等 快速化 Velocity,产生快,处理也需要快. 价值密度低 Value,数据量大,但单个数据没什么意义,需要宏观的统计体现其隐藏的价

大数据处理——Hadoop解析(一)

概述 这个时代被称之为大数据时代,各行各业生产的数据量呈现爆发性增长,并且基于这些爆发性增长的数据做深层次的数据挖掘.分析.处理.因此,我们可以很容易的感觉到,在这样一个大数据的时代,我们很多做事情的方法正在发生了改变.例如,基于大数据分析可以做疾病预测控制;基于大数据分析可以做交通流量预测控制;基于大数据分析可以做大型系统故障诊断预测;基于大数据分析可以做客户消费推荐.可以说,大数据时代可以解决很多以前非常难以解决的问题.可以这样讲,在这样一个时代,大数据可以让我们的生活变得更加美好. 突如其

大数据处理——Hadoop解析(二):MapReduce

大http://www.aliyun.com/zixun/aggregation/14345.html">数据处理模型MapReduce (接<大数据处理--Hadoop解析(一)>) 大数据时代生产的数据最终是需要进行计算的,存储的目的也就是为了做大数据分析.通过计算.分析.挖掘数据背后的东西,才是大数据的意义所在.Hadoop不仅提供了数据存储的分布式文件系统,更重要的是提供了分布式编程模型和分布式计算系统,通过该编程模型和分布式计算架构可以解决大数据时代所面临的数据处理问