Ventana:Hadoop与传统关系数据库可并存

企业迅速增长的结构化和">非结构化数据的管理需求是推动企业使用Apache Hadoop软件的重要因素。

但是Hadoop还不能取代现有的所有技术,根据Ventana上个月底公布的一项研究报告表明,现在越来越多的状况是Hadoop与传统的关系数据库(RDBMS)一起工作。

Hadoop的设计初衷是帮助企业管理和处理PB级的数据。该技术的吸引力在于它能够将海量数据分解成较小的数据块,以便利用分布式的硬件集群更快处理海量数据。

包括Facebook、亚马逊、eBay和雅虎都在使用Hadoop分析PB级非结构化数据,而这正是传统的关系数据库渴望而不可及的。

在Ventana公司对超过160家公司的调查表明,越来越多的企业已经开始使用Hadoop。调查发现,这些公司大部分使用Hadoop来收集和分析海量的非结构化数据并生成包括日志、事件数据、搜索引擎结果、社交网站内容等相关信息。

调查还发现有三分之二的企业在没有使用Hadoop之前,企业没有对数据进行高级分析和类型分析。但传统关系数据库仍然有存在的理由,Hadoop技术对于分析交易数据、客户信息和通话记录等方面略显不足。而这正是传统关系数据库工具的优势所在,如传统的结构化数据。

最后该研究报告也指出了Hadoop所面临的挑战,如安全性、集群和相关技术人员的匮乏等问题。

(责任编辑:吕光)

时间: 2024-09-07 18:25:53

Ventana:Hadoop与传统关系数据库可并存的相关文章

浅析传统关系数据库面临大数据的挑战

文章讲的是浅析传统关系数据库面临大数据的挑战,什么是大数据?多大的数据量可以称为大数据?不同的年代有不同的答案.20世纪80年代早期,大数据指的是数据量大到需要存储在数千万个磁带中的数据;20世纪90年代,大数据指的是数据量超过单个台式机存储能力的数据;如今,大数据指的是那些关系型数据库难以存储.单机数据分析统计工具无法处理的数据,这些数据需要存放在拥有数千万台机器的大规模并行系统上.大数据出现在日常生活和科学研究的各个领域,数据的持续增长使人们不得不重新考虑数据的存储和管理. 随着社会计算的兴

互联通张鹏:云计算将取代传统IDC 短期并存

核心提示:版权价格跟资本市场的竞争发展趋势是有关系的.长远来看,大家能够运营才行,短期泡沫是资本市场带来的,但是中远期肯定是能够双赢的. 第六届中国IDC产业年度大典以"构建云计算数据中心暨云应用创新"为主题,全面解读云数据中心与云应用发展趋势,汇聚数百位产业链精英.行业领军人物和国内外知名专家共襄盛举.大会将于2012年1月10-11日在北京国家会议中心隆重举办. 近日,互联通副总裁张鹏做客IDC大典新闻会客厅,与记者进行深入交流. 对于云时代数据中心的看法,互联通副总裁张鹏表示:&

Hadoop 生态系统

1.概述 最近收到一些同学和朋友的邮件,说能不能整理一下 Hadoop 生态圈的相关内容,然后分享一些,我觉得这是一个不错的提议,于是,花了一些业余时间整理了 Hadoop 的生态系统,并将其进行了归纳总结,进而将其以表格的形式进行了罗列.涉及的内容有以下几点: 分布式文件系统 分布式编程模型 NoSQL 数据库 SQL-On-Hadoop 数据采集 编程服务中间件 调度系统 系统部署 数据可视化 2.内容 2.1 分布式文件系统 2.1.1 Apache HDFS 在分布式文件系统当中,首先为

Spark修炼之道(进阶篇)——Spark入门到精通:第二节 Hadoop、Spark生成圈简介

作者:周志湖 网名:摇摆少年梦 微信号:zhouzhihubeyond 本节主要内容 Hadoop生态圈 Spark生态圈 1. Hadoop生态圈 原文地址:http://os.51cto.com/art/201508/487936_all.htm#rd?sukey=a805c0b270074a064cd1c1c9a73c1dcc953928bfe4a56cc94d6f67793fa02b3b983df6df92dc418df5a1083411b53325 下图给出了Hadoop生态圈中的重要

大数据框架Hadoop主要模块介绍

本文涉及到的所有模块,都是属于Apache组织,不包括其他第三方的模块. 核心模块: Hadoop Common: 包括Hadoop常用的工具类,由原来的Hadoop core部分更名而来.主要包括系统配置工具Configuration.远程过程调用RPC.序列化机制和Hadoop抽象文件系统FileSystem等.它们为在通用硬件上搭建云计算环境提供基本的服务,并为运行在该平台上的软件开发提供了所需的API. Hadoop Distributed File System (HDFS): 分布式

Hadoop和大数据:60款顶级开源工具

虽然此文尽力做到全面,但难免遗漏,欢迎大家补充,点击文末右下角"写评论",分享你的观点. 说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,"100%的大公司"会采用Hadoop.Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长:到2020年,市场产值会超过10亿美元.IBM更是非

福布斯:带你了解Hadoop的前世今生

文章讲的是福布斯:带你了解Hadoop的前世今生,如今Apache Hadoop已成为大数据行业发展背后的驱动力.Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper.Flume). Hadoop带来了廉价的处理大数据(大数据的数据容量通常是10-100GB或更多,同时数据种类多种多样,包括结构化.非结构化等)的能力.但这与之前有什么不同? 现今企业数据仓库和关系型数据库擅长处理结构化数据,并且可以存储大量的数据.但成本上有些昂贵.这

详解Hadoop系统:Hadoop架构、各部分功能及对大数据的意义

如今Apache Hadoop已成为大数据行业发展背后的驱动力.Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper.Flume). Hadoop带来了廉价的处理大数据(大数据的数据容量通常是10-100GB或更多,同时数据种类多种多样,包括结构化.非结构化等)的能力.但这与之前有什么不同? 现今企业数据仓库和关系型数据库擅长处理结构化数据,并且可以存储大量的数据.但成本上有些昂贵.这种对数据的要求限制了可处理的数据种类,同时这种惯性

CIO 指南:如何在 SAP® 软件架构中使用 Hadoop

Gartner指出,2013年,大数据是影响信息架构的最重要的技术趋势之一."信息的数量.生成速度和种类都在不断增加,而且那些未被治理和未得到充分利用的信息中蕴藏着巨大的价值,同时也隐藏着潜在的风险.在这些因素的驱动下,信息管理技术与实践领域的重大创新层出不穷." SAPHANA能够帮助企业解决一个非常重要的大数据问题,那就是快速访问和实时分析极其庞大的数据集.这样,企业的管理人员和高管就能以思维般的速度了解自身的业务状况,充分挖掘信息的价值.另外,SAP还发布了SAPReal-Tim