企业迅速增长的结构化和">非结构化数据的管理需求是推动企业使用Apache Hadoop软件的重要因素。
但是Hadoop还不能取代现有的所有技术,根据Ventana上个月底公布的一项研究报告表明,现在越来越多的状况是Hadoop与传统的关系数据库(RDBMS)一起工作。
Hadoop的设计初衷是帮助企业管理和处理PB级的数据。该技术的吸引力在于它能够将海量数据分解成较小的数据块,以便利用分布式的硬件集群更快处理海量数据。
包括Facebook、亚马逊、eBay和雅虎都在使用Hadoop分析PB级非结构化数据,而这正是传统的关系数据库渴望而不可及的。
在Ventana公司对超过160家公司的调查表明,越来越多的企业已经开始使用Hadoop。调查发现,这些公司大部分使用Hadoop来收集和分析海量的非结构化数据并生成包括日志、事件数据、搜索引擎结果、社交网站内容等相关信息。
调查还发现有三分之二的企业在没有使用Hadoop之前,企业没有对数据进行高级分析和类型分析。但传统关系数据库仍然有存在的理由,Hadoop技术对于分析交易数据、客户信息和通话记录等方面略显不足。而这正是传统关系数据库工具的优势所在,如传统的结构化数据。
最后该研究报告也指出了Hadoop所面临的挑战,如安全性、集群和相关技术人员的匮乏等问题。
(责任编辑:吕光)
时间: 2024-09-07 18:25:53