九头蛇与大象之争,Hydra或将取代Hadoop

【编者按】Hadoop被认为是最好的大数据分析平台,本身就具有较好的性能,还有活跃的开源社区支持,Hadoop创始人Doug Cutting也曾预言未来Hadoop不仅仅用于大数据处理,还将成为数据平台的系统内核,将用于在线事务处理……Hadoop的发展前景似乎一片光明,却没有注意到竞争者的出现,Hydra在某些方面甚至具有比Hadoop更加优越的性能,宣布开源以后,Hydra得到了越来越多的支持,未来Hydra极有可能成为Hadoop强劲的竞争对手,Datanami的主编Alex Woodie为我们带来了详细分析。

以下为译文:

Hydra(九头蛇),分布式任务处理系统,由社交标签服务提供商AddThis六年前开发,现在已得到Apache的开源许可,就像Hadoop一样,只是还没有Hadoop那样的知名度和声势。Hydra的创造者称,该“多头”平台非常擅长处理一些大的数据任务——对非常大的数据集进行实时处理,这样的任务恐怕会让那只大象(Hadoop)很头疼。

Hadoop仍然是一个储存大量数据的优秀平台,但很多公司面临着另一个问题,我们将数据存储到Hadoop之后如何去分析数据,无论是Hive还是Pig都需要方便地访问Hadoop中的数据,才能从中获得的价值。正如我们看到的:Hadoop用于实时分析并不合适。

Hydra是一个大数据存储和处理平台,由Matt Abrams和他的AddThis同事们共同开发完成。AddThis也就是过去的Clearspring,是开发Web服务器窗口小部件的公司,使访问者可以通过Twitter、Facebook、Pintrest、Google +或者Instagram轻松共享他们的数据。

当AddThis开始逐渐扩大其业务时,它对越来越多的用户数据渐渐感到无能为力。该公司需要一个可扩展的分布式系统,对其用户共享的这些数据进行实时分析。那时Hadoop无法满足AddThis的需求,所以它开发了Hydra。

那么,Hydra到底是什么?简而言之,它是分布式的任务处理系统,可以同时支持流处理和批处理。它利用一种基于树的数据结构来存储和处理具有数千个节点集群的数据。它具有一个基于Linux的文件系统,这使得它可以与ext3、ext4甚至ZFS兼容;它还具有作业/集群管理组件,可以自动为集群分配新的作业和平衡已有的作业;系统还可以自动将数据备份,并自动处理节点故障。

Hydra包括很多的组件:跨异构集群处理任务的分布式作业执行系统、可网络访问的文件服务系统,还有本地备份及远程备份(考虑到难以预防的节点故障)。

基于树形结构使它可以在同一时间处理流数据并进行批处理作业。AddThis工程部门的一位成员Chris Burroughs在他1月23日的博客中首次宣布Hydra开源,还提供了对于Hydra精辟的描述:“它摄取流数据(比如日志文件),并生成聚合树、 摘要树或者数据转换树,这些树可用来探索(小型查询),作为机器学习的一部分(大型查询)、或者在网站上支持实时控制台(大量的查询)。”

Hydra最初是用以帮助AddThis解决自身问题,供内部使用,以及为网站运营商提供服务。典型的问题包括:“上个月有多少用户访问网站?”以及“网站从不同国家和浏览器获得访问量分别有多大?”

AddThis继续使用Hydra来处理其大规模的数据流量,分析其客户得到网站的发展趋势。AddThis可以了解人们在线分享了什么,哪些话题比较热门。社交标签服务被超过1300万的网站使用,一个月有13亿用户访问,平均每天30亿访问量产生10TB数据,现在Hydra在AddThis的上千个网络节点上运行着。

Abrams通过邮件告诉Datanami:“我们处理大型数据集已经很长时间了,Hydra一直以来对我们都非常有用,我们觉得它以独特的方式解决了分布式数据处理的问题。”

传统的Hadoop面向批处理,而Hydra可以同时支持批处理和实时流处理。Abrams说:“Hydra支持的批处理主要侧重流分析和增量数据处理,能够使用树形数据结构描述数据,对自然数据进行压缩及高效查询和访问。Hydra可以从HDFS中生产和接受数据,但它在本机文件系统上完成操作,这使其可以在Hydra上灵活地使用其他服务。”

现在Hydra已经开源,Abrams希望该软件会被更加广泛的使用,并得到更好的发展。“这将需要一些时间,但我们相信未来我们将建成一个完善的Hydra开源社区,这样AddThis和OS(开源)社区都可以从Hydra未来的发展中受益。在华盛顿特区已经有一些其他公司在使用Hydra了,我们很期待Hydra社区得到进一步的发展。”

2013秋天,Doug Cutting,Hadoop的创始人也是Cloudera的首席架构师感叹Hadoop缺乏替代品——那时Cutting说:“我多么期待能有更多像Hadoop一样的系统出现……”虽然如今Hadoop在大数据界占据了主导地位,但谁又能说它会是唯一的一个大数据分布式计算平台?相信未来Hydra的发展不会令他失望,对于未来Hydra的发展,我想引用Cutting的另一句话:“天空才是极限。”

原文链接:Hadoop Alternative Hydra Re-Spawns as Open Source(编译/毛梦琪 审校/魏伟)

(责任编辑:蒙遗善)

时间: 2024-10-26 15:37:01

九头蛇与大象之争,Hydra或将取代Hadoop的相关文章

LOL美服S3提亚马特推升级版 九头蛇之噬

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   [ 科技讯]11月14日消息, LOL美服S3赛季对提亚马特进行了调整.推出了提亚马特升级版九头蛇之噬,为近战专用版, 不过喜欢玩远程英雄的玩家们也 不用担心,设计师表示,将会继续推出远程英雄的相应版本装备.     提亚马特       提亚玛特新版属性(近战专用) +50AD 每5秒恢复15点 生命值 唯一被动:顺劈:你的攻击会对目标周围的单位最多造成相当于

“九头虫”病毒技术分析报告

"九头虫"病毒技术分析报告 一.背景介绍 近日,阿里移动安全收到多方用户反馈,手机中了一种难以清除的病毒.病毒一旦发作,设备将不断弹出广告,并自动下载.安装.启动恶意应用,最终设备衰竭而死,用户很难通过常规的卸载手段清除病毒.由于该病毒有多个版本演变并有起死回生之术,我们将该病毒命名为"九头虫". 我们分析发现,"九头虫"病毒利用多家知名root sdk对设备提权,可轻松提权上万种机型,成功提权后获得设备最高权限,随后向系统分区植入多个恶意app

Hadoop大象之旅010-使用eclipse查看hadoop源码

Hadoop大象之旅010-使用eclipse查看hadoop源码                                                                老帅 我这使用的是hadoop-1.1.2.tar.gz,这个文件可以在下面地址下载到: 官方地址:http://archive.apache.org/dist/hadoop/core/hadoop-1.1.2/   1.将hadoop-1.1.2.tar.gz解压缩 文件夹结构如下所示:   2.在My

Hadoop大象之旅008-启动与关闭Hadoop

Hadoop大象之旅008-启动与关闭Hadoop                                                         老帅    Hadoop是一个运行在Linux文件系统上的分布式文件系统,在使用之前需要启动.   1.Hadoop的启动命令存储位置 参照前面章节中所述方法,使用SecureCRTPortable.exe登录CentOS; 使用命令"cd/usr/local/hadoop"或者"cd $HADOOP_HOME&q

Windows 8开发入门(十九) Windows 8中的GridView使用(一)

在本文中我们将讲述初步使用GridView以展示各种信息. 首先我们看看GridView的重要属性: SelectionMode:设置选择模式(None,Single,Multiple) IsItemClickEnabled:是否允许有 选择项点击事件 ItemsSource:数据项的数据源 ItemTemplate:数据项的展示模板 SelectedItem:选择项的内容 然后我们看看如何使用GridView. 1.首先设置数据源实体 类以及数据源提供源. public class DataM

关于十大黑客常用工具介绍

黑客技术一度被认为是一个神秘的特有领域,随着技术的进步和领域环境的进步,它已经成为一种非常普遍的现象.黑客技术可以用于有害目的,也可以用于发现系统中的漏洞,并通知系统属主,帮助他们更好地保护系统. 借助于一些工具及其基本知识,黑客可以更高效地执行安全测试,这对他们的任务有很大帮助.以下介绍黑客十大常用工具. 1. Nmap Nmap(Network Mapper)是一款非常著名的.用来扫描端口和绘制网络的.开源免费的黑客工具,它是一个基于控制台的工具,另外方便使用,还有一个带有GUI的版本Zen

破解恐怖组织宣传密码:“伊斯兰国”最重视推特

<伊斯兰国:恐怖政权>着力揭示"伊斯兰国"兴起的历史. 在1980年代,"圣战"这个词语尚未完全开始流行的时候,极端势力的宣传策略就已经渐渐成形.最早的宣传品有两种:第一种是把自己的观点和行为拍摄成录像带或者是影片;第二种则是模仿美国<时代>周刊或是<新闻周刊>,出版一些类似的彩色新闻杂志.由于当时互联网尚未大规模兴起,这些宣传品通过邮寄或者是在宗教活动中心散发的方式,到达目标受众手上.如果有人对极端势力的行为感兴趣,可以到宗教活

dota踢人命令是什么

  dota踢人命令详解: -kickafk x x是这个玩家开始时的玩家位置 不用刻意去记 能T人的时候,详细指令会出现在屏幕上的 其他dota命令大全,西西送给dotaer玩游戏的时候带来方便与快捷. 全选模式:-ap/-allpick 玩家可以选择所有酒馆的英雄 全体随机模式:-ar/-allrandom 玩家从所有酒馆的范围里自动随机得到一个英雄.和反转模式不兼容. 团队随机模式: -tr/-teamrandom 模式随机: -mr/-moderandom 随机从全体随机模式,全选模式,

《英雄联盟》小兵完虐英雄

对于喜爱<英雄联盟>的玩家来说,英雄才是游戏中的主角,不过你却也不能忽视掉那一波一波悍不畏死,往前勇敢推进的小兵们...虽然在玩家眼中他们只是一群移动金币,但各位有想过--如果小兵有自我意识不想再去送死,而产生暴动的现象吗? 在今天与大家分享的视频中,小兵因为不满在继续当英雄们的小傀儡,因此在温泉旁群聚抗议,表示他们并不只值 16 块钱,要求放他们自由:虽最后小兵终於获得了胜利--但就在这时候雷葛尔传了回来! <英雄联盟>小兵完虐英雄1: <英雄联盟>小兵完虐英雄2: