MapReduce朝不保夕的江湖地位

可怜的MapReduce,直到2013年末,都是Hadoop系统中的关键一环,在这个开源大数据处理框架中,它既是集群的资源管理器,又作为主要编程手段和处理环境存在。但如今看来,情况正在发生变化。

Apache Software Foundation的Hadoop 2版本添加了一个名叫YARN的新技术,取代了MapReduce的资源管理角色,并将Hadoop发展成了超越MapReduce批处理作业的应用程序。目前有很多厂商推出了SQL-on-Hadoop工具,让用户编写针对Hadoop数据分析查询的标准SQL,以代替MapReduce。Spark 处理引擎也应运而生,其支持者声称它运行批处理作业的速度比MapReduce快100多倍,并且支持时下流行的高级编程语言,如Java和Python 等。

随着上述新兴技术的出现,MapReduce已经不再像以往那么重要,就像一个古老的蒸汽引擎被迫让位于更时尚的柴油机车一样。这个现实在纽约 Strata + Hadoop World 2015 会议后更为凸显,在此次会议中,与会者广泛讨论了摆脱MapReduce的议题。用一位发言人的话说,“摆脱MapReduce,尽快和尽可能多地摆脱。”

MapReduce Geospatial 的出现,将这一“去MapReduce化”的情绪推向了顶峰,它是一个开源工具包,用于处理卫星图像和其他大型的栅格数据集。它促使开发者转变原有被称为 MrGeo的开发技术,从MapReduce转而使用Spark。这样做的结果是获得了更高的性能,且代码库容量减少了25%,卫星成像分析公司(DigitalGlobe)的分析主管Smith 承认,是时候为工具包起一个新的名字了。

不仅仅是MapReduce, HDFS (Hadoop分布式文件系统)——Hadoop的其他核心组成部分的代表,也有可能被取代。在Strata 会议上,Hadoop供应分销商的领头羊Cloudera公布了一种名为Kudu的柱状数据存储,作为HDFS在实时流数据分析方面的一个潜在替代技术。 Hortonworks,另一个Hadoop供应商,推出了一个单独的软件来管理不同系统之间的数据流,HDFS的地位受到了威胁。

MapReduce和HDFS很快就会消失。尽管目前有很多应用程序基于二者构建,大量的Hadoop用户仍会使用它们来完成一些大数据处理的需要。但以后部署Hadoop系统将不再需要这两种技术的情况将不可避免。

他们真的还会是Hadoop集群吗?这是一个生死攸关的问题。但Hadoop的进化,或者身份危机也许是大数据时代带来的易变性数据管理环境所引发变革的一个缩影。各种关系数据库和SQL一枝独秀的时代一去不返了。我们生活在一个多元的世界,这个世界存在各种技术,满足着不同的数据处理和分析的需要。当然关系型软件也在其中,此外还包括由Hadoop,Spark,NoSQL数据库以及其他大数据工具组成的庞大且不断扩张的生态系统。Hadoop处于这个生态系统的中心位置,但这个位置并不是永久的,很可能在将来的某一天被其他技术所取代。

本文转自d1net(转载)

时间: 2024-10-26 06:51:37

MapReduce朝不保夕的江湖地位的相关文章

前所未有的新挑战:微软能否持续站稳江湖地位?

现在再回头说可能令人无法置信,但是在当年,早在2008年10月份微软首次推出Windows Azure服务时,确实有人曾猜测:微软会不会和之前跟Netscape争勇斗狠的时候借助Internet Explorer攻城掠寨一样,凭借着Windows Azure再次一举杀入云计算领域.究竟微软使用了什么手段?究竟怎样的Windows服务或特性能够使人们在Azure面前完全没有抵抗之力,以至于完全没有其他的竞争对手能够在它面前站稳脚跟? 大约三年过后,大多数所谓的阴谋论似乎很可笑,它们没有一个属实.鉴

2012年微软能否保持云计算的江湖地位?

现在说起来几乎难以置信,但想当初,微软早在2008年10月首次推出WindowsAzure服务时,有人确实猜测:这家公司会不会像之前与Netscape斗智斗勇时期凭借InternetExplorer攻城掠池那样,设法使劲闯入云计算领域.微软到底采用了什么手段?什么样的Windows服务或特性让人们在Azure面前无力抗拒,以至于没有其他竞争对手能够站稳脚跟? 大约三年过后,大多数所谓的阴谋论似乎很可笑,它们没有一个属实.鉴于现在亚马逊是基于云计算的虚拟机领域的领头羊(尽管竞争相当激烈),VMwa

苏宁红孩子能否重新找回江湖地位

1月20日,北京,苏宁易购与红孩子业务协同后的首次联合市场活动上,苏宁易购执行副总裁李斌表示,"2013年苏宁红孩子团队不但不会出现数量上的减员,反而计划要扩充至3000人左右,全年红孩子目标将保底实现销售30亿." 一周前,红孩子COO陈爽发了一条微博,"又看到朋友们关注我们了,冒个泡:自去年苏宁并购红孩子后,2013年我们将在供应链.物流配送.客服.平台建设等方面与苏宁,特别是苏宁易购全面对接,目前红孩子团队稳定,中高层无一人离职,按照2013年销售目标,我们还需要广招贤

2分钱决定四大银行江湖地位

农行上市后市值排序或是:工行.建行.农行.中行 本报记者 贺江兵 北京报道 截至上半年底,<华夏时报>记者通过测算得知,四大国有商业银行总市值工行为1.433万亿,排名第一:建行总市值为1.285万亿,稳居第二:农业银行如果以每股2.68元发行价计算,总市值为8704亿元(不计算H股溢价):中行总市值为8661亿元,暂列第四.如果农行降低发行价2分钱,以2.66元发行,则总市值就会被中行取代,二者的总市值就会换位. 仅仅2分钱就决定了四大国有商业银行的江湖地位.只有当农行每股达到3.96元,并

电商意在“江湖地位”

长江商报消息 本报讯(记者 常燕 实习生 王锋琪)一边,几大电商拿出看家本领促销拉客:另一边,消费者却眼花缭乱,不知如何下手.电商是真打折还是清库存?到底怎么买才划算? 昨日,记者登录各大电商网站并采访多位"http://www.aliyun.com/zixun/aggregation/35900.html">网购达人",为读者奉上"双11"购物省钱攻略. 电商齐促销 各有各的招 眼下,各大电商网站已完全进入"双11"大促中,纷纷

混合IT的新世界 存储工程师的江湖地位不保?

 最近,似乎大家都不想养专门的存储工程师了--如果系统或虚拟化工程师可以对付存储,或干脆系统迁移到云了,还养着干啥呢?支持继续养的一个理由,也许是应对不断增加的各种风险.是的,IT运营越来越自动化,各基础架构孤岛也越来越整合,但高端的存储管理课题,例如数据保护和治理,总是复杂且棘手的,经常需要密切监督和非常专业的介入. 麻烦的也不仅仅是存储.公有云提供的简单价格体系,与企业的直接IT采购成本对比还行,与其他例如税收.服务有效性等间接成本相比,则不太灵了. 那么如何在自动化.虚拟化.融合和云计算的

平价策略难显江湖地位同大海岛失意创业板

⊙记者 吴正懿 ○编辑 全泽源 上周五,山东同大海岛创业板IPO遭否.在监管部门审核趋严的背景下,同大海岛上市铩羽而归的重要原因,或是由于行业优势地位并不显著. 预披露材料显示,同大海岛主营海岛型超细纤维人工革及基布产品,本次拟发行1110万股,发行后总股本4440万股,募集资金1.42亿元用于300万平方米生态超纤高仿真面料扩大生产规模项目.2007年至2009年,公司实现归属母公司股东的净利润分别为2274万元.2405万元和3104万元. 然而,同大海岛的上市征途在上周五戛然而止.昨日,同

从15张大佬扑克牌众观中国手游江湖

移动互联网里最火的是手机游戏,占据了各大http://www.aliyun.com/zixun/aggregation/13811.html">App Store的热门和推荐榜单,如果把这些游戏背后的大佬,与扑克牌里的人物进行匹配,会是怎样有趣的结果呢? 新厂商野心勃勃,妄图把握窗口机会,塑造全新行业格局;老厂商不甘人后,动辄端游手笔推广,愣是通过金元战术砸出一个大热产品;更有蓝港这样特殊案例:从端游.页游转战手游,在巨头争夺的罅隙之地完美转圜取得完美成功. 渠道侧则可谓是巨头割据:腾讯.

安全创业者修炼手册:信息安全的江湖,是属于圈内人的

雷锋网按:作者张矩,峰瑞资本董事,负责过 Google 和 YouTube数据中心的构建与运维,是 Google 中国创始团队成员和首位运维人员,参与研发和服务环境建设,也曾任 Joyent 中国区首席代表.友友系统首席运营官,以及光速安振执行董事,国内最早一批投身云计算产业的人.本文系张矩在阿里安全峰会上发表的题为<投资人眼里有"安全感"的创业者>的部分演讲内容,解析当下网络安全团队创业面临的问题和机遇,对投资人而言,到底什么样的安全创业者是有"安全感"