Hadoop 2.0:YARN能否改变游戏规则?

随着大数据概念的升温,Hadoop作 为最具代表性的技术进入人们视野已有一段时间了。整个Hadoop生态系统也在飞速发展,几乎每一天都会衍生出新的功能或者新的工具。尽管有一些是微小的 改动,比如Oozie中更完美地支持调度,或者还有一些仍在开发中,比如对NFS的支持。还有一些非常酷的特性,比如在Pig当中对CPython提供完 整支持等。但在我看来,这些都不如Hadoop 2.0中的YARN更具革命性。

我们都知道,Hadoop有两个核心的组件,即HDFS(分布式文件系统)和MapReduce架构(分布式处理平台)。而YARN的出现,则使Hadoop从一个分布式处理架构蜕变为一个分布式操作系统。

用“操作系统”这个词可能会被很多网友吐槽,是不是夸张了点?这里我要引用计算机大牛Andrew S.Tanenbaum在《现代操作系统》一书中对OS的定义,它包括:

一个虚拟机:操作系统的作用,就是为用户提供一个扩展计算机或者虚拟机的环境,能让用户在底层硬件中更容易进行编程一个
资源管理器:操作系统要做的,是为处理器,内存,IO设备等提供有序的、可控的资源分配,以便各种程序进行使用。

针对第一个条件,Hadoop从一开始在1.0版本中就已经提供支持。而YARN的出现则满足了第二个条件。因此在我看来,Hadoop现在已经可以被视为分布式的操作系统。

YARN就是Hadoop的资源管理器。之前的Hadoop是在MapReduce基础上构建的,虽然在计算范式上有过很多尝试,但它依然没有脱离 MapReduce提供的框架。它以JobTracker和TaskTracker的形式来处理工作负载并管理服务器资源,每个节点都是配置了map和 reduce。

在Hadoop 2.0中,MapReduce已经不再是唯一的选择。它提供了更好,更灵活的设计,对计算资源处理进行了分离。对于YARN,大家可以去拜读Hortonworks架构师Arun Murthy的系列文章,其中的介绍非常详细。

这里要强调一点,上文提到的计算资源处理分离已经运用到了实际的环境当中,并取得了不错的效果,比如包括:

Storm on YARN:Twitter应用的运行在Hadoop上的流计算框架(Yahoo)Apache Samza:基于YARN开发的项目,可以作为Storm的替代品(Apache)HOYA:HBase on YARN,集群上的HBase部署工具(Hortonworks)Weave:基于YARN的封装,用于简化应用部署(Continuuity)Giraph:图形处理系统(Apache)Llama:让外部服务器从YARN
获取资源的框架(Cloudera)Spark on Yarn:基于内存的分析集群技术Tez:通用的、高度可定制的框架,用于简化Hadoop中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载(Hortonworks)

总之在我看来,YARN的引入对Hadoop来说是具有革命性的,是可以改变游戏规则的。而且它已经从理论走向实践,而并不是未来的某种概念。事实上,Hadoop 2.0已经正式GA了,用户已经可以直接对YARN进行测试。

时间: 2024-09-20 12:21:00

Hadoop 2.0:YARN能否改变游戏规则?的相关文章

IBM称Blue Cloud 将“改变游戏规则”

IBM称Blue Cloud 将"改变http://www.aliyun.com/zixun/aggregation/28540.html">游戏规则" IBM出人意料地支持了云计算.这使人们回想起来IBM当年支持Linux的情况.云计算是当前非常流行的技术之一.这些流行的技术包括:Web 2.0.丰富互联网应用程序.软件服务.SOA.网格计算.Web服务.虚拟化和公用计算. IBM把自己的计划称作"Blue Cloud"(蓝色的云)并宣称这是它互联

移动目标防御 改变游戏规则的网络安全新技术

本文讲的是 移动目标防御 改变游戏规则的网络安全新技术,移动目标防御(MTD)是当今最具影响力的安全创新机会.在过去的几年里,国际上针对移动目标防御的研究一直是非常重视. 美国国土安全部将MTD技术定义为改变游戏规则的新型网络安全技术,美国空军准备在2020年前大范围应用MTD技术解决安全问题.2016年美国第一个MTD技术的专利被颁发.之后国外学者针对MTD技术撰写了大量论文,出版了多个MTD的论文集. 同时,国际上对MTD的学术讨论也如火如荼.美国计算机学会也举行了多次研讨会,例如2015年

大数据还没有改变游戏规则

本文讲的是大数据还没有改变游戏规则,一度被认为是废物的各种来源的数据现在对某些人来说已经成为一种宝贵资源,这些人保存大数据并以此进行分析预测而为全球企业的改变服务.我们可能在某些细小的方面看到过案例.有些组织在与其对手的竞争中通过使用big data已经获得了绝对优势,但很多人会说并不能确定是胜在使用big data这一点上. 2012年已经被预测为大数据年.但到目前为止,研究的重点还集中在处理4V(高速.种类.容量和价值)big data以及如何操作它们.据我所知,还没有在商业角度使用这种数据

“改变游戏规则的大事”:中国可能准入海外基金

香港资产管理行业曾希望借助一项向中国内地销售基金的协议得到持久的提振.但外界对于英国和其他市场将很快与中国达成类似协议的猜测越来越多,令上述希望大打折扣〿/p> 了解谈判进程的人士称,预计在未来几周内,香港与中国内地的监管机构将签署一项协议,允许两地市场"相互认可"在对方市场注册的基金〿/p> 分析人士曾将中国开放市场形容为一件"改变游戏规则的大事",使香港成为国际基金公司向中国内地数百万储蓄者销售投资产品的最佳基地,从而保障香港作为一丿a href=&

移动支付年度盘点:谷歌钱包改变游戏规则

谷歌移动支付业务谷歌钱包 导语:美国科技资讯网站PCWorld撰稿人米卡尔·里克纳斯(Mikael Ricknäs)周三发表文章称,2011年移动支付市场虽已取得进展,但仍未如预期,NFC在支付领域的成功要到2015年之后才能实现.分析师认为,谷歌钱包的推出改变了支付行业的游戏规则,而苹果也可能会进入移动支付领域. 以下为文章全文: 运营商移动支付合作以及小范围移动支付试点的开展将在2012年收获成效,而且一些分析师认为苹果将进入移动支付市场.但尽管如此,该市场仍有巨大潜力有待开发. 从某种程度

需求为上 软件定义存储将改变游戏规则

Strata+Hadoop World是世界最大的大数据盛会,参会者带来了业界最领先的技术和解决方案与大家进行分享,而笔者在会后的采访中也了解到包括Cloudera.Intel以及诸多的行业用户都在关注软件定义存储,来自多方面的挑战让SDS快速走进了我们的视野. 软件定义存储是指通过软件对存储设备进行定义,并能够根据用户需求分配这些存储资源,软件定义存储是大数据时代下不可缺少的一部分,其以虚拟化为基础,但又超脱了虚拟化范围. 软件定义的存储和软件定义的计算已经在一些先进的互联网企业中应用,例如谷

科技改变游戏规则

我们关注的一直是特定事物的吸引力,是吸引力的深度和广度--它们属于主流还是小领域,质量高还是低.但我们还没有考虑另一个能够影响流行度的因素:新旧程度. 流行度实际上是多维的:比如,决定唱片排名的可能不光是唱片的质量,还有音乐流派.发行日期.乐队的名气和(或)国籍.与其他艺术家的相似性等其他因素.但所有这些因素都被放进了一个一维的畅销榜中,在这个大杂烩中,它们都被模糊了. 可想而知,今天的大热门就是明天的小冷门.几乎所有产品的热度都会随着时间的推移而消退,热门产品也不例外.<龙卷风>是1996年

中国网络空间防御技术重大突破 将改变游戏规则

经科技部授权上海市科学技术委员会组织的测试评估,由解放军信息工程大学.复旦大学.浙江大学和中国科学院信息工程研究所等科研团队联合承担的国家"863计划"重点项目研究成果"网络空间拟态防御理论及核心方法"近期通过验证,测评结果与理论预期完全吻合.这标志着我国在网络防御领域取得重大理论和方法创新,将打破网络空间"易攻难守"的战略格局,改变网络安全游戏规则. 拟态,是指一种生物模拟另一种生物或环境的现象.2008年,中国工程院院士邬江兴从条纹章鱼能模仿

谷歌Nexus扩展计划可能改变游戏规则

下一代Nexus将与多家厂商合作报道称谷歌下一代Nexus手机将与多家厂商合作一般情况下我们不会针对那些未经证实的传言来发表自己的看法,不过这周关于谷歌的Nexus计划是个例外.根据华尔街日报的报道,谷歌正在尝试改变它一贯的Nexus计划,与多至五家厂商合作,在今年年底与新版的Android系统同时发布多台Nexus设备,包括手机和平板电脑.谷歌官方并没有针对此报告表态,在下一代Nexus手机正式发布之前,我们会一直关注此事件.而对于这篇文章,我们是假设这个报道是真的,假定谷歌的确会与不同的硬件