YARN为Hadoop赋予新的能力

  

&">nbsp;

  近日,Hadoop 2 GA版发布,借助于YARN,Hadoop 2可以创建能在Hadoop中本地工作的数据处理应用。通过将集群资源管理这些关注点从数据处理中分离出来,YARN使得Hadoop能应用于Map-Reduce以外的数据处理中。因此,这样大量新项目就有可能实现了。比如Stinger和Tez这样的项目,它们关注于在某些场合下获得预期的人工交互响应时间。STORM则致力于流数据处理。Spring已经宣布了Spring YARN framework,那些想编写自己的YARN应用的Java开发者们可以使用它实现自己的目标。通过寻求Hadoop的存储和集群管理平台之间的平衡,数据处理应用现在使得用户能以多种方式与数据进行交互。我们曾和Hortonworks的产品经理Rohit Bakhshi谈过YARN以及YARN给Hadoop用户带来的意义。Rohit同我们分享了他关于YARN的能力简单看法 Hadoop一直保持着向前的势头,并且越来越多的企业(不仅仅是web规模的公司)都想将所有传入的数据保存在Hadoop中,因而它们的用户能够使用多种方式与这些数据进行交互:批处理、交互式、实时数据流分析等等。而且更重要的是,他们要能同时执行这些交互,而不会出现在交互时单个应用或查询占用集群的所有资源的情况。

  借助于YARN将Apache Hadoop 2转化成一个多应用的数据系统,Hadoop社区可以处理Hadoop所面临的新一代需求。YARN在底层就满足了实际的需求,而不是以商业附加组件来处理这些需求------会使得用户的环境变得更复杂,这样YARN就很好地满足了这些企业的需求。

  展望未来,企业将能部署多租户的、服务于多个目标的Hadoop集群,这些集群可以满足不同组织和应用框架的各项SLA的要求。通过使用mapred api,YARN为种种应用提供了二进制的兼容性。但在Hadoop 1.x中只是使用mapreduce api提供了源代码级的兼容性。Rohit解释说 在Hadoop 2.0中,各个客户端会向运行在YARN上的MapReduce v2框架提交种种MapReduce应用。而在Hadoop 1.0中,各个客户端则向MapReduce v1框架提交MapRecude应用。

  这两类API都引用开发者可用的MapRecude框架来创建MapReduce应用。org.apache.hadoop.mapred API是最早的API,最广泛地使用在MapReduce应用的创建中。任何使用mapred API开发的MapReduce v1应用都可以提交至运行在YARN上的MapReduce v2框架,并在该框架中运行。在这种情况下,无须修改该MapReduce应用。

  而org.apache.hadoop.mapreduce API则是MapReduce框架的较新的API集。在MapReduce v2和运行于YARN上的MapReduce v2之间,这些API没有提供二进制的兼容性。现存的MapReduce v1应用如果使用了这些API,则需要使用Hadoop2.x Hadoop包进行重编译。重编译后,应用就可以提交至运行在YARN上的MapReduce v2框架,并在该框架中运行。 读者可以通过这里了解进一步的信息。升级现有的Hadoop集群的过程也是很直接和方便的 Hadoop和HDP(包括所有相关的Apache Hadoop组件)都支持“就地”升级,可以就地从HDP 1.3(Hadoop 1.x)升级至HDP 2.0(Hadoop2.x)。保持了所有已有数据,而同时就地升级了元数据,并无须迁移。配置已从HDP 1.3升级至HDP 2.0,会废弃以前配置中的一些配置属性,同时添加一些新的配置属性。所以已有的HDP 1.3配置需要迁移至HDP 2.0。当我们问他会否担忧那些过早地在较小数据集上使用Hadoop的公司时, Rohit回答说他有不同的看法 我们以各种方式使用Hadoop,并且由于它是开源的,我们能看到各种用法。我不会认为这些用法是“过早的”;实际上,很多组织会从一个小的集群开始来使用Hadoop,这个集群仅仅只有几个节点和几T数据,但最终这些环境都不断扩大,直到形成一个数据湖并提供了一个中等的数据架构。小的集群并不是“过早的”---它们是种子。

时间: 2024-09-16 04:22:18

YARN为Hadoop赋予新的能力的相关文章

YARN赋予Hadoop新的能力

近日,http://www.aliyun.com/zixun/aggregation/13537.html">Hadoop 2 GA版发布,借助于YARN,Hadoop 2可以创建能在Hadoop中本地工作的数据处理应用.通过将集群资源管理这些关注点从数据处理中分离出来,YARN使得Hadoop能应用于Map-Reduce以外的数据处理中.因此,这样大量新项目就有可能实现了.比如Stinger和Tez这样的项目,它们关注于在某些场合下获得预期的人工交互响应时间.STORM则致力于流数据处理

大数据 为信息安全赋予新的逻辑思维

信息工业技术的发展,催生了梦想的诞生与实现.一直以来,人类都希望机器能够具有人类智慧高效地完成工作,而这样的愿望,今天已经延伸至信息安全. 什么叫具有人类逻辑的信息安全?某位员工已经出差到外地,其账号却在公司办公室中登录内 网访问重要资料,作为一名网络管理人员,当你知道这一切的时候首先会想到:这名员工的账号被盗了,公司的商业机密正在被窃取.之所以得出这样的结论,是由 于按照正常的逻辑判断,将"出差"与"本地访问IP地址"联系在一起,在情理上是矛盾的.我们希望,机器也

大数据,为信息安全赋予新的逻辑思维

信息工业技术的发展,催生了梦想的诞生与实现.一直以来,人类都希望机器能够具有人类智慧高效地完成工作,而这样的愿望,今天已经延伸至信息安全. 什么叫具有人类逻辑的信息安全?某位员工已经出差到外地,其账号却在公司办公室中登录内网访问重要资料,作为一名网络管理人员,当你知道这一切的时候首先会想到:这名员工的账号被盗了,公司的商业机密正在被窃取.之所以得出这样的结论,是由于按照正常的逻辑判断,将"出差"与"本地访问IP地址"联系在一起,在情理上是矛盾的.我们希望,机器也能够

人人CEO陈一舟:人人公司有内部孵化新业务能力

摘要: 8月23日消息, 人人 公司CEO 陈一舟 ( 微博 )今日撰写博文谈及人人公司旗下糯米网,陈一舟称O2O台风来了,糯米站到了风口上. 陈一舟指出,糯米迄今为止取得的成果,说明人人公司在 8月23日消息, 人人 公司CEO 陈一舟 ( 微博 )今日撰写博文谈及人人公司旗下糯米网,陈一舟称O2O台风来了,糯米站到了风口上. 陈一舟指出,糯米迄今为止取得的成果,说明人人公司在有一定基因优势情况下,有内部孵化新业务能力. 最直接比较是,在千团大战中,有很多互联网"大爹级"公司出手,投

英特尔为Hadoop添加Lustre支持能力

全世界的厂商已经达成共识:Hadoop在映射化简领域是 一款非常优秀的工具,但该软件的进一步发展却受到多种束缚,其中最难跨越的门槛在于对Hadoop分布式文件系统(简称HDFS)的高度依赖. HDFS本身并没问题,但在与Hadoop集成之后则要求用户必须为其构建专用计算机集群. 虽然我们对HDFS并 不过分抵触,但大部分使用高性能计算集群处理特殊事务的客户 往往对它不太热衷.究其原因,用户需要为HDFS本身投入 大量计算资源.虽然映射化简功能确实会给任务执行带来一些便利,不过这部分资源根本无法直

大数据探索:在树莓派上通过 Apache Spark on YARN 搭建 Hadoop 集群

有些时候我们想从 DQYDJ 网站的数据中分析点有用的东西出来,在过去,我们要用 R 语言提取固定宽度的数据,然后通过数学建模来分析美国的最低收入补贴,当然也包括其他优秀的方法. 今天我将向你展示对大数据的一点探索,不过有点变化,使用的是全世界最流行的微型电脑----树莓派,如果手头没有,那就看下一篇吧(可能是已经处理好的数据),对于其他用户,请继续阅读吧,今天我们要建立一个树莓派 Hadoop集群! I. 为什么要建立一个树莓派的 Hadoop 集群? 由三个树莓派节点组成的 Hadoop 集

房地产板块 新动力赋予新“升”浪

周五,房地产股大幅飚升,牵引大盘再度逞强,这是否意味着房地产股东山再起呢? 调控政策新解读 对于房地产股在本周末的崛起,笔者认为这主要是业内对未来的调控政策有了新的解读,尤其是美联储下降75个基点的利率之后更是如此.一方面,美联储如此降息将使得美元的利率进一步降低,从而更进一步显现出人民币利率的比较优势,热钱涌入的预期将相对乐观.另一方面,美联储的降息进一步封闭了我国央行加息的空间.那么,未来的调控政策将主要是上调存款准备金率来紧缩银根,这对于房地产股来说,是一个利好信息,既预示着未来的资金成本

SEO被赋予新的意义

摘要: 新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代.各大搜索引擎为了互联网良性的发展,对搜索优化的要求也日益严格,频繁更新得到搜索算法使得站长 新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代.各大搜索引擎为了互联网良性的发展,对搜索优化的要求也日益严格,频繁更新得到搜索算法使得站长们抱怨不断,互联网高速发展的时代下,并赋予SEO新的意义. 外链意味着高权重 在搜索引擎刚出现时,判断页面与关键词的相关性时,主要以页面上的元标签.关键词标签.H

风行网揭开神秘面纱,开放平台正式上线

2月13日消息,自去年12月9日风行网发布开放平台战略以来,其核心产品视频号也成为业界关注的焦点,如今它的神秘面纱被揭开. 1月30日,风行网开放平台正式上线,视频号携传统媒体.品牌机构正式亮相,视频号账号及后台已向合作伙伴开.对于视频号正式上线,业界普遍认为,视频号正颠覆着视频行业的既定规则,其开放融合的姿态,正在为传统媒体赋予新媒体运营能力,发掘新的营销价值.   "赫斯特"."精品"."新华网"等媒体视频号已开通,用户可以通过查找订阅视频号