YARN为Hadoop赋予新的能力

&">nbsp;

　　近日，Hadoop 2 GA版发布，借助于YARN，Hadoop 2可以创建能在Hadoop中本地工作的数据处理应用。通过将集群资源管理这些关注点从数据处理中分离出来，YARN使得Hadoop能应用于Map-Reduce以外的数据处理中。因此，这样大量新项目就有可能实现了。比如Stinger和Tez这样的项目，它们关注于在某些场合下获得预期的人工交互响应时间。STORM则致力于流数据处理。Spring已经宣布了Spring YARN framework，那些想编写自己的YARN应用的Java开发者们可以使用它实现自己的目标。通过寻求Hadoop的存储和集群管理平台之间的平衡，数据处理应用现在使得用户能以多种方式与数据进行交互。我们曾和Hortonworks的产品经理Rohit Bakhshi谈过YARN以及YARN给Hadoop用户带来的意义。Rohit同我们分享了他关于YARN的能力简单看法 Hadoop一直保持着向前的势头，并且越来越多的企业(不仅仅是web规模的公司)都想将所有传入的数据保存在Hadoop中，因而它们的用户能够使用多种方式与这些数据进行交互：批处理、交互式、实时数据流分析等等。而且更重要的是，他们要能同时执行这些交互，而不会出现在交互时单个应用或查询占用集群的所有资源的情况。

　　借助于YARN将Apache Hadoop 2转化成一个多应用的数据系统，Hadoop社区可以处理Hadoop所面临的新一代需求。YARN在底层就满足了实际的需求，而不是以商业附加组件来处理这些需求------会使得用户的环境变得更复杂，这样YARN就很好地满足了这些企业的需求。

　　展望未来，企业将能部署多租户的、服务于多个目标的Hadoop集群，这些集群可以满足不同组织和应用框架的各项SLA的要求。通过使用mapred api，YARN为种种应用提供了二进制的兼容性。但在Hadoop 1.x中只是使用mapreduce api提供了源代码级的兼容性。Rohit解释说在Hadoop 2.0中，各个客户端会向运行在YARN上的MapReduce v2框架提交种种MapReduce应用。而在Hadoop 1.0中，各个客户端则向MapReduce v1框架提交MapRecude应用。

　　这两类API都引用开发者可用的MapRecude框架来创建MapReduce应用。org.apache.hadoop.mapred API是最早的API，最广泛地使用在MapReduce应用的创建中。任何使用mapred API开发的MapReduce v1应用都可以提交至运行在YARN上的MapReduce v2框架，并在该框架中运行。在这种情况下，无须修改该MapReduce应用。

　　而org.apache.hadoop.mapreduce API则是MapReduce框架的较新的API集。在MapReduce v2和运行于YARN上的MapReduce v2之间，这些API没有提供二进制的兼容性。现存的MapReduce v1应用如果使用了这些API，则需要使用Hadoop2.x Hadoop包进行重编译。重编译后，应用就可以提交至运行在YARN上的MapReduce v2框架，并在该框架中运行。读者可以通过这里了解进一步的信息。升级现有的Hadoop集群的过程也是很直接和方便的 Hadoop和HDP(包括所有相关的Apache Hadoop组件)都支持“就地”升级，可以就地从HDP 1.3(Hadoop 1.x)升级至HDP 2.0(Hadoop2.x)。保持了所有已有数据，而同时就地升级了元数据，并无须迁移。配置已从HDP 1.3升级至HDP 2.0，会废弃以前配置中的一些配置属性，同时添加一些新的配置属性。所以已有的HDP 1.3配置需要迁移至HDP 2.0。当我们问他会否担忧那些过早地在较小数据集上使用Hadoop的公司时, Rohit回答说他有不同的看法我们以各种方式使用Hadoop，并且由于它是开源的，我们能看到各种用法。我不会认为这些用法是“过早的”;实际上，很多组织会从一个小的集群开始来使用Hadoop，这个集群仅仅只有几个节点和几T数据，但最终这些环境都不断扩大，直到形成一个数据湖并提供了一个中等的数据架构。小的集群并不是“过早的”---它们是种子。

时间： 2024-09-16 04:22:18

YARN为Hadoop赋予新的能力的相关文章

YARN赋予Hadoop新的能力

近日,http://www.aliyun.com/zixun/aggregation/13537.html">Hadoop 2 GA版发布,借助于YARN,Hadoop 2可以创建能在Hadoop中本地工作的数据处理应用.通过将集群资源管理这些关注点从数据处理中分离出来,YARN使得Hadoop能应用于Map-Reduce以外的数据处理中.因此,这样大量新项目就有可能实现了.比如Stinger和Tez这样的项目,它们关注于在某些场合下获得预期的人工交互响应时间.STORM则致力于流数据处理

大数据为信息安全赋予新的逻辑思维

信息工业技术的发展,催生了梦想的诞生与实现.一直以来,人类都希望机器能够具有人类智慧高效地完成工作,而这样的愿望,今天已经延伸至信息安全. 什么叫具有人类逻辑的信息安全?某位员工已经出差到外地,其账号却在公司办公室中登录内网访问重要资料,作为一名网络管理人员,当你知道这一切的时候首先会想到:这名员工的账号被盗了,公司的商业机密正在被窃取.之所以得出这样的结论,是由于按照正常的逻辑判断,将"出差"与"本地访问IP地址"联系在一起,在情理上是矛盾的.我们希望,机器也

大数据，为信息安全赋予新的逻辑思维

人人CEO陈一舟：人人公司有内部孵化新业务能力

摘要: 8月23日消息, 人人公司CEO 陈一舟 ( 微博 )今日撰写博文谈及人人公司旗下糯米网,陈一舟称O2O台风来了,糯米站到了风口上. 陈一舟指出,糯米迄今为止取得的成果,说明人人公司在 8月23日消息, 人人公司CEO 陈一舟 ( 微博 )今日撰写博文谈及人人公司旗下糯米网,陈一舟称O2O台风来了,糯米站到了风口上. 陈一舟指出,糯米迄今为止取得的成果,说明人人公司在有一定基因优势情况下,有内部孵化新业务能力. 最直接比较是,在千团大战中,有很多互联网"大爹级"公司出手,投

英特尔为Hadoop添加Lustre支持能力

全世界的厂商已经达成共识:Hadoop在映射化简领域是一款非常优秀的工具,但该软件的进一步发展却受到多种束缚,其中最难跨越的门槛在于对Hadoop分布式文件系统(简称HDFS)的高度依赖. HDFS本身并没问题,但在与Hadoop集成之后则要求用户必须为其构建专用计算机集群. 虽然我们对HDFS并不过分抵触,但大部分使用高性能计算集群处理特殊事务的客户往往对它不太热衷.究其原因,用户需要为HDFS本身投入大量计算资源.虽然映射化简功能确实会给任务执行带来一些便利,不过这部分资源根本无法直

大数据探索：在树莓派上通过 Apache Spark on YARN 搭建 Hadoop 集群

有些时候我们想从 DQYDJ 网站的数据中分析点有用的东西出来,在过去,我们要用 R 语言提取固定宽度的数据,然后通过数学建模来分析美国的最低收入补贴,当然也包括其他优秀的方法. 今天我将向你展示对大数据的一点探索,不过有点变化,使用的是全世界最流行的微型电脑----树莓派,如果手头没有,那就看下一篇吧(可能是已经处理好的数据),对于其他用户,请继续阅读吧,今天我们要建立一个树莓派 Hadoop集群! I. 为什么要建立一个树莓派的 Hadoop 集群? 由三个树莓派节点组成的 Hadoop 集

房地产板块新动力赋予新“升”浪

周五,房地产股大幅飚升,牵引大盘再度逞强,这是否意味着房地产股东山再起呢? 调控政策新解读对于房地产股在本周末的崛起,笔者认为这主要是业内对未来的调控政策有了新的解读,尤其是美联储下降75个基点的利率之后更是如此.一方面,美联储如此降息将使得美元的利率进一步降低,从而更进一步显现出人民币利率的比较优势,热钱涌入的预期将相对乐观.另一方面,美联储的降息进一步封闭了我国央行加息的空间.那么,未来的调控政策将主要是上调存款准备金率来紧缩银根,这对于房地产股来说,是一个利好信息,既预示着未来的资金成本

SEO被赋予新的意义

摘要: 新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代.各大搜索引擎为了互联网良性的发展,对搜索优化的要求也日益严格,频繁更新得到搜索算法使得站长新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代.各大搜索引擎为了互联网良性的发展,对搜索优化的要求也日益严格,频繁更新得到搜索算法使得站长们抱怨不断,互联网高速发展的时代下,并赋予SEO新的意义. 外链意味着高权重在搜索引擎刚出现时,判断页面与关键词的相关性时,主要以页面上的元标签.关键词标签.H

风行网揭开神秘面纱，开放平台正式上线

2月13日消息,自去年12月9日风行网发布开放平台战略以来,其核心产品视频号也成为业界关注的焦点,如今它的神秘面纱被揭开. 1月30日,风行网开放平台正式上线,视频号携传统媒体.品牌机构正式亮相,视频号账号及后台已向合作伙伴开.对于视频号正式上线,业界普遍认为,视频号正颠覆着视频行业的既定规则,其开放融合的姿态,正在为传统媒体赋予新媒体运营能力,发掘新的营销价值. "赫斯特"."精品"."新华网"等媒体视频号已开通,用户可以通过查找订阅视频号

猜你喜欢

Javascript实例代码:记住登陆密码的JS代码

文章简介:当鼠标经过checkbox显示提示框,离开则隐藏. 当鼠标经过checkbox显示提示框,离开则隐藏.代码如下: <script type="text/javascript& ...

javascript实现划词标记+划词搜索功能代码实例

javascript <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html& ...

Oracle数据库的应用结构

Oracle数据库的应用结构随着网络技术的发展,Oracle数据库在各个领域得到了广泛应用.基于Oracle数据库的应用系统结构主要分为客户/服务器结构.终端/服务器结构.浏览器/服务器结构和分 ...

用PS打造精美宝宝插画效果

如何把活泼可爱宝宝照片打造成精美插画效果,本教程尽量用一些可爱的卡通元素如彩虹,花朵,蝴蝶,翅膀等.创意部分需要自己慢慢去发挥. 最终效果 1.打开下图所示的背景素材,执行:滤镜 > 模糊 &g ...

Win8系统无法打开IE10浏览器该怎么办

浏览器是上网必备工具,比如大家熟悉的win7 64位旗舰版里面的应用.电脑在使用中难免会遇到一些故障问题,最近有的用户在操作win8系统的时候遇到IE10浏览器无法打开的问题,造成无法正常使用浏览 ...

使用Word 2010快捷键提示功能的方法

其实在Office 2007/2010/2013系列的Word.PowerPoint等软件当中使用了大量的快捷键操作,但是我们只能记住个别的快捷操作.在某些时候如果需要用到快捷键,最好有个提示功能 ...

Word2007如何快速定位自己需要的页面信息

第一步: 在Word2007中打开一篇原始文件,鼠标切换到"开始"选项卡,在"编辑"区域单击"查找"后面的下拉按钮,在弹出的菜单中选择& ...

Gmail邮箱怎么注册

Gmail邮箱怎么注册?谷歌邮箱又名Gmail邮箱,谷歌地图.谷歌Chrome浏览器等它们的服务都会用到Gmail邮箱.那么,怎么注册谷歌邮箱呢?须知,国内正常情况下是打不开谷歌Gmail邮箱注册 ...

使用GetWindowText获取不到窗口标题

问题描述如题,我在使用这个api函数的时候有的时候就会莫名其妙的获取不到标题而有的时候却又可以获取到,有些莫名其妙的.代码如下.[DllImport("user32.dll",C ...

jQuery实现的多屏图像图层切换效果实例_jquery

本文实例讲述了jQuery实现多屏图像图层切换效果的方法.分享给大家供大家参考.具体实现方法如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1 ...

uri-联系人信息工具类，提示路径不对？我是照着系统源码写的路径

问题描述联系人信息工具类,提示路径不对?我是照着系统源码写的路径 package com.example.mobilesafe.utils; import java.util.ArrayList; ...

c#窗体程序设计找回密码

问题描述 c#窗体程序设计找回密码我在做一个内部聊天程序到了找回密码这不知道该怎么写不知哪位可以帮帮我? 解决方案最简单的就是,在注册的时候问几个问题(比如你的第一个宠物的名字.你的外祖母的姓 ...

《黑客与画家》

译者序你现在拿在手里的,是一本非常重要.也非常独特的书. 它的作者是美国互联网界举足轻重.有"创业教父"之称的哈佛大学计算机博士保罗·格雷厄姆(Paul Gr ...

java 内部类（inner class）详解

一.为何使用内部类内部类提供了更好的封装,只有外部类能访问内部类内部类可以独立继承一个接口,不受外部类是否继承接口影响内部类中的属性和方法即使是外部类也不能直接访问,相反内部类可以直接访问外部类 ...

项目子文件夹中aspx页面上Telerik控件, 运行问题

问题描述看标题有点复杂,我稍微解释一下.项目有一个解决方案,解决方案下面有多个项目,其中一个为WebApplication项目,里面都是aspx页面.初期这些网页都在WebApplication目录 ...

PostgreSQL 并行计算tpc-h测试和优化分析

PostgreSQL 并行计算tpc-h测试和优化分析作者 digoal 日期 2016-11-08 标签 PostgreSQL , 并行计算 , TPC-H 背景 PostgreSQL 9.6首次 ...

用NetBeans编写界面画图程序的问题，望指教

问题描述我想用NetBeans编写界面画图程序,用户可在文本框中输入参数,点画图按钮后,程序会根据参数在面板上绘制矩形.绘图一般是在自定义的JPanel的派生类中重载paintComponent(G ...

从机器翻译来看中国最酷AI挑战赛：赛手体验放第一位

李飞飞在整个学术界和工业界的重心都放在如何做出更好的算法时,她不顾一切质疑和阻挠创建了ImageNet数据集,至此世人再难复制ImageNet创立过的辉煌.同样,参加了第一届ImageNet挑战赛的竞 ...

每年14PB数据存储需求，海量交通安全数据如何安放？

据中国汽车工业协会统计分析,2016年8月,在商用车主要品种中,与上月相比,客车和货车产销均呈增长,货车产销22.26万辆和23.25万辆,环比增长9.15%和10.21%,同比增长20.51%和15 ...

备份-还原数据库时,当前命令发生了严重错误应放弃任何可能产生的结果.错误：211

问题描述还原数据库时,当前命令发生了严重错误应放弃任何可能产生的结果.错误:211 各位帮忙看看,是不是数据库中有异常数据,备份出来之后没办法还原了? 解决方案 http://blog.csdn. ...

《从零开始学Swift》学习笔记（Day 18）——有几个分支语句？

原创文章,欢迎转载.转载请注明:关东升的博客分支语句又称条件语句,Swift编程语言提供了if.switch和guard三种分支语句. if语句由if语句引导的选择结构有if结构.i ...

visual studio-c#+wpf怎么做出”以项目管理文件“的功能

问题描述 c#+wpf怎么做出"以项目管理文件"的功能 visual studio和netbeans这两个编程软件,虽然有很大的不同. 它们两个都有一个相似的功能:**操纵项目** ...

Go语言创建、初始化数组的常见方式汇总_Golang

本文实例总结了Go语言创建.初始化数组的常见方式.分享给大家供大家参考.具体分析如下: Go语言的语法很灵活,以下展示了创建并初始化数组的多种方式: 复制代码代码如下: //数组初始化的各种方式 ...

本地二级域名配置方法_win服务器

首选:(当然你本地得先安装有IIS) 打开IIS,右键"默认网站" - "属性" 弹出属性对话框选择"主目录"标签将"本地路径 ...

linux 模块编译步骤

本文将直接了当的带你进入linux的模块编译.当然在介绍的过程当中,我也会添加一些必要的注释,以便初学者能够看懂.之所以要写这篇文章,主要是因为从书本上学的话,可能要花更长的时间才能学会整个过程,因为 ...

网站FLASH内容与SEO的风风雨雨

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 FLASH即网站上显示出来的动画, ...

使用easeUI的 charFragment 的问题

问题描述 1.我发消息一直发布出去,说无网络连接,但是我的网络都是好的解决方案将log日志截图看一下.

因爱不成生怨恨，发微博制造谣言报复意中人

一男子因爱不成生怨恨,发微博制造谣言报复意中人.他以"爱不能结冰"的网名连续http://www.aliyun.com/zixun/aggregation/549.html&quo ...

用vbs实现的一款Worm.Win32.VB.fw病毒专杀_vbs

在写了<Worm.Win32.VB.fw分析与清除方案>后,也没想到要写什么专杀,不过这些天好多同学都说中了这只病毒,我要是一个一个去解决,非忙死我不可!感染范围挺大的!我之前写了一篇&l ...

yii的CURD（创建、修改、读取、删除）操作

一.查询数据集合 1.$admin=Admin::model()->findAll($condition,$params);该方法是根据一个条件查询一个集合,如: findAll('usern ...

热搜