Hadoop从入门到精通之如何从Hadoop1.x转到Hadoop2.x

Hello 大家好，我是stefan，今天来和大家分享下如何将Hadoop1.x迁移至Hadoop2.x。这篇博文提供了将Hadoop MapReduce应用从Hadoop1.x迁移到Hadoop2.x的方法。

&">nbsp;

在2.x的版本中，apache将resource management剥离出来集成到Hadoop YARN里了，目的在于将application management框架分开使得MapReduce依然是一个纯粹的分布式计算框架。

一般情况下，由于早版本的MapReduce在新的框架（YARN）设计时被尽量重用了，因此YARN对MRv1保持向下兼容。不过由于一些改进和代码重构，少部分API借口提供了向后兼容。

1、对二进制程序的兼容性

首先，我们要确保使用旧mapred的API的应用程序二进制兼容性。也就是说用MRv1构建的应用不需要重新编译，就可以跑在YARN上。只需要通过配置来将应用程序部署到Hadoop2.x的集群上。

2、源代码兼容性

我们不能完全确保二进制程序兼容性由于上一个版本到现在YARN版本已经改进了很多地方。但是我们可以确保用YARN版本的MapReduce重新编译的程序是稳定的。所以大家最好用新的api重新编译一下自己的程序。

3、不支持的东西

MRAdmin在YARN版中已经被删除，因为mradmin命令不存在了。YARN中用rmadmin中的命令替代了他。如果直接使用这个类的应用不管是二进制程序还是源代码都会出错。

4、MRv1用户和YARN用户之间的平衡

可惜完美的兼容是不存在的，保持对MRv1的二进制程序的兼容会导致早起MRv2的二进制程序的不兼容问题，特别是0.23版本的用户（尽量不要使用这个版本咯）。对于MapReduce的api我们兼容MRv1的应用程序，因为用户群比较广泛，下表是Hadoop0.23中不兼容api的列表：

Problematic FunctionIncompatibility Issueorg.apache.hadoop.util.ProgramDriver#driveReturn type changes from void to intorg.apache.hadoop.mapred.jobcontrol.Job#getMapredJobIDReturn type changes from String to JobIDorg.apache.hadoop.mapred.TaskReport#getTaskIdReturn type changes from String toTaskIDorg.apache.hadoop.mapred.
ClusterStatus#UNINITIALIZED_MEMORY_VALUEData type changes from long to intorg.apache.hadoop.mapreduce.filecache.DistributedCache#getArchiveTimestampsReturn type changes from long[] toString[]org.apache.hadoop.mapreduce.filecache.DistributedCache#getFileTimestampsReturn type changes from long[] toString[]org.apache.hadoop.mapreduce.Job#failTaskReturn type changes from void to booleanorg.apache.hadoop.mapreduce.Job#killTaskReturn type changes from void to booleanorg.apache.hadoop.mapreduce.Job#getTaskCompletionEventsReturn type changes fromo.a.h.mapred.TaskCompletionEvent[] too.a.h.mapreduce.TaskCompletionEvent[]

注意事项：如果想在YARN上运行Hadoop-examples-1.x.x.jar（之前版本的示例代码），那么可以去MapReduce文件夹下运行hadoop-mapreduce-examples-2.x.x.jar。
默认下Hadoop 框架的jar包在classpath中出现在用户jar包的前面，使得2.x.x的jar包会始终被获取到。用户需要将hadoop-mapreduce-examples-2.x.x.jar从集群中的所有节点的classpath中去除掉。或者我们可以设置HADOOP_USER_CLASSPATH_FIRST=true 并且 HADOOP_CLASSPATH=...:hadoop-examples-1.x.x.jar来运行我们自己的jar包，并且在mapred-site.xml中加入下面的配置项来使得YARN容器也选择我们自己的jar包。

<property> <name>mapreduce.job.user.classpath.first</name> <value>true</value> </property>

好了今天的Hadoop讲解就到这里，转载请注明出处：http://blog.csdn.net/guoshenglong11/article/details/22728223，欢迎大家关注我的博客。

时间： 2024-10-24 01:07:07

Hadoop从入门到精通之如何从Hadoop1.x转到Hadoop2.x的相关文章

干货|大数据Hadoop快速入门教程

1.Hadoop生态概况 Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠.高效.可伸缩的特点. Hadoop的核心是YARN,HDFS,Mapreduce,常用模块架构如下 2.HDFS 源自谷歌的GFS论文,发表于2013年10月,HDFS是GFS的克隆版,HDFS是Hadoop体系中数据存储管理的基础,它是一个高度容错的系统,能检测和应对硬件故障 HDFS简化了文件一致性

Hadoop快速入门

目的这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等. 先决条件支持平台GNU/Linux是产品开发和运行的平台. Hadoop已在有2000个节点的GNU/Linux主机组成的集群系统上得到验证. Win32平台是作为开发平台支持的.由于分布式操作尚未在Win32平台上充分测试,所以还不作为一个生产平台被支持. 所需软件 Linux和Windows所需软件包括

给hadoop新手的一封信：Hadoop入门自学及对就业的帮助

晚上整理邮箱,找到了一封之前网友的关于hadoop学习的来信以及我的回信,我想应该对初学者会有帮助,就贴出来给大家看看! 提问: 你好: 我是今年年初的时候就像学习hadoop来着,但是中间有段时间去学习了手机android开发.耽误一段时间. 最近这不才刚跟你联系上.现在我还是有很多疑问. 1.我学完,做两个例子基本达到入门程度.找工作容易嘛? 2.我刚进公司的话是直接加入到hadoop的项目吗? 2.工作待遇工资怎么样.我做了快两年的java web开发. 3.我现在还上着班,学习只能说是周

Hadoop:pig 安装及入门示例

pig是hadoop的一个子项目,用于简化MapReduce的开发工作,可以用更人性化的脚本方式分析数据. 一.安装 a) 下载从官网http://pig.apache.org下载最新版本(目前是0.14.0版本),最新版本可以兼容hadop 0.x /1.x / 2.x版本,直接解压到某个目录即可. 注:下面是几个国内的镜像站点 http://mirrors.cnnic.cn/apache/pig/ http://mirror.bit.edu.cn/apache/pig/ http://mi

Hadoop社区版搭建

1.环境准备 1.1 硬件配置设备名参数数量 6台系统 centos6.5 内存 64G 硬盘 320T/台 CPU 8核/台 1.2 软件版本 Hadoop-2.x 下载地址 JDK1.7 下载地址至此搭建Hadoop集群的条件准备OK了. 2.创建Hadoop用户在管理Hadoop集群时,不推荐使用root用户去操作,我们可以通知运维,叫他创建一个hadoop用户去专门用于维护和管理集群. useradd hadoop passwd hadoop 同时通知运维给hado

集群-Hadoop 如何将结果分配到指定的机器上去？

问题描述 Hadoop 如何将结果分配到指定的机器上去? 如题,比如reduce结果有10个block,集群有3台slaves,我想把part-00000到part-00003放在一台机器上,把part-00004到part-00006放到一台机器上,剩下的放到另外一台机器上,求大神解决,多谢!!!!!!!!! 解决方案 http://bbs.csdn.net/topics/391927191 解决方案二: Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于

Ubuntu上搭建Hadoop环境(伪分布式)

首先要了解一下Hadoop的运行模式: 单机模式(standalone) 单机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置.在这种默认模式下所有3个XML文件均为空.当配置文件为空时,Hadoop会完全运行在本地.因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程.该模式主要用于开发调试MapReduce程序的应用逻辑. 伪分布模式(Pseudo-Distributed

一张图测试你的Hadoop能力-Hadoop能力测试图谱

1.引言看到一张图,关于Hadoop技术框架的图,基本上涉及到Hadoop当前应用的主要领域,感觉可以作为测试Hadoop开发人员当前能力和水平的比较好的一个工具,特此分享给大家.如果你能够明白说出每一个技术框架的功能.应用场景和设计架构,那么恭喜你,已经正式步入Hadoop应用开发的世界了. 2.Hadoop菜鸟入门测试 3.评分标准第一档菜鸟初级(门外汉) 1-7 不及格第二档菜鸟8+X段,每答对一个,加一段 8-10 及格第三档见习Hadoop工程师 11-13 第四档

Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

25.集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有NameNode / DataNode YARN集群: 负责海量数据运算时的资源调度,集群中的角色主要有 ResourceManager /NodeManager 25.1.2服务器准备本案例使用虚拟机服务器来搭建HADOOP集群,所用软件及版本: ü Vmware 11.

猜你喜欢

图解pfSense软路由系统的使用（NAT功能）

pfsense是一款开源的路由和防火墙产品,它基于freebsd系统定制和开发.pfsene拥有友好的web的配置界面,且具有伸缩性强又不失强大性能,在众多开源网络防火墙中属于佼佼者. 2004年,p ...

Asp.net中使用母版页

一先创建母版页,然后给母版页用css布局,给母版页也布局和给普通页面布局是一样的 <head runat="server"> <link hre ...

ASP.NET与硬件打交道的项目解决方案

前些日子作了这么一个项目,用户提出的需求是远程控制Led显示屏的功能,所谓Led显示屏,就是大家经常在银行,火车站看到的超大的那种显示屏. 由于以前没弄过和硬件打交道的项目,并且是BS的,项目也比较突 ...

用ROUTER做DHCP服务器

服务器 ! hostname Router ! ! ip subnet-zero ip dhcp excluded-address 172.16.240.1 172.16.240.10 ip dhcp ...

JavaScript判断Form中的Radio是否有未选中的

javascript|选中 function getCheckedValue(radioObj) ...{ if(!radioObj) return ""; ...

DIV CSS网页布局实例：十步学会用CSS建站

css|网页 Update:本篇已得到原作者Steve Dennis的翻译准予,在此Jorux表示感谢! 本教程主要参考Creating a CSS Layout from scratch,由Joru ...

日期值的计算

using System; namespace CNCalendar { public class CNDate { private const ushort START_YEAR = 1901; p ...

路由器通过NVI解决内网访问内部服务器的外部映射地址测试

一.测试拓扑: 参照:https://supportforums.cisco.com/message/3648386#3648386 据说是12.3(14)T 的IOS才开始有的功能: http:// ...

PPT XP的动画功能

要说Office XP的功能与它的前任Office 2000相比最显著的进步是什么?我一定会毫不犹豫地说在PowerPoint XP上.多年来出于工作的需要,我与PowerPoint XP以前的各个版 ...

jquery animate实现鼠标放上去显示离开隐藏效果

本文为大家介绍下使用jquery animate实现鼠标放上去显示,离开就隐藏的效果,感兴趣的朋友可以参考下哈,希望对大家有所帮助 1.CSS样式: 复制代码代码如下: @CHARSET &qu ...

excel计算男女人数

假设,A列数据,保存的就是男或者是女这样的性别,下面,如何能计算出男女的人数呢? 假设保存男女信息的数据范围是:A1:A12 那么: ①计算男性别的人数 =COUNTIF(A1:A12," ...

javascript判断css3动画结束 css3动画结束的回调函数

本文主要给大家介绍的是如何使用javascript判断CSS3动画效果结束,主要是使用了javascript的回调函数,其思路是一旦动画或变换结束,回调函数就会触发.不再需要大型类库支持,非常的简单 ...

Win8.1桌面路径怎么修改

第一步:首先从Win8.1传统桌面进入"这台电脑(计算机),如下图所示: 第二步:进入这台电脑后,我们再进入系统C盘,然后依次进入"用户".系统账号文件夹,然后在里面 ...

usb鼠标和键盘无法识别问题如何解决

usb鼠标和键盘无法识别问题如何解决?usb鼠标无法识别总是让人非常恼火,具体就是插入键盘后电脑检测不到.我们可以插入USB鼠标试试看,如果还是检测不到的话,那只能说明是电脑出问题了,我们需要US ...

软键盘-Android webview的edittext

问题描述 Android webview的edittext Android webview的edittext 未输入文本时被软键盘遮挡,输入文本后软键盘能把输入框顶上去,怎么做到点一下输入框直接把输入 ...

用MapXtreme时,碰到标注点的位图颜色问题,HELP!

问题描述谁用过MapXtreme,请教个问题:现在要往地图上加上标注点,要想让标注点的位图不设什么颜色,怎么弄?现在默认是红色.下面是对应的代码.//增加标注ArrayListarStyles=ne ...

linux之select函数用法详解

select系统调用是用来让我们的程序监视多个文件句柄(file descriptor)的状态变化的.程序会停在select这里等待,直到被监视的文件句柄有某一个或多个发生了状态改变. 何为文件句 ...

ajax-多说、友言之类的社会化评论是靠什么技术实现的呢？

问题描述多说.友言之类的社会化评论是靠什么技术实现的呢? php+ajax可以吗?还要用到什么其他技术吗? php+ajax可以吗?还要用到什么其他技术吗? php+ajax可以吗?还要用到什么其他 ...

qtcreator使用sunpinyin无法用快捷键切换中英文

问题描述 qtcreator使用sunpinyin无法用快捷键切换中英文 qtcreator3.5.1qt5.5使用sunpinyin,无法用设置好的快捷键比如shift切换中英文解决方案补充一下 ...

想问一下关于arduino和传感器控制的问题～～～～

问题描述想问一下关于arduino和传感器控制的问题---- 想问可以用传感器控制视频播放进度条吗---视频随着人走播放-- 谢谢呀^-^ 解决方案 int position = mediaPlay ...

snort 的 TCP Stream reassembly 模块源码？

问题描述 TCPStreamreassembly是snort预处理中stream5的一部分,按理说这块应该由两块组成:流监视.流重组.通过学习代码,我发现流的监视部分调用是在detect.c文件的Pr ...

《HTML5 开发实例大全》——1.3 使用HTML 5的新元素对页面进行分栏设计

1.3 使用HTML 5的新元素对页面进行分栏设计实例说明本实例的目的是编写一段基本的HTML 5程序,将页面内容实现分栏显示.分栏功能是页面布局的基础,本实例将页面分为上.下.中3个部分.在大多 ...

private Dictionary&amp;lt;string, PluginEngine.ICommand&amp;gt; _CommandCol = null;怎么在c++MFC实现

问题描述 vs2010C#中privateDictionary<string,PluginEngine.ICommand>_CommandCol=null;到了VS平台托管的c++MFC中 ...

小菜一步一步学数据结构之(四)单链表

上一篇博客学习了顺序表,最后也说明了顺序表属于静态存储,数据元素的个数不能自由的扩充.为了解决这个问题我们引入了链表链表存储结构结点在存储器中的位置是任意的,即逻辑上相邻的数据元素在物理上不一定相 ...

和付速贷怎么申请?和付速贷怎么弄?

和付速贷怎么样和付速贷好下款吗您只需要填写完整您真实的工作信息,婚姻信息,学历信息,联系人信息即可完成贷款申请,资料不多,务必真实借款人的借款申请通过审核之后,最快30分钟下款和付速贷怎么样 ...

律师称团宝后备公司有权使用“团宝”字样

[亿邦动力网讯]2月1日消息,有业内人士爆料,称团宝网CEO任春雷曾注册另一家团宝电子商务有限公司,以备团宝网破产后规避债务风险,东山再起之用.为此,亿邦动力网联系到北京尚公律师事务所陈海阳律师,陈海 ...

Myeclipse改变J2EE的Libraries

右击项目-->Build Path-->add libraries-->MyEclipse Libraries 这个时候你就可以找需要的jar包啦,如J2EE 5 Lib ...

单片机-数码管显示数字的时候有重影要怎么去掉

问题描述数码管显示数字的时候有重影要怎么去掉在做电子钟的时候,每次时间变化的时候,数字就会有重影,怎么去掉,让她完全显示数字解决方案在每次显示之前做一个全部暗的动作,说白了就是刷新啊解决方案 ...

腾讯大股东Naspers称无意购ICQ对其不感兴趣

11月27日消息,据彭博社报道,非洲第一大传媒公司Naspers CEO库斯·拜克尔(Koos Bekker)今天表示,该公司没有就收购ICQ即时通讯服务与AOL接触. 拜克尔在接受电话采访时说,&q ...

雅虎开发通过摄像头和麦克风捕捉人们想法的“智能”广告牌

通过街道上或巴士中内置摄像头和麦克风的"智能"广告牌,扫描一天下来人们的想法,雅虎将开发出更加个性化的智能广告牌.据周四披露的专利申请,水星报(The Mercury News)的 ...

热搜

Hadoop从入门到精通之 如何从Hadoop1.x转到Hadoop2.x

Hadoop从入门到精通之 如何从Hadoop1.x转到Hadoop2.x的相关文章

Hadoop从入门到精通之如何从Hadoop1.x转到Hadoop2.x

Hadoop从入门到精通之如何从Hadoop1.x转到Hadoop2.x的相关文章