Incompatible namespaceIDs或连接被对端重置异常的解决

Workaround 1: Start from scratch

I can testify that the following steps solve this error, but the side effects won't make you happy (me neither). The crude workaround I have found is to:

1.     stop the cluster

2.     delete the data directory on the problematic datanode: the directory is specified by dfs.data.dir in conf/hdfs-site.xml; if you followed this tutorial, the relevant directory is /usr/local/hadoop-datastore/hadoop-hadoop/dfs/data

3.     reformat the namenode (NOTE: all HDFS data is lost during this process!)

4.     restart the cluster

When deleting all the HDFS data and starting from scratch does not sound like a good idea (it might be ok during the initial setup/testing), you might give the second approach a try.

Workaround 2: Updating namespaceID of problematic datanodes

Big thanks to Jared Stehler for the following suggestion. I have not tested it myself yet, but feel free to try it out and send me your feedback. This workaround is "minimally invasive" as you only have to edit one file on the problematic datanodes:

1.     stop the datanode

2.     edit the value of namespaceID in <dfs.data.dir>/current/VERSION to match the value of the current namenode

3.     restart the datanode

If you followed the instructions in my tutorials, the full path of the relevant file is /usr/local/hadoop-datastore/hadoop-hadoop/dfs/data/current/VERSION (background: dfs.data.dir is by default set to ${hadoop.tmp.dir}/dfs/data, and we set
hadoop.tmp.dir to /usr/local/hadoop-datastore/hadoop-hadoop).

If you wonder how the contents of VERSION look like, here's one of mine:

#contents of <dfs.data.dir>/current/VERSION

namespaceID=393514426

storageID=DS-1706792599-10.10.10.1-50010-1204306713481

cTime=1215607609074

storageType=DATA_NODE

layoutVersion=-13

 

原因:每次namenode format会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有晴空datanode下的数据,导致启动时失败,所要做的就是每次fotmat前,清空tmp一下 的所有目录.

时间: 2024-10-02 20:45:11

Incompatible namespaceIDs或连接被对端重置异常的解决的相关文章

webrtc建立连接,对端无法接收视频流

问题描述 webrtc建立连接,对端无法接收视频流 通过webkitRTCPeerConnection创建实例调用addStream对端无法接收到,回调函数onaddStream没有调用,怎么解决?其他信令交换都正常

android通过mina长连接与服务端通信

问题描述 android通过mina长连接与服务端通信 由于项目要求,android与服务端交互方式通过socket长连接,目前自己已经能够搭建个简单的客户端,并 接收到服务端的消息.现在的问题是在如何在不同的activity中获得messageReceived方法中接收到的消息. 解决方案 你的业务是什么~ 每台理解 你的问题

sql server 2008-SQL Server 2008客户端无法连接到服务端

问题描述 SQL Server 2008客户端无法连接到服务端 客户端之前可以连接到服务器,后来不知道什么原因,无法连接数据库,出现与网络特定的问题(provider:命名管道提供程序,error40-无法打开到 SQL Server 的连接)),但是其他机器可以连接服务器(说明服务都已经打开),而且我的机器可以ping通服务器, 不知道是什么问题? 解决方案 provider:命名管道提供程序,error40 这说明你在用管道连接sql而不是网络方式.但是管道显然只对本机有效.所以你的连接字符

websphere-搭建客户端,通过互联网建立MQ连接访问服务端

问题描述 搭建客户端,通过互联网建立MQ连接访问服务端 如题,别人在一边使用IBM 的MQ搭建了一个服务端,给我提供了队列名称和ip地址, 现在需要我搭建一个客户端和对面的建立MQ连接来传输消息,我个人之前没有接触过 这方面的内容,所以想请求大家帮忙请教一下需要用到什么工具,怎样去搭建,谢谢大家了! 附:从网上看了一点概念,提到Websphere MQ 解决方案 http://kakajw.iteye.com/blog/1829684 解决方案二: Bluemix结合RabbitMq实现消息发送

win7无线连接后显示有限访问权限怎么解决

win7无线连接后显示有限访问权限怎么解决   无线连接后显示有限访问权限解决方法: 1.首先鼠标点击开始图标,选择控制面板,如图所示: 2.弹出控制面板窗口后,以大图标查看方式找到设备管理器并将其打开, 3.此时调出设备管理器窗口,我们打开网络适配器并选择带有wireless的配置 4.最后找到802开头的属性,在右侧的值改为Long and Short并点击确定即可

win8.1连接蓝牙鼠标显示输入码无效怎么解决

win8.1连接蓝牙鼠标显示输入码无效怎么解决   1.首先按组合键win+r打开运行窗口,输入services.msc并回车,如图所示: 2.调出服务窗口之后,在服务列表中找到bluetooth support service选项,双击打开该服务,如图所示: 3.随后在启动类型中选择"自动"然后点击应用,并启动服务后确定,如图所示: 4.在操作过程中请按住底部的蓝牙按钮,电脑输入配对码等待连接的时候请一直按住鼠标底部的蓝牙按钮,然后尝试是否能够连接上.

无线网络连接不上怎么回事,如何解决

无线网络连接不上怎么回事,如何解决,很多电脑用户可能会遇到这个问题. 一:先检查下你的无线网络开关是否打开,没打开请打开 二:检查你的无线网络是否有信号 三:检查无线网络是否有密码,你的密码是否正确 四:看看是不是需要设置ip 五:mac是不是需要绑定. 六:防火墙有没有屏蔽网络 基本以上几个原因解决了,应该上网就正常了,祝各位好运.

WIN7系统网络故障 本地连接没有有效的ip配置的解决办法

最近笔者从各大IT论坛了解到大量网民遇到了这样一个网络问题,电脑无法连接网络,使用自带网络诊断工具诊断提示:"本地连接没有有效的ip配置"这种网络故障多数是出在使用路由器共享上网的windows 7操作系统中,windows 7系统是目前最主流的操作系统,之前也遇到过不少网络故障,不过只要大家熟悉windows 7系统,对于解决类似本地连接没有有效的ip配置错误提示故障一般可以迎韧解决. 网络诊断提示"本地连接没有有效的ip配置"故障遇到网络诊断提示"本地

Win8.1通过手机连接WiFi热点会发生蓝屏的解决办法

Win8.1通过手机连接WiFi热点会发生蓝屏的解决办法   原因分析: Intel 的网卡驱动中的无线信号传输协议(802.11n模式)与某些手机WIFI热点的信号模式冲突导致,与无线网卡驱动的版本没多少关系. 解决方法: 1.在"设备管理器"中找到无线网卡"属性"中"高级"下"802.11n模式"的值改为"已禁用"; 2.保存后重启网卡即可解决.