《Hadoop实战第2版》——2.5节日志分析及几个小技巧

2.5　日志分析及几个小技巧
如果大家在安装的时候遇到问题，或者按步骤安装完成却不能运行Hadoop，那么建议仔细查看日志信息。Hadoop记录了详尽的日志信息，日志文件保存在logs文件夹内。
无论是启动还是以后会经常用到的MapReduce中的每一个Job，或是HDFS等相关信息，Hadoop均存有日志文件以供分析。
例如：NameNode和DataNode的namespaceID不一致，这个错误是很多人在安装时都会遇到的。日志信息为：

java.io.IOException: Incompatible namespaceIDs in /root/tmp/dfs/data:namenode namespaceID = 1307672299; datanode namespaceID = 389959598

若HDFS一直没有启动，读者可以查询日志，并通过日志进行分析，日志提示信息显示了NameNode和DataNode的namespaceID不一致。
这个问题一般是由于两次或两次以上格式化NameNode造成的，有两种方法可以解决，第一种方法是删除DataNode的所有资料，第二种方法就是修改每个DataNode的namespaceID（位于/dfs/data/current/VERSION文件中）或修改NameNode的namespaceID（位于/dfs/name/current/VERSION文件中）。使其一致。
下面这两种方法在实际应用也可能会用到。
1）重启坏掉的DataNode或JobTracker。当Hadoop集群的某单个节点出现问题时，一般不必重启整个系统，只须重启这个节点，它会自动连入整个集群。
在坏死的节点上输入如下命令即可：

bin/Hadoop-daemon.sh start datanode
bin/Hadoop-daemon.sh start jobtracker

2）动态加入DataNode或TaskTracker。下面这条命令允许用户动态地将某个节点加入到集群中。

bin/Hadoop-daemon.sh --config ./conf start datanode
bin/Hadoop-daemon.sh --config ./conf start tasktracker

时间： 2024-10-26 09:38:10

《Hadoop实战第2版》——2.5节日志分析及几个小技巧

《Hadoop实战第2版》——2.5节日志分析及几个小技巧的相关文章

《Hadoop实战第2版》——导读

《Hadoop实战第2版》——2.1节在Linux上安装与配置Hadoop

《Hadoop实战第2版》——1.1节什么是Hadoop

《Hadoop实战第2版》——3.2节MapReduce计算模型

《Hadoop实战第2版》——2.4节安装和配置Hadoop集群

《Hadoop实战第2版》——1.2节Hadoop项目及其结构

《Hadoop实战第2版》——3.4节Hadoop流

《Hadoop实战第2版》——2.2节在Mac OSX上安装与配置Hadoop

《Hadoop实战第2版》——1.6节Hadoop数据管理