《Hadoop MapReduce实战手册》一1.7 HDFS的基本命令行文件操作

Hadoop MapReduce实战手册
HDFS是一个分布式的文件系统，就像一个Unix文件系统一样，它允许用户使用shell命令操纵文件系统。本节将说明如何使用HDFS的基本命令行来执行这些操作。

值得注意的是，每一条HDFS命令都有一个与之一一对应的Unix命令。例如，下面的命令：

>hadoopdfs –cat /data/foo.txt

该命令用于读取/data/foo.txt文件，并把它打印到屏幕上，就像Unix系统的cat命令一样。

准备工作
通过以下安装HDFS的攻略，启动HDFS服务器。

操作步骤

>bin/hadoopdfs -mkdir /test

>bin/hadoopdfs -ls /

>bin/hadoopdfs -put README.txt /test

>bin/hadoopdfs -ls /test

Found 1 items
-rw-r--r-- 1 srinathsupergroup　　 1366 2012-04-10 07:06 /
test/README.txt

>bin/hadoopdfs -get /test/README.txt README-NEW.txt

工作原理
当命令发出后，客户端将代表用户与HDFS NameNode通信，并执行相关操作。通常，我们使用以/开头的路径来引用文件或文件夹，如/data，客户端将根据HADOOP_HOME/conf目录中的配置项来选择NameNode。

然而，如果需要的话，我们可以使用一个完全限定路径来强制客户端跟一个特定的NameNode进行通信。例如，hdfs://bar.foo.com:9000/data，会要求客户端与运行在bar.foo.com主机9000端口上的NameNode进行通信。

更多参考
HDFS支持大多数的Unix命令，如cp、mv和chown，它们与上面讨论的命令一样，遵循相同的模式。文档http://hadoop.apache.org/docs/r1.0.3/file_system_shell.html提供了所有支持命令的列表。我们将在本书中通篇使用这些命令。

时间： 2024-11-08 17:11:56

《Hadoop MapReduce实战手册》一导读