hadoop 平台搭建

问题描述

Hadoop的下载地址：http://www.apache.org/dyn/closer.cgi/hadoop/core/版本：hadoop0.17.1JDK的安装：要求必须安装jdk1.5.07以上的版本。分步式环境的搭建：1、硬件环境我们采用了3台机器来构建,都安装的是RedHat4.1.2-42系统，并且都有一个名为“mingjie“的帐号，如下：主机名称：hdfs1ip:192.168.0.221功能：NameNode,JobTracker主机名称：hdfs2ip:192.168.0.227功能：DataNode,TaskTracker主机名称：hdfs3ip:192.168.0.228功能：DataNode,TaskTracker重点：修改3台机器的/etc/hosts,让彼此的主机名称和ip都能顺利解析127.0.0.1localhost192.168.0.37hdfs1192.168.0.43hdfs2192.168.0.53hdfs32、每台机器都要安装java环境，我们的路径统一为“/opt/modules/jdk1.6“,并添加到系统环境变量sudovi/etc/profileJAVA_HOME=/opt/modules/jdk1.6PATH=$JAVA_HOME/bin:$PATH:$CATALINA_HOME/binCLASSPATH=$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/tools.jarexportJAVA_HOME3、下载hadoop0.17.1，将hadoop解压到/home/mingjie/,建议最好也将hadoop的目录添加到环境变量里面去:HADOOP_HOME=/home/mingjie/hadoop-0.17.1#这是hadoop的主目录exportHADOOP_HOMEHADOOP_CONF_DIR=$HADOOP_HOME/conf#这是hadoop的配置文件目录exportHADOOP_CONF_DIRHADOOP_LOG_DIR=/home/mingjie/hadoop-0.17.1/log＃存放运行日志目录exportHADOOP_LOG_DIRexportPATH=$PATH:$HADOOP_HOME/bin4、安装ssh,并生成公钥和私钥运行ssh-keygen-trsa，根据屏幕提示直接选择“回车”会在用户目录~/.ssh/产生两个文件，id_rsa，id_rsa.pubcat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys以上配置完成后，执行一下sshlocalhsot,确认你的每台机器都可以使用ssh5、将master服务器上的authorized_keys的内容加到slave两台机器的authorized_keys文件中。让master也可以不需要密码访问2台slave服务器。sudoscpauthorized_keyshdfs2:/home/mingjie/.ssh/sudoscpauthorized_keyshdfs3:/home/mingjie/.ssh/sshhdfs2sshhdfs36、接下来，我们要修改hadoop的[conf/masters]、[conf/slaves]这2个文件：Master设置(<HADOOP_HOME>/conf/masters):hdfs1Slave设置(<HADOOP_HOME>/conf/slaves):hdfs2hdfs37、修改［conf/hadoop-env.sh］：exportJAVA_HOME=/opt/jdk1.6.0_038、修改［conf/hadoop-site.xml],这里只是几个常用的属性配置，有关hadoop的性能优化调整，需要研究hadoop-default.xml:<configuration><property><name>fs.default.name</name>//你的namenode的配置，机器名加端口<value>hdfs://hdfs1:54310/</value></property><property><name>mapred.job.tracker</name>//你的JobTracker的配置，机器名加端口<value>hdfs://hdfs1:54311</value></property><property><name>dfs.replication</name>//数据需要备份的数量，默认是三<value>1</value></property><property><name>hadoop.tmp.dir</name>//Hadoop的默认临时路径，这个最好配置，如果在新增节点或者其他情况下莫名其妙的DataNode启动不了，就删除此文件中的tmp目录即可。不过如果删除了NameNode机器的此目录，那么就需要重新执行NameNode格式化的命令。<value>/home/mingjie/hadoop-0.17.1/tmp/</value></property><property><name>mapred.child.java.opts</name>//java虚拟机的一些参数可以参照配置<value>-Xmx512m</value></property><property><name>dfs.block.size</name>//block的大小，单位字节，后面会提到用处，必须是512的倍数，因为采用crc作文件完整性校验，默认配置512是checksum的最小单元。<value>5120000</value><description>Thedefaultblocksizefornewfiles.</description></property></configuration>9、然后将hadoop的整体环境拷贝到hdfs2、hdfs3上面去scp-r/home/mingjie/hadoop.0.17.1hdfs2:/home/mingjie/hadoop.0.17.1scp-r/home/mingjie/hadoop.0.17.1hdfs3:/home/mingjie/hadoop.0.17.110、在hdfs1这个namenode上面格式化一个新的分布式文件系统HDFS，就是hadoop-site.xml文件中指定的hadoop.tmp.dir路径<HADOOP_HOME>/bin/hadoopnamenode–format到此大致上就完成了hadoop环境布署启动hadoop：<HADOOP_HOME>/bin/start-all.sh停止hadoop：<HADOOP_HOME>/bin/stop-all.sh说明：(1)执行启动Hadoop进程后，在master服务器会启动3个java进程,分别的NameNode,SecondNameNode,JobTracker,在LOG目录下会产生2个文件，分别对应NameNode的运行日志和JobTracker的运行日志，在slave服务器会启动2个java进程，分别为DataNode,TaskTracker，,在LOG目录下会产生2个文件，分别对应DataNode的运行日志和TaskTracker的运行日志，可以通过查看日志分析hadoop的启动是否正确。(2)通过IE浏览分布式文件系统中的文件访问http://hdfs1:50030可以查看JobTracker的运行状态。访问http://360quan-1:50060可以查看TaskTracker的运行状态。访问http://360quan-1:50070可以查看NameNode以及整个分布式文件系统的状态。

解决方案

解决方案二：
楼主辛苦了，够了吧
解决方案三：
挺好的，支持搬运：）
解决方案四：
挺好的，支持搬运!
解决方案五：
谢谢你，学习了

时间： 2024-12-03 20:43:39

hadoop 平台搭建的相关文章

高可用Hadoop平台－HBase集群搭建

1.概述今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建单点问题验证截图预览那么,接下来我们开始今天的HBase集群搭建学习. 2.基础软件的准备由于HBase的数据是存放在HDFS上的,所以我们在使用HBase时,确保Hadoop集群已搭建完成,并运行良好.若是为搭建Hadoop集群,请参考我写的<配置高可用的Hadoop平台>来完成Hadoop平台的搭建.另

优酷数据架构师：搭建Hadoop平台三步走

文章讲的是优酷数据架构师:搭建Hadoop平台三步走,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)将于北京福朋喜来登集团酒店隆重举行.届时,来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. ▲点击进入Haoop中国技术峰会 Haoop中国技术峰会由

windows平台搭建hadoop的一些问题（eclipse）

问题描述 windows平台搭建hadoop的一些问题(eclipse) 小生最近在windows上搭建hadoop,按照官网的教程,应该是搭建起来了(单节点):可以创建和删除hdfs上的文件,在eclipse里面也可以看到hdfs,如果我添加文件,eclipse里也会跟着更新,所以我觉得应该是搭建起来了,如果不是求大神指导. 问题是:在eclipse里我编写了wordcount代码(应该不会错的,我照着书上编的,是0.20.0版),然后使用run configurations设置Argumen

基于Hadoop的云计算试验平台搭建研究

基于Hadoop的云计算试验平台搭建研究张岩郭松赵国海 Hadoop是一个免费的开源云平台,是允许在集群计算机上分布式处理大数据的软件框架.它是一种可靠.高效.可伸缩的云平台,很适合在实验室环境下进行模拟测试.以Hadoop为基础,借助虚拟机VMware以及Linux.ubuntu.Hadoop.java-jdk等软件,详细地介绍了单机环境下的虚拟云平台搭建过程,并给出具体的实例搭建过程.在设计实例中详细的论述了虚拟机.java.Hadoop等软件的安装.设置.测试过程.实现了在实验室环境

高可用Hadoop平台－启航

1.概述在上篇博客中,我们搭建了<配置高可用Hadoop平台>, 接下来我们就可以驾着Hadoop这艘巨轮在大数据的海洋中遨游了.工欲善其事,必先利其器.是的,没错:我们开发需要有开发工具(IDE):本篇文章, 我打算讲解如何搭建和使用开发环境,以及编写和讲解WordCount这个例子,给即将在Hadoop的海洋驰骋的童鞋入个门.上次,我在<网站日志统计案例分析与实现>中说会将源码放到Github,后来,我考虑了下,决定将<高可用的Hadoop平台>做一个系列,后面基

高可用Hadoop平台－集成Hive HAProxy

1.概述这篇博客是接着<高可用Hadoop平台>系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具,下面我打算分以下流程来赘述: 环境准备集成并配置 Hive 工具使用 Java API 开发 Hive 代码下面开始进行环境准备. 2.环境准备 Hive版本:<Hive-0.14> HAProxy版本:<HAProxy-1.5.11> 注:前提是 Hadoop 的集群已经搭建完成,若还没

高可用Hadoop平台－实战尾声篇

1.概述今天这篇博客就是<高可用Hadoop平台>的尾声篇了,从搭建安装到入门运行 Hadoop 版的 HelloWorld(WordCount 可以称的上是 Hadoop 版的 HelloWorld ),在到开发中需要用到的各个套件以及对套件的安装使用,在到 Hadoop 的实战,一路走来我们对在Hadoop平台下开发的基本流程应该都熟悉了.今天我们来完成在高可用Hadoop平台开发的最后一步,导出数据. 2.导出数据目的首先,我来说明下为什么要导出数据,导出数据的目的是为了干嘛? 我们

高可用Hadoop平台－Flume NG实战图解篇

1.概述今天补充一篇关于Flume的博客,前面在讲解高可用的Hadoop平台的时候遗漏了这篇,本篇博客为大家讲述以下内容: Flume NG简述单点Flume NG搭建.运行高可用Flume NG搭建 Failover测试截图预览下面开始今天的博客介绍. 2.Flume NG简述 Flume NG是一个分布式,高可用,可靠的系统,它能将不同的海量数据收集,移动并存储到一个数据存储系统中.轻量,配置简单,适用于各种日志收集,并支持Failover和负载均衡.并且它拥有非常丰富的组件.Fl

高可用Hadoop平台－答疑篇

1.概述这篇博客不涉及到具体的编码,只是解答最近一些朋友心中的疑惑.最近,一些朋友和网友纷纷私密我,我总结了一下,疑问大致包含以下几点: 我学 Hadoop 后能从事什么岗位? 在遇到问题,我该如何去寻求解决方案? 针对以上问题,我在这里赘述下个人的经验,给即将步入 Hadoop 行业的同学做个参考. 2.我学 Hadoop 后能从事什么岗位目前 Hadoop 相关的工作大致分为三类:应用,运维,二次开发 2.1 应用这方面的主要工作是编写MapReduce作业,利用Hive之类的套件来进

猜你喜欢

xmlhttp初体验

xml 太久没有研究过新技术了.作为一个程序员,我觉得很惭愧.老早就想看看关于xmlhttp的技术了,今天总算有点时间,做个一个最初的体验.马上就爱上了它.如果你想不刷新页面就可以与后台进行数据交互, ...

在ASP.Net中几种利用CSS实现个性化界面的方法

asp.net|css 看了老猫的文章,通过使页面动态加载不同CSS实现个性化界面(如个性化blog界面) 有以下几种方法方法一: HtmlGenericControl 定义不由特定的 ...

一个广州论坛的打造历程

2005年底,我在人生里作了一个重大的决定:我要做一个地区的论坛.因为人在广州,所以我首选了做广州的论坛.网站是为人服务的,当然要先决定服务人群.我在草稿纸上乱写乱画,列出了几种可以参考的目标人群.首 ...

实践分享外链建设的方法和注意事项

SEO,搜索引擎优化.主要通过高质量的原创性的内容,高质量的强大的外链和完美的内链优化.当然还跟网站结构布局,服务器的稳定性等等因素有关.其中,外链一直是seoer头痛的事情,经常在一些站长论坛,SE ...

Java中定时启动线程

这里提供两种在指定时间后启动线程的方法.一是通过java.util.concurrent.DelayQueue实现:二是通过java.util.concurrent.ScheduledThreadPo ...

Dreamweaver导入和导出站点

在使用dreamweaver时,如果我们要导入或导出站点,那该怎么操作呢?今天小编为大家介绍一下如何dreamweaver怎么导入和导出站点. 首先打开dreamweaver,在菜单栏中找到" ...

PS给树林照片添加逼真的透视光线

教程介绍树林透射光束的制作方法.大致分为两个大的部分来完成:首先是底色的渲染,选择好需要添加光束的位置,然后在通道里面截取这一部分,适当用模糊滤镜做出类似光束的效果,再调出通道选区,在图层面板新建图层 ...

如何复制“弹出警告窗口”的文字

在我们日常使用电脑中,偶尔会碰到一些应用程序出错弹出警告窗口,但是弹出窗口中的文字一般都无法复制下来,如果遇到系统弹出窗口报错,我们一般都会上网查原因,这时我们就需要一个字一个字输入非常麻烦,那有什么 ...

WinPE下怎样给移动硬盘分配盘符

在使用PE的时候你有没有遇到过这种情况,连接USB移动硬盘,任务栏上出现了USB设备图标,但是打开"我的电脑"或"资源管理器",里面却没有移动硬盘的盘符,那 ...

Android 创建/验证/删除桌面快捷方式(已测试可用)_Android

测试环境为Adnroid 2.1以上. 第一步:AndroidManifest.xml 权限配置: 添加快捷方式权限: 复制代码代码如下: <uses-permission android:n ...

关于kafka topic分区的问题

问题描述关于kafka topic分区的问题各位为好: 就是kafka将topic分为多个区,然后将区分布在多个sever上:如果将10个topic,每个topic分1个区.那么这个topic的1 ...

java-JAVA纯数字加密成字符串（可解密）

问题描述 JAVA纯数字加密成字符串(可解密) 比如数字 100 需要转换成对应的英文字母,最好8位左右.需要可以解密回来解决方案线程的加密算法很多啊,DES RSA 都可以解密.也可以base6 ...

Twitter用户质量遭质疑：大量用户来自第三方

导语:<华尔街日报>网络版周六刊文称,Twitter(44.13, -1.06, -2.35%)本周发布了强劲的第二季度财报,月活跃用户数加速增长.然而业内人士指出,Twitter的月活 ...

回顾：十大重要的脑科学研究

近10年来,人们对大脑的认知迅速增长.诊断和分子技术的巨大发展已经揭开了一些大脑的奥秘,科学家正开始解析这些重大发现,并用于对应日常行为甚至疾病.<科学美国人>专版回顾了重要的10个脑科学 ...

javascript-JavaScript中正则表达式校验数值输入问题

问题描述 JavaScript中正则表达式校验数值输入问题需求如下:有一个文本输入框,只能输入数字,数字最大4位保留2位小数并且小数可有可无,最大值不能超过100. 实现如下: var patter ...

[请教]ASP.NET企业级开发有那些设计原则?

问题描述上个项目快结束的时候遇到一个这样的问题:1,一个页面用到Frameset,上下分开,上面的Frame是一排按钮(第三方控件生成),用户点击后,保存并关闭窗口;下面的Frame主要是输入框,用 ...

java求字符串型逻辑表达式的bool值

这是最近在项目中的一个需求,已知a=3,求字符串"a<=2"的值,也就是应该返回false.这个问题可大可小,就我们的应用场景也就是用来让用户自定义变量区间,比如类似下面 ...

html问题

问题描述 textarea中写入一些带<br>的字符串,在ie中显示没有换行,但是在火狐中却换行了!请问应该怎么解决?servlet中的部分代码:String a="SET na ...

MySQL增量备份与恢复实例

小量的数据库可以每天进行完整备份,因为这也用不了多少时间,但当数据库很大时,就不太可能每天进行一次完整备份了,这时候就可以使用增量备份.增量备份的原理就是使用了mysql的binlog日志. 本次操作 ...

mfc-MFC多线程的挂起与启动问题

问题描述 MFC多线程的挂起与启动问题小弟在MFC多文档下编写的多线程编码,想运行OnThreadResume() 这个函数线程挂起,OnThreadSuspend()开始线程,但为什么调用了OnT ...

传言微博曝国内一银行出售掺假金条

江苏省黄金珠宝商会人士称,江苏近两年来未发现金条掺假.(资料图片) 新浪微博名为"JASON冯小缺"(微博).认证身份为先智创科(北京)科技有限公司副总裁冯小缺的博友前天在微博称, ...

php判断搜索引擎蜘蛛爬虫的方法整理

先来看蜘蛛列表搜索引擎 user-agent(包含) 是否PTR 备注 google Googlebot √ host ip 得到域名:googlebot.com主域名 baidu Baidu ...

假如苹果建立了iBank，世界会怎么样？

据一个新调查研究咨询机构的资料显示,约10%的英国和美国公民认为,假如苹果公司利用自己的100亿美金现金建立自己的银行服务.那么世界金融业将为之颤抖. 有43%左右的用户显示,他们会用苹果银行替代现有 ...

超越存储，历久弥新！新华三发布入门级存储产品

2016年9月14日,新华三在京召开主题为<超越存储,历久弥新>的产品发布会,在回顾新华三存储十七年来取得的成绩的基础上,推出了四款针对不同领域和行业的入门级存储新产品.新华三集团存储产品 ...

音乐手机相关信息

http://www.aliyun.com/zixun/aggregation/11210.html">Nokia十月将在英国运行的Come With Music服务将绑定街机&quo ...

《MINECRAFT我的世界新手完全攻略（第3版）》一1.2　启动MINECRAFT

1.2 启动MINECRAFT 现在我们有了自己的账号,也购买和安装了MINECRAFT,终于到了启动游戏的时刻! 1．初次启动时请确保网络在线,进入启动器存放的位置,双击图标将其打开.图1.3所示就 ...

Android2.3发布5个月仅有4%用户完成升级

导语:美国科技博客TechCrunch今天撰文称,苹果在iOS设备存储用户信息的问题发生后一周内即已面向所有用户发布新版操作系统,修复了这一漏洞:相比之下,Android 2.3发布已有5个月,仅有4 ...

宁波深化智慧城市建设开启智能交通新模式

宁波市公安局交通警察局.宁波治堵办分别与支付宝.高德地图签署了战略合作协议,正式宣布宁波交警入驻高德地图"交警平台".借助高德地图,交警将可以为市民提供更加全面的交通信息服务,市民 ...

foreach 、Label

问题描述 foreach(Panelpaninpanel2.Controls){if(pan.Name=="pan"+i.ToString()){//遍历datagridviewf ...

简化数据管理的4种方法

如果组织的IT团队似乎有更多的数据需要管理,那么这就对了.几乎每个企业都在试图确定如何在不增加预算或员工的情况下来管理更多的数据增长. 调研机构451 Research分析师Henry Baltaza ...

热搜