Spark应用(app jar)发布到Hadoop集群的过程

记录了Spark，Hadoop集群的开启，关闭，以及Spark应用提交到Hadoop集群的过程，通过web端监控运行状态。

1.绝对路径开启集群

（每次集群重启，默认配置的hadoop集群中tmp文件被清空所以需要重新format)
我的集群安装位置是/opt/hadoop下，可以根据自己路径修改。

/opt/hadoop/bin/hdfs namenode -format

/opt/hadoop/sbin/start-all.sh
/opt/spark/sbin/start-all.sh

使用jps命令查看集群是否全部正确开启

2.绝对路径关闭集群

/opt/hadoop/sbin/stop-all.sh
/opt/spark/sbin/stop-all.sh

3.Spark业务(app)发布到Hadoop YARN集群方式

这里发布一个spark本身自带的jar发到hadoop集群中（此时hadoop和spark都已开启）

cd /opt/spark

./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
--driver-memory 4g \
--executor-memory 2g \
--executor-cores 1 \
lib/spark-examples-1.6.2-hadoop2.6.0.jar \
10

注意spark-examples-1.6.2-hadoop2.6.0.jar，需要根据你的版本来看自带的版本号。

4.log地址(方便查看错误信息)

/opt/hadoop/logs/
/opt/spark/logs/

5.web地址查看（可以直观的查看集群执行情况）

http://localhost:8088/cluster/apps
http://localhost:8080/
通过http://localhost:8088/cluster/apps看到执行成功SUCCEEDED

查看SparkPi运行结果，结果为Pi is roughly 3.140572。数值可能稍有不同。总之成功了！

时间： 2024-10-30 06:51:48

Spark应用(app jar)发布到Hadoop集群的过程的相关文章

手动安装Hadoop集群的过程

最近又安装 Hadoop 集群,由于一些原因,没有使用 Hadoop 管理工具或者自动化安装脚本来安装集群,而是手动一步步的来安装,本篇文章主要是记录我手动安装 Hadoop 集群的过程,给大家做个参考. 这里所说的手动安装,是指一步步的通过脚本来安装集群,并不是使用一键安装脚本或者一些管理界面来安装. 开始之前,还是说明一下环境: 操作系统:CentOs6.4 CDH版本:4.7.0 节点数:4个在开始之前,你可以看看我以前写的一篇文章使用yum安装CDH Hadoop集群,因为有些细节已

使用yum源安装CDH Hadoop集群

本文主要是记录使用yum安装CDH Hadoop集群的过程,包括HDFS.Yarn.Hive和HBase.本文使用CDH5.4版本进行安装,故下文中的过程都是针对CDH5.4版本的. 0. 环境说明系统环境: 操作系统:CentOs 6.6 Hadoop版本:CDH5.4 JDK版本:1.7.0_71 运行用户:root 集群各节点角色规划为: 192.168.56.121 cdh1 NameNode.ResourceManager.HBase.Hive metastore.Impala Ca

大数据探索：在树莓派上通过 Apache Spark on YARN 搭建 Hadoop 集群

有些时候我们想从 DQYDJ 网站的数据中分析点有用的东西出来,在过去,我们要用 R 语言提取固定宽度的数据,然后通过数学建模来分析美国的最低收入补贴,当然也包括其他优秀的方法. 今天我将向你展示对大数据的一点探索,不过有点变化,使用的是全世界最流行的微型电脑----树莓派,如果手头没有,那就看下一篇吧(可能是已经处理好的数据),对于其他用户,请继续阅读吧,今天我们要建立一个树莓派 Hadoop集群! I. 为什么要建立一个树莓派的 Hadoop 集群? 由三个树莓派节点组成的 Hadoop 集

基于Hadoop集群的大规模分布式深度学习

前言在过去的十年里,Yahoo一直持续投资建设和扩展Apache Hadoop集群,到目前为止共有超过4万台服务器和600PB数据分布在19个集群上.正如在2015 Hadoop 峰会上介绍的,我们在自己的服务器上开发了可扩展的机器学习算法,用于分类.排序和计算词向量.目前,Hadoop集群已成为Yahoo大规模机器学习的首选平台. 深度学习(Deep Learning, DL)是雅虎很多产品的核心技术需求.在2015 RE.WORK深度学习峰会上,Yahoo Flickr团队(Simon O

《Hadoop集群与安全》一2.2　设置NameNode

2.2 设置NameNode 在本节中,我们将一步一步对NameNode服务进行安装以及基本配置,其中包括高可用方案的构建.网络上许多指导和教程将NameNode高可用方案作为一项高级内容,而我们在最初就将重点放在NameNode高可用方案的设置上.原因是在Hadoop构建中NameNode扮演着重要的角色.从根本上说,NameNode是Hadoop集群中的一块短板.如果没有该项服务,用户就无法访问Hadoop分布式文件系统(HDFS). 我们有多种方法对NameNode高可用方案进行设置.在C

Ubuntu12.04 Server下安装部署Cloudera Hadoop集群

部署环境 OS: Ubuntu12.04 Server Hadoop:CDH3U6 机器列表:namenode 192.168.71.46:datanode 192.168.71.202,192.168.71.203,192.168.71.204 安装Hadoop 添加软件源 /etc/apt/sources.list.d/cloudera-3u6.list 插入 deb http://192.168.52.100/hadoop maverick-cdh3 contrib deb-src h

大数据虚拟化零起点（六）使用CLI创建Apache Hadoop集群

在大数据虚拟化基础运维第五步创建Hadoop集群开始之前,我想先说明,这里我不通过BDE提供的可视化界面来创建集群.原因是,我们之前部署好的vApp包括BDE管理服务器,是通过虚机的方式在运行.此时,它还没能跟vSphereWeb Client进行绑定,从而暂时无法交付可视化管理界面.在之后的博客文章里,我将介绍如何交付可视化界面. 但大家不要担心,BDE管理服务器自身已经提供了完备的对外服务接口(RestAPI),用户只需通过命令行(CLI)的方法操控它,就能开始对Hadoop集群进行快速部署

Hadoop集群运行JNI程序

要在Hadoop集群运行上运行JNI程序,首先要在单机上调试程序直到可以正确运行JNI程序,之后移植到Hadoop集群就是水到渠成的事情. Hadoop运行程序的方式是通过jar包,所以我们需要将所有的class文件打包成jar包.在打包的过程中,无需将动态链接库包含进去. 在集群中运行程序之前,Hadoop会首先将jar包传递到所有的节点,然后启动运行.我们可以在这个阶段将动态链接库作为附件和jar包同时传递到所有的节点.方法就是给jar命令指定-files参数.命令如下: hadoop

【Big Data】HADOOP集群的配置（一）

Hadoop集群的配置(一) 1. 实验准备 1.1 目的: 在虚拟机环境下,让同学们学会从零开始配置Hadoop-2.2集群,并尝试在真实环境下搭建集群. 1.2 主要内容: 物理机器总共4台,想配置基于物理机的Hadoop集群中包括4个节点: 1 个 Master, 3个 Salve ,节点之间局域网连接,可以相互 ping通.IP的分布如表1所示. 表1 4个节点的IP地址分配及角色 Ma

猜你喜欢

Ubuntu替换一个光标主题中的一个光标

替换一个光标主题中的一个光标.作为实例. 用软件制作一个光标的图片.如下编写一个conf文件. 代码:&http://www.aliyun.com/zixun/aggregation/379 ...

ajax-关于Ajax 入门一直出错

问题描述关于Ajax 入门一直出错在客户端页面输入自己的名字,服务端返回'你好+名字'执行会有错误提示AjaxGet()函数未定义我是在VS下开发的给你们贴出目录和源码 HTMLPage.htm是 ...

3维饼图

饼图一直想发表点东西.最近刚把php4中的php_gd.dll搞定,就迫不及待的想做点图形程序玩玩.看到有许多php做饼图的例子,看了一下都是2维的,于是就想做个3维的.经过努力pie3d完成了,好 ...

ASP之Cookies讲座

cookie|cookies 最近在研究ASP中的COOKIES,在网上找到了一篇不错的帖子,发出来~!给正在学习COOKIES的朋友点帮助~! 什么是 Cookie?Cookie 其实是 ...

病毒无法删除的处理方法

随着不限时宽带的普及,为了方便BT下载,很多朋友都爱24小时挂机.全天候的在线,这给一些病毒.木马"入侵"系统带来了极大便利,他们可以在半夜入侵我们的电脑,肆意为非作歹.近日笔者在 ...

关于LRU缓存的实现算法讨论

业务模型读.写.删的比例大致是7:3:1,至少要支持500w条缓存,平均每条缓存6k,要求设计一套性能比较好的缓存算法. 算法分析不考虑MemCached,Velocity等现成的key-val ...

ASP.NET 2.0数据教程之五十三：从GridView的页脚插入新记录

返回"ASP.NET 2.0数据教程目录" 导言: 正如教程<概述插入.更新和删除数据>里探讨过的一样, GridView, DetailsView和FormView ...

[你必须知道的.NET]第十九回：对象创建始末（下）

本文将介绍以下内容: 对象的创建过程内存分配分析内存布局研究接上回[第十八回:对象创建始末(上)],继续对对象创建话题的讨论>>> 2.2 托管堆的内存分配机制引用类型的实例 ...

[JAVA100例]072、欢迎进入Applet世界

import java.awt.*; import java.applet.Applet; /** * <p>Title: 简单的Applet</p> * <p>D ...

win8系统没有休眠选项怎么办？

1.通过Win+R键调出运行对话框,然后在运行窗口中输入gpedit.msc命令,打开本地组策略编辑器. 2.在Win8系统本地组上,展开"计算机配置"-"管理模板& ...

win7电脑如何让任务栏界面变透明

win7旗舰版的任务栏大家都非常的熟悉,就在屏幕的下方位置,不关你开启什么程序,除非是全屏的,否则下方的任务栏都会在那个位置,不来也不去.不过不喜欢这种感觉的朋友也可以通过系统自带的让任务栏虚化变 ...

几点网站标题定位技巧

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 在浏览一个网页时,通过浏览器顶端的蓝色显示条出现的信息 ...

Android的多媒体框架OpenCore介绍

网上资料很少, 不过还是找到一个比较详细的说明: 特地在此整理了下: 地址:http://blog.csdn.net/djy1992/article/details/9339787 分为几个阶段: ...

牟长青：“百度推荐”，新的网站运营利器？

在5月24日的百度联盟峰会上,百度联盟发展部总经理马国林宣布,2013年联盟预估分成数额将达40亿,同时还提到相关服务产品的推出.其中我比较关注的是,基于百度统计的个性化智能内容推荐技术--百度推荐. ...

vc++6.0、mfc、SQL2005程序打包

问题描述 vc++6.0.mfc.SQL2005程序打包在vc++6.0上编写的mfc程序,用到数据库SQL2005,请问我怎么可以将程序打包,使它在其他电脑上可以运行?最好是可以打包成安装就可以运 ...

怎么把环信API导入到eclipse中

问题描述我是在window -----preferences ----edit----addjar把jar包导进去在选中jar包,点javadoclocation之后,选 javadoc in a ...

360路由上线：周红衣和他的小盒子们

今天说的是周红衣和他的小伙子,咳咳,是小盒子们. 360安全路由今天在北京做了一次低调的上线发布,就在798总部一间小小的会议室里.跟之前网上公开的信息相比,这次发布其实并没有太大的信息量- ...

惠普重新考虑PC分拆决定：担心损害公司利益

http://www.aliyun.com/zixun/aggregation/17197.html">北京时间10月12日凌晨消息,据熟知内情的消息人士周二称,惠普及其金融顾问公司最 ...

批量 SQL 之 FORALL 语句

对PL/SQL而言,任何的PL/SQL块或者子程序都是PL/SQL引擎来处理,而其中包含的SQL语句则由PL/SQL引擎发送SQL语句转交到SQL引擎来处理,SQL引擎处理完毕后向PL/SQL ...

基于面部表情的情绪识别

一直以来,作为人类我们都以拥有情感而自豪,这是我们和机器的一种本质上的区别.随着计算机的发展,我们更期盼人机之间的沟通交流,尤其是一种带有感情的沟通交流.计算机在情感方面的成长经历也类似于我们每个人的 ...

Android编程实现大图滚动显示的方法_Android

本文实例讲述了Android编程实现大图滚动显示的方法.分享给大家供大家参考,具体如下: 问题: 我有一张比较大的图片,比如长宽都是屏幕的两倍大小,我想实现的功能是首先将图片居中显示,由于图片太大显然 ...

jquery 删除字符串最后一个字符的方法解析_jquery

字符串:var s = "1,2,3,4,5," 目标:删除最后一个 "," 方法:s=s.substring(0,s.Length-1): 字符串:var s ...

linux shell中单引号、双引号、反引号、反斜杠的区别_linux shell

1. 单引号 ( '' ) # grep Susan phonebook Susan Goldberg 403-212-4921 Susan Topple 212-234-2343 如果我们想查找的是 ...

国外网盘挣钱国外网盘挣钱方法

FreakShare网盘简介 FreakShare网盘是一家荷兰的网盘网站,可以通过网盘网赚,这是一个很不错的网赚项目.免费用户可以使用3000G存储空间,单文件上传上线2G,主要的上传方式有网页上传 ...

android-sqlite数据库怎么循环update 语句

问题描述 sqlite数据库怎么循环update 语句 android sqlite数据库有一给字段,这个字段里面是null没有值,点击某些操作后我现在需要在代码中循环给这个字段写入数字序号0,1,2 ...

出现 “WebApplication15._Default”不包含“结果”的定义，并且找不到可接受类型为“WebApplication15._Default

问题描述 usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Web;usingSystem.Web.UI ...

网上卖假注射剂药店老板经理坐牢

本报讯 (记者林霞虹通讯员越法宣)一家药房的老板和经理让店员在网上兜售http://www.aliyun.com/zixun/aggregation/37503.html">治疗癌症 ...

小脑袋教你怎么提升关键词密度

对于关键词排名来说,关键词密度是其中重要因素之一. &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 如何选 ...

SNS招聘网站或为传统招聘网站指明出路

"生物之间存在着生存斗争,适应者生存下来,不适者则被淘汰,这就是自然的选择."80后的杨继超,看起来时尚精干,不过他用进化论做开场白,还是令记者略感惊讶. 话题马上被杨拉回到采访的 ...

怎样将log4j写在公共函数里？

问题描述怎样将log4j写在公共函数里? 每次都在一个类中写以下的代码,大家不觉得重复吗?有没有办法写在公共函数里呢?这样每次可以调用 private static final Logger LOG ...

热搜