eclipse里面直接运行spark java程序问题

问题描述

我在linux上安装了spark,单节点,master节点也是worker节点,ip是192.168.90.74.使用spark-shell的时候很正常。我想在eclipse开发spark程序并且直接运行调试,但遇到了各种问题,向大家求教。我程序运行在自己的笔记本上,ip是192.168.90.88,我的测试程序如下:System.setProperty("user.name","webuser");JavaSparkContextct=newJavaSparkContext("spark://192.168.90.74:7077","test--1","/home/webuser/spark/spark-1.5.2-bin-hadoop2.4","C://newWorkSpace/java.spark.test/target/java.spark.test-0.0.1-SNAPSHOT.jar");Listlist=newArrayList();list.add(1);list.add(6);list.add(9);JavaRDD<String>rdd=ct.parallelize(list);System.out.println(rdd.collect());rdd.saveAsTextFile("/home/webuser/temp");ct.close();

1.运行的时候要把jar包加进去,这里是使用sparkContext的构造函数加进来的。请问这个jar包必须事先上传到master上然后使用master上的路径吗?2.当我把jar路径指定为maste上jar包路径的时候程序才可以运行,之前一直报错找不到盘符c。运行后又有新问题,程序成功的打出了collect结果,但是saveAsTextFile结果不正确,他在我开发的电脑的c盘下面创建了/home/webuser/temp文件夹,没有在运行spark的server上创建,请问这是什么原理?我的理解rdd的action应该运行在worker节点,而我程序运行的地方是driver,为啥他会在driver上创建文件而不是在worker上?

解决方案

时间: 2024-09-20 18:51:52

eclipse里面直接运行spark java程序问题的相关文章

在eclipse下无论运行什么java程序都出现以下错误,求大神帮忙解决

问题描述 解决方案 解决方案二:这个错误应该不是Eclipse的问题,应该是你工程的问题,检查检查本地工程解决方案三:是不是mysql没配置好啊

《Spark核心技术与高级应用》——2.3节运行Spark应用程序

2.3 运行Spark应用程序 运行Spark应用程序主要包括Local模式运行.Standalone模式运行.YARN模式运行.Mesos模式运行(参考官方文档).2.3.1 Local模式运行Spark应用程序 Local模式运行Spark应用程序是最简单的方式,以计算圆周率的程序为例,进入安装主目录,如spark-1.5.0,执行命令: # 提交Spark任务的入口 ./bin/spark-submit \ #主程序设置本地,local[],其中是指设置线程数 --master local

使用Java编写并运行Spark应用程序

我们首先提出这样一个简单的需求: 现在要分析某网站的访问日志信息,统计来自不同IP的用户访问的次数,从而通过Geo信息来获得来访用户所在国家地区分布状况.这里我拿我网站的日志记录行示例,如下所示: 1 121.205.198.92 - - [21/Feb/2014:00:00:07 +0800] "GET /archives/417.html HTTP/1.1" 200 11465 "http://shiyanjun.cn/archives/417.html/" &

在windows上可以运行的java程序移植到liunx上运行出错

问题描述 这个小程序在windows平台编译成功了.并且可以运行一部分功能,也就是说程序会执行到一定的位置然后再出错,然而到linux环境下再次运行相同的class文件时,一开始程序就崩了.下面是终端的截图:求大神给指导一下啊.另外,两个平台的JDK的版本是相同的. 还有.这程序在windows上编译时需要引入的那些包在linux上是没有的,但是这好像没有影响吧,我只是把class文件移植到linux上去了啊.是可执行文件啊. 解决方案 解决方案二:不可以的,class文件执行时依然要依赖支撑它

java教程之java程序编译运行图解(java程序运行)_java

首先我们在桌面,开始->运行->键入cmd 回车,进入windows命令行.进入如图所示的画面: 可知,当前默认目录为C盘Users文件夹下的Administrator文件夹.一般而言,我们习惯改变当前目录.由于windows有磁盘分区,若要跳到其他磁盘,例如E盘,有几种方法: 1.输入命令: pushd 路径(此命令可将当前目录设为所希望的任一个已存在的路径) 2.输入命令: e:  转移到e盘,然后再输入 cd 转移到所希望的已知路径. 如图: 希望在windows命令行下使用javac.

使用Eclipse JPDA远程调试Java程序

请按以下步骤进行(本人已经在Eclipse 3.2, JDK 1.5_08)环境下调试成功. 1. 在启动Java程序时,在Java启动命令中,加入以下参数 -Xdebug -Xrunjdwp:transport=dt_socket,address=1234,server=y,suspend=n 注: suspend参数表示,启动时,是否等待JPDA调试端连接.n表示否 2. 配置完后,就可以运行Java程序,看到如下提示,表示已经开启debug功能 Listening for transpor

spark (java API) 在Intellij IDEA中开发并运行

概述:Spark 程序开发,调试和运行,intellij idea开发Spark java程序. 分两部分,第一部分基于intellij idea开发Spark实例程序并在intellij IDEA中运行Spark程序.第二部分,将开发程序提交到Spark local或者hadoop YARN集群运行.Github项目源码 图1,直接在intellij IDEA(社区版)中开发调试,直接run. 图2,直接在intellij IDEA(社区版)中用hadoop YARN模式. Github项目源

eclipse-Eclipse 运行java程序时出现错误

问题描述 Eclipse 运行java程序时出现错误 下面这张是我上一次运行的java程序 解决方案 main 函数要传递String args[] 如下: public static void main(String args[]) { } 解决方案二: 先编译 后运行 鼠标点击format.java的代码页面,就是现在这个页面 在这个页面下 ctr l+ s 编译当前文件 然后运行 解决方案三: 啥意思?这不是两个工程吗?要运行Format.java的话,选中这个文件,右键->Run as

如何利用JConsole观察分析Java程序的运行并进行排错调优_java

一.JConsole是什么 从Java 5开始 引入了 JConsole.JConsole 是一个内置 Java 性能分析器,可以从命令行或在 GUI shell 中运行.您可以轻松地使用 JConsole(或者,它更高端的 "近亲" VisualVM )来监控 Java 应用程序性能和跟踪 Java 中的代码. 二.如何启动JConsole 1.如果是从命令行启动,使 JDK 在 PATH 上,运行 jconsole 即可. 2.如果从 GUI shell 启动,找到 JDK 安装路