spark 远程作业提交,textfile 读取文件的错误(求帮助)

问题描述

System.setProperty("user.name","root")valspark=newSparkContext("spark://miluo1:7077","SparkPi","/usr/spark-1.3.1")spark.addJar("C:\Users\root\Desktop/io.jar")valsc=spark.textFile("file:/root/2txt")varsss=sc.first()println(sss)spark.stop()上面是代码,我是在Windows下eclipse(带scala插件)里直接运行的。算是远程提交吧。但是读取不到文件。。如果是把spark://miluo1:7077换成local(本地模式)则没有问题。下面是错误:1.eclipse里的报错:15/04/2910:45:59INFOSparkContext:Createdbroadcast0fromtextFileatSparkJava.java:21Exceptioninthread"main"org.apache.hadoop.mapred.InvalidInputException:Inputpathdoesnotexist:file:/root/2txtatorg.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)atorg.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)atorg.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)atorg.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:203)2.日志报错(work节点上的)15/04/2910:23:49ERRORFileAppender:Errorwritingstreamtofile/usr/spark-1.3.1/work/app-20150429102347-0046/0/stderrjava.io.IOException:Streamclosedatjava.io.BufferedInputStream.getBufIfOpen(BufferedInputStream.java:162)atjava.io.BufferedInputStream.read1(BufferedInputStream.java:272)atjava.io.BufferedInputStream.read(BufferedInputStream.java:334)atjava.io.FilterInputStream.read(FilterInputStream.java:107)atorg.apache.spark.util.logging.FileAppender.appendStreamToFile(FileAppender.scala:70)atorg.apache.spark.util.logging.FileAppender$$anon$1$$anonfun$run$1.apply$mcV$sp(FileAppender.scala:39)atorg.apache.spark.util.logging.FileAppender$$anon$1$$anonfun$run$1.apply(FileAppender.scala:39)atorg.apache.spark.util.logging.FileAppender$$anon$1$$anonfun$run$1.apply(FileAppender.scala:39)atorg.apache.spark.util.Utils$.logUncaughtExceptions(Utils.scala:1618)atorg.apache.spark.util.logging.FileAppender$$anon$1.run(FileAppender.scala:38)15/04/2910:23:49INFOWorker:Executorapp-20150429102347-0046/0finishedwithstateKILLEDexitStatus14315/04/2910:23:49INFOWorker:Cleaninguplocaldirectoriesforapplicationapp-20150429102347-0046有没大神做过远程提交的。。。我之前做好了hadoop的远程作业提交和web项目整合。。。希望大家多多指点下

解决方案

解决方案二:
检查下你的spark的端口是不是7077应该你的spark配的不是这个端口你看下配置文件我遇到过这样的问题是因为spark端口写错了
解决方案三:
能读到就见鬼了,你把file:/root/2txt的文件复制到每个work节点
解决方案四:
请问这个问题你后来解决了吗?我也遇到了这个问题。
解决方案五:
我后来发现了,textFile应该是读的本地的文件,也就是你windows上的文件,然后提交到集群,而不是提交到集群,集群再去各个节点那个路径下读取文件。
解决方案六:
引用3楼fine_weather的回复:

请问这个问题你后来解决了吗?我也遇到了这个问题。

你好,我想请问下在window下eclipse调试spark需要在本机安装哪些东西,我在本地调试各种问题。
解决方案七:
你可以把本地文件传到hdfs上,然后读取hdfs上的文件,

时间: 2024-12-20 23:13:01

spark 远程作业提交,textfile 读取文件的错误(求帮助)的相关文章

在没有任何数据时进行无效的读取尝试。 错误求解答

问题描述 protectedvoidButton1_Click(objectsender,EventArgse)//登录界面用户的登录,验证码验证.{stringsqltext="select*from用户注册信息";SqlConnectionconn=newSqlConnection("server=SILENT-PC\SILENT;database=阳光传媒用户数据库;integratedsecurity=true");conn.Open();SqlComman

win7系统为何出现读取文件错误

  win7系统黑屏是怎么回事? 微软公司称,2014年,微软将取消Windows XP的所有技术支持.Windows 7将是Windows XP的继承者.另外,Windows体验指数也由Vista的5.9上升至7.9. 但很多朋友反映安装win7时出现了问题.那么,安装时为何出现读取文件错误? 1.安装的时候为什么会出现读取文件错误? 这一般是由于盘片本身的问题或者刻盘出错造成的,请重新刻盘.请大家用中速,光盘一次刻录方式刻录用.另外,如果你采用的是DOS下虚拟光驱方式加载ISO再安装,也可能

c#编程-C#中Parallel.For并行处理中读取文件时出现的错误

问题描述 C#中Parallel.For并行处理中读取文件时出现的错误 1.读取"d:/users/v-lingao/from_lei/wordsegmentation/testdata"目录下的所有txt文档,利用Parallel.For并行处理各个txt文档中的内容,每次读取一行存储到string line中,利用line = sr.ReadLine() (StreamReader sr); 没处理一行也入"d:/users/v-lingao/from_lei/words

java web-POI读取EXCEL文件的错误(invalid header signature )处理

问题描述 POI读取EXCEL文件的错误(invalid header signature )处理 如题,网上很多说是获取信息头部出错,保存或者另存为就可以,我试了下的确可以,但是我不用保存,只要打开下或者重命名也能读取了,打开也没显示格式错误,更重要的是我功能是读取客户端的excel..不可能每次都手动操作,我现在实现的功能是用jsp的FileUpload上传的临时区用poi存储,有没高手帮忙解决更奇怪的是我在eclipse调试却完全没问题,这很重要,已经穷途末路,大家给点意见 解决方案 是因

Spark学习之数据读取与保存(4)

Spark学习之数据读取与保存(4) 1. 文件格式 Spark对很多种文件格式的读取和保存方式都很简单. 如文本文件的非结构化的文件,如JSON的半结构化文件,如SequenceFile结构化文件.通过扩展名进行处理. 2. 读取/保存文本文件 Python中读取一个文本文件 input = sc.textfile("file:///home/holen/repos/spark/README.md") Scala中读取一个文本文件 val input = sc.textFile(&q

调试-c#读取文件图片及声音问题

问题描述 c#读取文件图片及声音问题 本人在学习c#然后找了别人做得一个项目,我运行也ok,我想模仿做一个,但有些看不懂.如下: 1.图片 这个LLK.data是个文件夹吗,然后从里面找出.bmp文件还是什么,我在自己的项目的properities/resources.resx添加了图片,又在项目里创建了data文件夹里面放入图片,结果不行,错误大概意思,缺少LLk.data.resources.然后我在别人的项目里见到了这个 请问这个文件怎么形成的呢,里面是不是有图片资源啊.还有上面图片的两行

php学习笔记--高级教程--读取文件、创建文件、写入文件

打开文件:fopen:fopen(filename,mode);//fopen("test.txt","r"): 打开模式:r 只读方式打开,将文件指针指向文件头 r+ 读写方式打开,将文件指针指向文件头 w 写入方式,指向文件头,如果不存在则尝试创建 w+ 读写方式,指向文件头,如果不存在则尝试创建 a 写入方式打开,指向文件末尾,如果不存在则尝试创建 a+ 读写方式打开,指向文件末尾,如果不存在则尝试创建 读取文件:fread:fread(); readfile

FSO使用教程6 -- 如何使用FSO读取文件

fso|教程 如何使用FSO读取文件-FSO使用教程6 TextStream对象所提供用来读取文件的方法有三种:ReadLine.Read及ReadAll.在调用这几个方法之前,必须注意文件结尾的问题----当整个文件的内容都被读完时,若再调用ReadLine,Read.ReadAll等方法,则会产生"输入超出文件结尾"的错误(错误编码=62). 因此比较好的习惯是在调用ReadLine.Read及ReadAll之前,先读取TextStream对象的atEndOfStream属性值,以

io流-.jsp页面IO流读取文件报错

问题描述 .jsp页面IO流读取文件报错 <%@ page language=""java"" import=""java.util.*"" pageEncoding=""gb2312""%><%@ page import=""java.io.*""%><%@ page import=""org.a