Spark连接北京区S3

问题描述

各位好，初学Spark，想让Spark从S3上的数据Spark搭建在EC2上我在spark-shell下执行：sc.hadoopConfiguration.set("fs.s3a.access.key","xxxx")sc.hadoopConfiguration.set("fs.s3a.secret.key","yyyy")valtextFile=sc.textFile("s3a://...")textFile.count()异常：15/12/2113:29:58INFOS3AFileSystem:CaughtanAmazonServiceException,whichmeansyourrequestmadeittoAmazonS3,butwasrejectedwithanerrorresponseforsomereason.15/12/2113:29:58INFOS3AFileSystem:ErrorMessage:StatusCode:403,AWSService:AmazonS3,AWSRequestID:A5C5253A63B271A6,AWSErrorCode:null,AWSErrorMessage:Forbidden15/12/2113:29:58INFOS3AFileSystem:HTTPStatusCode:40315/12/2113:29:58INFOS3AFileSystem:AWSErrorCode:null15/12/2113:29:58INFOS3AFileSystem:ErrorType:Client15/12/2113:29:58INFOS3AFileSystem:RequestID:A5C5253A63B271A615/12/2113:29:58INFOS3AFileSystem:ClassName:com.cloudera.com.amazonaws.services.s3.model.AmazonS3Exceptioncom.cloudera.com.amazonaws.services.s3.model.AmazonS3Exception:StatusCode:403,AWSService:AmazonS3,AWSRequestID:A5C5253A63B271A6,AWSErrorCode:null,AWSErrorMessage:Forbidden,S3ExtendedRequestID:7zaafP60a1U8pt02jayWuWtf1ONVd1g5n6/xAbutkxtU/M1ZvtSV0pjVzPN2aFOpANTj5R7Cikg=atcom.cloudera.com.amazonaws.http.AmazonHttpClient.handleErrorResponse(AmazonHttpClient.java:798)atcom.cloudera.com.amazonaws.http.AmazonHttpClient.executeHelper(AmazonHttpClient.java:421)atcom.cloudera.com.amazonaws.http.AmazonHttpClient.execute(AmazonHttpClient.java:232)atcom.cloudera.com.amazonaws.services.s3.AmazonS3Client.invoke(AmazonS3Client.java:3528)看起来是被服务器拒绝（403）了请问是不是我操作哪里错了？是否跟北京区S3有关，默认访问了global的？Endpoint／Region？另外有链接给我学习一下s3://、s3n://、s3a://的区别吗？我该用哪个？谢谢！

时间： 2024-09-16 12:57:50

Spark连接北京区S3的相关文章

Spark连接Hadoop读取HDFS问题小结

Spark与hadoop版本我使用0.7.2的Spark版本,且是pre-built过的版本,支持的hadoop版本是hadoop1.在http://spark-project.org/files/上能下载的预编译过的spark版本里,凡是预编译cdh4的压缩包,下载后解压会中断,文件本身有问题.我在google论坛上发帖说明了这个问题:https://groups.google.com/forum/#!topic/spark-users/Y4iJ1458d18.所以我现在使用预编译了1代ha

Spark连接JDBC数据源

在实际的项目环境中,成熟的技术体系对关系型数据库的依赖远远超过hdfs,而且对大数据运算的结果,实践中也倾向于保存到数据库中,以便进行多种方式的可视化.所以本次实践主要完成spark从mysql中读取和写入数据.一般这个操作有两种方式,一种是自己建立jdbc连接,像一般数据库操作一样的写法,一种就是利用spark自带的jdbc操作函数. 首先要把mysql jdbc connector的jar包上传到集群中每台机器的spark/jars目录,这是一个讨巧的办法,因为spark运行之前一定把这里面

《Spark 官方文档》在Mesos上运行Spark

在Mesos上运行Spark Spark可以在由Apache Mesos 管理的硬件集群中运行. 在Mesos集群中使用Spark的主要优势有: 可以在Spark以及其他框架(frameworks)之间动态划分资源. 可以同时部署多个Spark实例,且各个实例间的资源分配可以调整. 工作原理在独立部署的Spark集群中,下图里的Cluster Manager代表Spark master.然而,在Mesos集群中,Mesos master将取代Spark master在下图中的地位. 如果一个S

Spark随谈——开发指南（译）

本文翻译自官方博客,略有添加:https://github.com/mesos/spark/wiki/Spark-Programming-Guide,谢谢师允tx的校正.希望能够给希望尝试Spark的朋友,带来一些帮助.目前的版本是0.5.0 Spark开发指南从高的层面来看,其实每一个Spark的应用,都是一个Driver类,通过运行用户定义的main函数,在集群上执行各种并发操作和计算 Spark提供的最主要的抽象,是一个弹性分布式数据集(RDD),它是一种特殊集合,可以分布在集群的节点上

数据处理平台架构中的SMACK组合：Spark、Mesos、Akka、Cassandra以及Kafka

在今天的文章中,我们将着重探讨如何利用SMACK(即Spark.Mesos.Akka.Cassandra以及Kafka)堆栈构建可扩展数据处理平台.虽然这套堆栈仅由数个简单部分组成,但其能够实现大量不同系统设计.除了纯粹的批量或者流处理机制之外,我们亦可借此实现复杂的Lambda以及Kappa架构. 在本文开始阐述之前,让我们首先立足于已有生产项目经验从设计与示例入手进行说明. 综述 • Spark - 一套高速通用型引擎,用于实现分布式大规模数据处理任务. • Mesos - 集群资源管理系统

Run Spark on Mesos with Zookeeper

本文面向对Spark,Mesos和Zookeeper有一点了解的读者,介绍下Run Spark on Mesos with Zookeeper的方法和一些注意点.因为Spark和Mesos的相关文档里,关于结合Zookeeper之后应该怎么改写相应URL和参数这块讲得不太清楚. 版本信息 Zookeeper 3.4.5 stable Spark 0.8 Mesos 0.13 没有Zookeeper的时候 Mesos master通过下面的方式启动自己并挂起来(Mesos-0.13里,起maste

Spark集群安装和使用

本文主要记录 CDH5 集群中 Spark 集群模式的安装过程配置过程并测试 Spark 的一些基本使用方法. 安装环境如下: 操作系统:CentOs 6.5 Hadoop 版本:cdh-5.4.0 Spark 版本:cdh5-1.3.0_5.4.0 关于 yum 源的配置以及 Hadoop 集群的安装,请参考使用yum安装CDH Hadoop集群. 1. 安装首先查看 Spark 相关的包有哪些: $ yum list |grep spark spark-core.noarch 1.3.0

Oozie分布式任务的工作流——Spark篇

Spark是现在应用最广泛的分布式计算框架,oozie支持在它的调度中执行spark.在我的日常工作中,一部分工作就是基于oozie维护好每天的spark离线任务,合理的设计工作流并分配适合的参数对于spark的稳定运行十分重要. Spark Action 这个Action允许执行spark任务,需要用户指定job-tracker以及name-node.先看看语法规则: 语法规则 <workflow-app name="[WF-DEF-NAME]" xmlns="uri

Using Amazon S3 from Perl

数据管理(Data management)对于任何资源型站点都是一项艰巨而又重要的挑战.随着指数级增长的海量数据和多媒体的日益流行,甚至是小型的资源行站点也必要进行有效的管理和发布大量的数据.另外,如果简易的站点外数据资源管理(offsite storage resource)带来工作的省心,想必对于所有站点维护人员都是一大福音. 在SundayMorningRides.com上,我们为终端用户们管理数据量不断持续增长的GPS(全球定位系统),GIS(地理信息系统)数据和网页内容(文字,图像,视

猜你喜欢

戴志康：做Discuz!只为能找个好工作

李小萌:您好观众朋友,欢迎走进<新闻会客厅>.一个人在上大学的时候受过三次纪律处分,15门功课不过关,而25岁的他现在拥有一家年营业额达到五百万的一家公司,从大学时代来看,可能是一个失败者 ...

专注SEO：辨析网站优化更应从点滴做起

随着各大商化网站竞争的愈加激烈,每一个细节都可能引发一场淘汰赛.在这其中并不仅含"一掷千金"的投入就可以实现目标,细心观察的站长都会发现一个问题:高竞争度的网站,其投资的并不仅仅是 ...

time_t和DATE之间的相互转化

两者的差别: time_t是整型,存储着至1970-1-1 00:00:00的时差(秒数)(UTC时间) DATA是浮点型,整数部分存储着至1899-12-30 00:00:00的时差(天数)(本地时 ...

WPS2016如何制作个性文本框

1.打开WPS文档,点击工具栏的"插入",然后插入文本框 2.绘制好文本框后,再次点击插入,然后插入"形状",插入喜欢的形状 3.在文本框插入形状后我们就可 ...

CentOS系统怎么使用？

NTFS-3G 是一个提供给 Linux.Mac OS X.FreeBSD.NetBSD.BeOS 和 Haiku 的开放源代码.完全自由的 NTFS 档案系统驱动程式. 插入U盘之后,按照下面的 ...

word2003怎么把书中的文字录入电脑

1.在电脑中安装 doPDF和AJViewer 2.用数码相机把需要的文字拍下来(相机和照像水平就不多谈了.照片效果越好,可以大大缩小转换文字的误差率) 例如: 3.在word中插入你用数码相机照 ...

Win8系统电脑无法磁盘名称怎么办

具体操作步骤: 1.点击Win8系统资源管理器,然后在资源管理器面点击"工具"-"文件夹选项"; 2.在Win8系统文件夹选项窗口下,选择"查看& ...

360云盘的文件如何传到腾讯微云

360云盘的文件如何传到腾讯微云 360云盘已经宣布要关闭了,现在不少的用户正在转存自己文件,因此大家都在寻找合适的云盘.目前腾讯微云官方回应,我们一直在,因此腾讯微云可以成为小伙伴们的另一个保存 ...

电脑如何简单设置增加运行流畅

1.同时按下"win(窗口)"键+"R"键,调出"运行"界面. 2.在输入"regedit",打开注册表. 3.找到 ...

Google(准确的说是GooglePlay)已在酝酿返华？

2010年Google从中国大陆撤离多数业务,本周,关于Google回归中国大陆的猜测又再热烈起来.因为,据外媒报道,本周Google在职业社交媒体LinkedIn发布了准备在北京上海扩员的招聘广 ...

以云计算的名义驻云科技牵手阿里云

本文讲的是以云计算的名义驻云科技牵手阿里云一次三个公司的牵手可能会改变无数企业的命运 2017年4月17日,对于很多人来说可能只是个平常的工作日,但是对于国内无数的企业来说却可能是个会改变企业命运 ...

java-Java中获取多个鼠标动作并保存到point2d数组中，并使用此数组

问题描述 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组建立另一个line2d数组,并画出此线段,我在建立l ...

社交网络编程API之iOS系统自带分享

社交网络编程API 社交网络编程主要使用iOS提供的Social框架,目前Social框架主要包含两个类: SLComposeViewController 提供撰写社交信息(如微博信息)的视图控制器, ...

Verizon拟让用户在iPad上收看电视直播节目

美国电信运营商Verizon通讯周三表示,该公司正计划准许FiOS电视服务用户通过苹果iPad平板电脑收看电视直播节目. Verizon 通讯高管在周三举行的新闻发布会中表示,该公司随后将发布一款iP ...

android studio 添加library（github开元项目) 失败

问题描述 android studio 添加library(github开元项目) 失败我在github下载了两个开源库,SlidingMenu和ActionBarSherlck,课室添加到项目后就 ...

DataTabel compute stdev

问题描述程序中一个不到50000行的datatable,计算std就出错,少一些行就没问题,自己用系列代码实验了下,超过超过46341行o的结果就是"Nan",转换完就是&quo ...

GO语言基本类型分析_Golang

本文实例分析了GO语言基本类型.分享给大家供大家参考.具体如下: 一.整型 go语言有13种整形,其中有2种只是名字不同,实质是一样的,所以,实质上go语言有11种整形.如下: (1)int :依赖不 ...

虚拟主机应该如何解决电信网通间互联互通_服务器其它

那么有什么办法可以解决这个问题呢?目前主流的解决方案有如下几种: 一.使用镜像,电信.网通各放一台服务器.这样的优点是不需要特殊的环境,普通用户容易实现.但是缺点也同样明显,如果是静态页面,需要上传两 ...

蚂蚁变大象前的7点思考

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅下面是去upa年会听豆瓣--阿北演 ...

在Ubuntu上为Android系统编写Linux内核驱动程序

在智能手机时代,每个品牌的手机都有自己的个性特点.正是依靠这种与众不同的个性来吸引用户,营造品牌凝聚力和用户忠城度,典型的代表非iphone莫属了.据统计,截止2011年5月,AppStore的应用软 ...

有源RFID技术部署，需考虑哪些因素？

为何要使用RFID源标签通常来说,高销量公司或者拥有复杂供应链的公司都应采用源标签.大型服装零售商已经在这方面取得了重大的进展,我们也希望能在其他行业运用此方案,例如化妆品.饮料.非处方药品和食品等 ...

vim中的加密文件

用vim编辑程序. 要连续输入几个宏名,将键盘改为了大写输入. 存盘退出,本该用:x,结果写成了:X.接着,要求输入密码,再确认一次.按要求做了,心中还在纳闷. 接着用gcc编译程序,一大堆错误.根据 ...

VB 思维导图总结（二）

第六章.过程... 第七章.菜单工具栏... 第八章.文件系统处理. ...

让异构资源一体化管理解读浪潮云海OS3.0

[天极网服务器频道11月13日消息]云海OS V3.0是浪潮基于中国首款的自主云操作系统云海OS V1.0.V2.0版本的重要升级产品,是开放架构.模块化.标准化的云数据中心资源管理平台,实现了数据中 ...

《Node应用程序构建——使用MongoDB和Backbone》一2.3　事件

2.3 事件 Node应用程序构建--使用MongoDB和Backbone事件是Node.js的活力之源,实际上也是JavaScript本身的活力之源.其他语言在多个并发线程中处理工作流,每个线程都将 ...

音乐搜索在搜索引擎中的优化技巧

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 搜索引擎(search engine)是指根据一定的策 ...

运营商签约政府创多赢局面

目前,一场前所未有的信息化签约局面正在电信运营商之间展开.运营商们以地方政府为切入点,立足改善民生需求,一方面加强了地方信息化建设力量,另一方面则有助优化地方经济结构,形成多赢局面本报记者雷宾建 ...

nginx,tornado,websocket,supervisord配置成型

因为要上生产环境,所以配置还是专业一些比较好. nginx.conf upstream websocket_host { server 127.0.0.1:9527; } location /ws_l ...

奥康抄底意大利“鞋业一哥”万利威德

18日,国内最大的民营制鞋企业浙江奥康鞋业股份有限公司在上海与"世界鞋都"意大利鞋业第一品牌万利威德签署协议,收购后者在大中华区的所有权. 这是奥康首次收购海外品牌.在去年的&qu ...

乐视影视荣获“国际金指尖”最佳娱乐应用奖

(6月4日,北京)近日,由艾媒咨询集团主办的"2013(第二届)中国国际移动终端与手机应用产业大会暨2012-2013全球移动终端与移动应用(上)年度评选颁奖典礼"在深圳完美落幕. ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.029 s.