sparkstream 接收处理多数据源

问题描述

spark新手,如何在driver中接收多个stream,比如sparkexample中JavaNetworkWordCount例子SparkConfsparkConf=newSparkConf().setAppName("JavaNetworkWordCount");JavaStreamingContextssc=newJavaStreamingContext(sparkConf,newDuration(10000));JavaReceiverInputDStream<String>lines=ssc.socketTextStream(host,ip,StorageLevels.MEMORY_ONLY);

这个只接收了一个数据源的流,在官网上有查到可以支持多源接收,但是没有给出例子,本以为可以按如下实现SparkConfsparkConf=newSparkConf().setAppName("JavaNetworkWordCount");JavaStreamingContextssc=newJavaStreamingContext(sparkConf,newDuration(10000));JavaReceiverInputDStream<String>lines=ssc.socketTextStream(host1,ip1,StorageLevels.MEMORY_ONLY);JavaReceiverInputDStream<String>lines2=ssc.socketTextStream(host2,ip2,StorageLevels.MEMORY_ONLY);JavaDStream<String>words=lines.union(lines1);//利用union来合并

但发现这种方式不行,union后的transform操作都不再执行。另外发现csdn上spark模块问题好少,有没有其他论坛可以交流,stackoverflow需要翻墙才能体问,dt!

解决方案

本帖最后由 u012201996 于 2014-08-20 11:47:03 编辑
解决方案二:
发现transform操作只处理了其中一个流,另外个流未处理,action操作未执行

时间: 2024-09-22 19:20:34

sparkstream 接收处理多数据源的相关文章

spring-boot+aop实现多数据源切换

spring-boot+aop实现多数据源切换 当对同一个请求的QPS达到一定程度时,系统的响应会出现瓶颈,一般都是在数据库上,这个时候数据库一般会采取各种措施,例如主从服务,分表分库,读写分离,缓存技术等等.一旦这几种出现,我们在技术上也要做相应的变通.大多数情况是从原始的单库单表变成了多库多表 例如:我们有一个表user_info,我们护绿其他字段,里面有两个字段id.remarks,当数据量达到一定程序后,系统做了分表分库(你也可以当成是主从) 假设我们有一个库test和test2 tes

DB2数据库与Oracle数据库之间远程复制

一.背景 DB2 联合数据库是分布式数据库管理的特殊形式.在联合数据库系统中,可以通过一个 SQL 命令来发出对多个数据源的命令请求.DB2 与非 DB2 数据库之间进行复制之前,首先需要保证非 DB2 数据源可以被 DB2 ESE Version 8 federated database访问.对于DB2 Replication Version 8 所需的联合数据库功能可以在现有发布的 DB2 ESE Version 8 和 DB2 Connect Enterprise Edition Vers

开源的ESB产品列表信息

WSO2 ESB:WSO2 ESB是一套轻量级,以XML和Web service为核心的ESB(Enterprise Service Bus).基于Apache Synapse和Apache Axis2项目构建.它支持connectivity,transformation,mediation和Web service交互管理. JBossESB:ESB是SOA基础架构的一部分,而SOA并不是一种简单的技术或产品.它是一种设计风格,包含无关于实际技术的多个方面.JBossESB能够把抽象的SOA设计

连接数据源

数据|数据源 连接数据源本教程中,我们将学习使用ODBC APIs的细节. 因为我们的程序并不与ODBC驱动程序直接通信,而是通过ODBC管理器来定义一系列APIs供你的程序调用以完成工作,所以我们需要包含odbc32.inc和odbc32.lib文件,当然还有windows.inc. 连接数据源需要以下几步:分配一个环境句柄(environment handle). 在进行每个ODBC任务(session)时仅需这样做一次.一旦获得了句柄,我们就可修改环境属性来适合我们的需要.你可以把这想象为

将Web页面转换成XML数据源

web|xml|数据|数据源|页面|转换 本文将为你提供了一个强大而灵活的方法旨在从现有的HTML文件中提取并组合成有意义的数据. HTML和Web已经永远地改变了人们通信与沟通的方式HTML对人们来说很方便它使得信息更易于查看和航行但遗憾的是它对计算机之间的交流就远远没有那么方便了Web页面上由于层的实现代码使得计算机系统都难以找到和使用数据.这时XML应运而生它承诺要对计算机系统之间通信的方式起到同样的作用XML将成为信息在不同计算机系统之间流动的公用语言.应用本文中介绍的简单编程技术你可以

C++ Builder动态设定odbc数据源

本文以access为例 需要文件 odbcinst.h(bcb或vc的include目录) odbccp32.dll(winnt\system32\目录) implib.exe(通过dll生成lib库) coff2omf.exe (将coff库转化为omf库) 首先将上面文件拷贝到工程目录,执行下面命令: implib.exe odbccp32.lib odbccp32.dll coff2omf odbccp32.lib 下面程序的功能为当应用程序启动时,动态添加/修改一个指向当前目录的,名为t

转 JavaMail发送和接收邮件API(详解)

一.JavaMail概述:     JavaMail是由Sun定义的一套收发电子邮件的API,不同的厂商可以提供自己的实现类.但它并没有包含在JDK中,而是作为JavaEE的一部分.     厂商所提供的JavaMail服务程序可以有选择地实现某些邮件协议,常见的邮件协议包括: SMTP:简单邮件传输协议,用于发送电子邮件的传输协议: POP3:用于接收电子邮件的标准协议: IMAP:互联网消息协议,是POP3的替代协议.     这三种协议都有对应SSL加密传输的协议,分别是SMTPS,POP

控制- 怎么在&amp;amp;lt;%%&amp;amp;gt;中获取绑定的数据源的某个字段的值

问题描述 怎么在<%%>中获取绑定的数据源的某个字段的值 我后台页面上给前台的一个DataList 绑定了数据源 前台用DataList 循环了一个列表 现在我想做一个根据每次循环出来的一个字段 来控制列表中每次都循环的一些Html代码是否显示 现在遇到的问题是 我申明了变量来接收这个字段的值,但是不知道用什么方式来取出这个值(我的变量赋值是写在<%%>里面的),有没有什么更好的解决方法呢? 解决方案 参考这个案例: http://blog.csdn.net/wang4978/ar

网站如何接收股票数据

问题描述 我做了一个股票模拟交易的网站,但不知道股票的实时数据该如何接收.或者说数据源不知道该从哪里得到,希望大家帮我解决一下,不胜感激~! 解决方案 解决方案二:找到了解决办法了~行情数据写库程序可以将挂接第三方数据接口引擎接收数据,实时将数据写入到所需的数据库中,如access.SqlServer.mysql等数据库,然后数据库中的数据供网站调用需要了解详细的可找我QQ837989193