Hadoop不同salve节点可以处理不一样的数据吗？（看需求解答）

问题描述

我的需求是这样的：比如有三个文件需要作为mapper输入处理：file01,file02和file03。另外还有三个文件作为配置参数存放在本地：r1,r2和r3。我的mapper程序需要对r1，r2和r3做处理并分别生成三个不同的处理实例，处理算法一样，只是参数不同，所以生成了不同的类实例如p1,p2和p3，然后我想让p1只处理file01，p2只处理file02，p3处理只file03，并分别放到三个slave节点上各自处理，互不影响，然后将计算结果通过reduce进行汇总，这样可以吗？我这样的目的是为了性能开销，因为r1，r2和r3实例都非常大，如果合并成一个实例计算太慢。以我的知识，这样的需求在Hadoop上不能实现，因为Hadoop上map输入文件似乎是不可区分的。急，求Hadoop大神帮忙提个想法，非常感谢。

解决方案

解决方案二：

解决方案三：
没人知道吗？急死我了

时间： 2024-10-06 23:48:11

Hadoop不同salve节点可以处理不一样的数据吗？（看需求解答）的相关文章

hadoop其中一个节点马上要写满了，如何设置不往该节点写数据

问题描述 hadoop其中一个节点马上要写满了,如何设置不往该节点写数据解决方案解决方案二:配置一个监听器,使用观察者模式,把监听器注入到服务,满足条件,监听报警,像写的地方发告警

Hadoop专业解决方案-第3章：MapReduce处理数据

前言:非常感谢团队的努力,最新的章节终于有了成果,因为自己的懒惰,好久没有最新的进展了,感谢群里兄弟的努力. 群名称是Hadoop专业解决方案群 313702010 本章主要内容: 理解MapReduce基本原理了解MapReduce应用的执行理解MapReduce应用的设计截止到目前,我们已经知道Hadoop如何存储数据,但Hadoop不仅仅是一个高可用的,规模巨大的数据存储引擎,它的另一个主要特点是可以将数据存储与处理相结合. Hadoop的核心处理模块是MapReduce,也是当

详解Hadoop系统：Hadoop架构、各部分功能及对大数据的意义

如今Apache Hadoop已成为大数据行业发展背后的驱动力.Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper.Flume). Hadoop带来了廉价的处理大数据(大数据的数据容量通常是10-100GB或更多,同时数据种类多种多样,包括结构化.非结构化等)的能力.但这与之前有什么不同? 现今企业数据仓库和关系型数据库擅长处理结构化数据,并且可以存储大量的数据.但成本上有些昂贵.这种对数据的要求限制了可处理的数据种类,同时这种惯性

《Hadoop与大数据挖掘》——第2章大数据存储与运算利器—Hadoop 2.1 Hadoop概述

第2章大数据存储与运算利器-Hadoop 本章主要介绍了Hadoop框架的概念.架构.组件.生态系统以及Hadoop相关编程,特别是针对Hadoop组件HDFS.MapReduce.YARN,Hadoop MapReduce编程做了较详细的介绍.在介绍各个知识点的同时,结合动手实践章节,帮助读者理解对应的内容. 2.1 Hadoop概述 2.1.1 Hadoop简介随着现代社会的发展,各种信息数据存量与增量都非常大,很多情况下需要我们能够对TB级,甚至PB级数据集进行存储和快速分析,然而单机

socket-求助：SSDB的主从数据同步时，即使没有任何写操作主从节点也会频繁地进行数据交互

问题描述求助:SSDB的主从数据同步时,即使没有任何写操作主从节点也会频繁地进行数据交互我安装了SSDB后,分别启动了master和slave, 然后通过Debug日志,发现在刚启动copy完成后,就开始不停地重复进行sync, 就对已有的数据进行循环sync, SSDB理念不是只有在write的时候,才会进行sync同步吗? 经过测试,在write的时候,也会进行sync同步,但是我是很奇怪为什么不执行write的时候,主从socket还一直在进行同步, 求大神解答. 不甚感激解决方案

《Spark与Hadoop大数据分析》一一第1章从宏观视角看大数据分析

第1章从宏观视角看大数据分析本书的目标是让你熟悉 Apache Spark用到的工具和技术,重点介绍Hadoop平台上使用的Hadoop部署和工具.大多数Spark的生产环境会采用Hadoop集群,用户在集成 Spark和Hadoop配套的各种工具时会遇到很多挑战.本书将讲解Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和另一种资源协商器(Yet Another Resource Negotiator,YARN)面临的集成挑战,以及Spa

ORACLE RAC 裸设备数据库一节点表空间扩容错误添加数据文件到本地的处理

9月2日上午,总部CRM求助,问题是ORACLE 10.2.0.4 RAC 裸设备数据库在表空间扩容时操作失误,将数据文件错误添加成文件系统文件并且还在节点1的本地目录,导致节点2无法完成写操作,报错信息如下: Wed Sep 2 08:23:23 2015 Errors in file /oracle/app/admin/oracrm/bdump/oracrm2_dbw0_2101996.trc: ORA-01157: cannot identify/lock data file 1

显示当前Hadoop集群节点上启动的进程

#!/bin/sh #查看hadoop的运行状态 function hadoopState(){ COUNT=1 while [ ${COUNT} -le ${NUM} ] do echo "**********查看hadoop${COUNT}上hadoop的运行状态********" #连接远程主机查看运行状态 ssh -t -p 22 hadoop${COUNT} "jps" COUNT=$((${COUNT}+1)) done } echo "===

《Hadoop与大数据挖掘》——1.2　大数据平台

1.2 大数据平台大数据平台有哪些呢? 一般认为大数据平台分为两个方面,硬件平台和软件平台.硬件平台一般如Open-Stack.Amazon云平台.阿里云计算等,类似这样的平台其实做的是虚拟化,即把多台机器或一台机器虚拟化成一个资源池,然后给成千上万人用,各自租用相应的资源服务等.而软件平台则是大家经常听到的,如Hadoop.MapReduce.Spark等,也可以狭义理解为Hadoop生态圈,即把多个节点资源(可以是虚拟节点资源)进行整合,作为一个集群对外提供存储和运算分析服务. Hadoo

猜你喜欢

MS-SQL数据库开发常用汇总和t-sql技巧集锦

技巧|数据|数据库把长日期转换为短日期 Convert(char(10),getdate(),120) MS-SQL数据库开发常用汇总 1.按姓氏笔画排序: Select * From Tab ...

Oracle 的入门心得

oracle|心得 oracle的体系太庞大了,对于初学者来说,难免会有些无从下手的感觉,什么都想学,结果什么都学不好,所以把学习经验共享一下,希望让刚刚入门的人对oracle有一个总体的认识,少走一 ...

Fireworks MX 2004特效字系列教程

教程|特效开始第一步: 选择字体:04b-08 字体大小:125,填充如下: 第二步: 选效果/光晕和阴影/内侧发光........参数设置如下: 第三步: 选效果/斜角和浮雕/内斜角..... ...

WCDMA的R99版本和R4版本

R99 R99接入部分主要定义了全新的5MHz每载频的宽带码分多址接入网,采纳了功率控制.软切换及更软切换等CDMA关键技术,基站只做基带处理和扩频,接入系统智能集中于RNC统一管理,引入了适于分组数 ...

C#.Net网络Socket程序开发

Microsoft.Net Framework为应用程序访问Internet提供了分层的.可扩展的以及受管辖的网络服务,其名字空间System.Net和System.Net.Sockets包含丰富的类 ...

使用Eclipse Ganymede进行桌面、Web和移动设备开发，第2部分（二）

第2部分: 采用Ganymede进行富客户机平台开发在工作空间中选择 com.devworks.tutorial.po 并单击 Add Required Bundles.另外 ,单击 Validat ...

XP系统下如何将‘我的文档’移到其它分区

首先需要在桌面上显示我的文档. 在桌面空白处鼠标右键单击"属性" 在显示属性窗口中单击"桌面"选项卡在单击桌面选项卡下的"自定义桌面" ...

win8系统火狐浏览器如何安装新插件

具体操作步骤如下: 1.首先打开火狐浏览器,并使电脑连接上internet网络;然后点击浏览器标志中的下拉菜单,弹出选项,选择其中的"附加组件"; 3.将会弹出新的窗口,其中就 ...

cpu散热器哪种好

在DIY电脑领域,很多玩家在装机的时候,注意力往往主要集中在关乎电脑性能的CPU,显卡,主板,内存,硬盘等核心硬件之上,对机箱电源,散热器等硬件往往不太在乎.也正因为如此,一些朋友组装的电脑往往配 ...

怎么修复MPEG1和MPEG2

MPEG1和MPEG2文件可以使用FinalData软件修复.首先选择需要修复的文件驱动器,然后查找受损的文件.在选定要修复文件后,根据文件的类型,选择修复的方式,单击菜单栏下的"数据库 ...

深入浅出JSON[转]

原文地址:http://www.cnblogs.com/Truly/archive/2006/12/31/608896.html Author:Truly JSON定义 JSON(Java ...

【整理】与 Nginx 的 HTTPS 相关的两篇翻译文章要点记录

第一部分内容参考自< 现在就启用 HTTPS,免费的! > [一句话总结] 图解如何在 StartSSL 上申请免费的证书:提供并解释了一个可以参考的 HTTPS 完整配置:增加对高级技 ...

mysql-JSP怎么获取在MySql中查询到的数据中的指定值？

问题描述 JSP怎么获取在MySql中查询到的数据中的指定值? 这是我的table结构,一共6列,主键是id,table名是user,现在想通过查找username来获取指定username的name ...

数据库设计-有哪位大神帮我看下这个类图有啥错不？不太懂这个，毕业图需要画，哪位大神帮帮忙

问题描述有哪位大神帮我看下这个类图有啥错不?不太懂这个,毕业图需要画,哪位大神帮帮忙解决方案这个根本不是类图,而是实体关系图(E-R图),建议你问问老师到底要什么图解决方案二: 数据库表的设计 ...

wcf-WCF获取客户端IP 获取的不正确

问题描述 WCF获取客户端IP 获取的不正确我在网上按照这段代码,不知道为什么获取的不正确 OperationContext context = OperationContext.Current; ...

现在无论是应用,还是游戏中,都经常会有分享的功能.分享,不仅要分享文字,也要分享应用或者游戏的屏幕截图,这样才能做到图文并茂,吸引到更多的用户. 想要做图片的分享功能,首先就需要抓屏,将当前屏幕保存为 ...

代运营模式的前景看起来可能没有以前那么乐观

代运营模式的前景看起来可能没有以前那么乐观了. 在代理了几家化妆品大牌的天猫业务后,聚合美妆(杭州的某代运营公司)决定推出自有品牌.原因是做代运营利润率太低,必须及早转型,以免彻底成为杀鸡取卵的牺牲品 ...

微信开放平台开发(3) 移动应用微信登录

关键字:微信公众平台微信开放平台微信登录移动应用微信登录使用微信账号登录APP作者:方倍工作室原文:http://www.cnblogs.com/txw1958/p/weixin-applo ...

java.lang.NoClassDefFoundError: javax/servlet/ServletContext

方法1:把SpringBoot中main方法所在的class不再继承org.springframework.boot.context.web.SpringBootServletInitialize ...

c语言字符串删除的问题

问题描述 c语言字符串删除的问题将字符串s1中与字符串s2中匹配的字符删除,并输出. 我写的程序如下: #include main() { char s1[10],s2[10]; gets(s1); ...

MySql数据引擎简介与选择方法_Mysql

一.数据引擎简介在MySQL 5.1中,MySQL AB引入了新的插件式存储引擎体系结构,允许将存储引擎加载到正在运新的MySQL服务器中. 使用MySQL插件式存储引擎体系结构,允许数据库专业人 ...

java-获取到方法的中泛型参数的实际类型

问题描述获取到方法的中泛型参数的实际类型 java的泛型在内存中不是不存在的嘛?为什么通过以下的代码可以获取到方法的中泛型参数的实际类型? class GenericTest{ public sta ...

Snap计划明年3月IPO 预期市值250亿美元

据华尔街日报报道,Snap(更名前是Snapchat)正在为明年3月IPO做准备,公司预期的市值为250亿美元. 知情人士证实了Snap的IPO计划,但他说现在情况仍未确定下来,并且Snap也还没有聘 ...

重新想象 Windows 8 Store Apps (24) - 文件系统: Application Data 中的文件操作, Package 中的文件操作, 可移动存储中的文件操作

原文:重新想象 Windows 8 Store Apps (24) - 文件系统: Application Data 中的文件操作, Package 中的文件操作, 可移动存储中的文件操作 [源码下载 ...

spring MVC request请求不能传递带逗号的参数

问题描述代码如下<html> <body> <input name="test" value="12,34,56" ty ...

智能算法-遗传算法求解0-1线性规划约束条件的处理

问题描述遗传算法求解0-1线性规划约束条件的处理有哪位大神知道在利用遗传算法求解0-1线性规划的问题时,怎样处理目标函数中的复杂约束条件的问题

从淘宝客网站现有模式分析以后网站发展的前景

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅淘宝客网站,相信很多朋友都是从一个 ...

CAS入门

接触CAS有一段时间,一直以来总听到别人说这是块难啃的骨头,于是我饿了,想啃一啃,CAS的原理其实还是比较好理解的,但是在实现的过程中确实出现了很多问题,而且CAS的Server ...

郭涛:在线地图，开启崭新时代！

线地图服务:指地图服务方根据用户提出的地理信息需求,通过自动搜索.人工查询.在线交流等方式为用户提供方便.快捷.准确的地图信息.周边景物场所信息及出行交通指引资讯的在线信息服务. 在线地图作为互联网的 ...

j2ee-关于user.dir路径的问题

问题描述关于user.dir路径的问题求解求解,郁闷死了,是对函数理解的错误还是??? 为什么我自己写的类不在自己的包下,这不科学... 解决方案 user.dir 取当前工作路径,不是包路径解 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.026 s.