下代MapReduce预览 节点数翻倍最大达10000

大数据革命正以Apache Hadoop为中心如火如荼的进行着。自从开源分布式数据处理平台在5年前发布时讨论之声就不绝于耳。在过去的一年中,Hadoop赢得了客户的认可,并得到众多商业化的支持以及众多数据库和数据集成软件商的整合。

Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。这种处理多类型数据的能力非常重要。它催生了NoSQL平台和产品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL数据库。

而传统关系型数据库如Oracle,IBM DB2,Microsoft SQL Server和MySQL则都不能处理混合数据类型和非结构化数据。由于事务处理灵活性的需求,Hadoop获得大多数数据分析厂商的关注和支持。展望未来,在未来的3到5年,大数据已经成为私人和公共组织的战略关键。事实上,在未来5年预计有50%的大数据项目会在Hadoop框架下运行。

Hadoop主要组件包含:

Hadoop:Java编写的软件框架,以支持数据密集型分布式应用

ZooKeeper:高可靠性分布式协调系统

MapReduce:针对大数据的灵活的并行数据处理框架

HDFS:Hadoop分布式文件系统

Oozie:负责MapReduce作业调度

HBase:Key-value数据库

Hive:构建在MapRudece之上的数据仓库软件包

Pig:Pig是架构在Hadoop之上的高级数据处理层。Pig Latin语言为编程人员提供了更直观的定制数据流的方法。

Sqoop和Flume:可改进数据的互操作性和其余部分。Sqoop功能主要是从关系数据库导入数据到Hadoop,并可直接导入到HFDS或Hive。而Flume设计旨在直接将流数据或日志数据导入HDFS。

Mahout:Mahout提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括集群、分类、推荐过滤、频繁子项挖掘。

Ambari:Ambari是最新加入Hadoop的项目, Ambari可帮助系统管理员部署和配置Hadoop,升级集群以及监控服务。还可通过API集成与其他的系统管理工具。

MapReduce

MapReduce作为Hadoop的核心是一种处理大型及超大型数据集(TB级别的数据。包括网络点击产生的流数据、日志文件、社交网络等所带来的数据)并生成相关的执行的编程模型。其主要思想是从函数式编程语言借鉴而来的,同时也包含了从矢量编程语言借鉴的特性。

Google在2004年创造了MapReduce,而从MapReduce到Hadoop这其中经历了一个有趣的转变。MapReduce最初是帮助搜索引擎公司应对万维网所带来的创建索引时产生的大量数据。Google最初也招募了一些硅谷的精英,并雇用了大批的工程师来完善MapReduce。并快速将技术应用在相关的行业之中,如金融、零售等。Goolge曾拿出MapReduce的部分相关信息与Nutch团队分享,以开发开源版本“Hadoop”。但Yahoo则将Nutch收入到旗下。Yahoo在2007年将其发展成Hadoop开源项目。Hadoop现在越来越多的用于大数据的大规模并行数据处理引擎。

MapReduce系统获得成功的原因之一是它为编写需要大规模并行处理的代码提供了简单的编程模式。它受到了Lisp的函数编程特性和其他函数式语言的启发。MapReduce和云计算非常相配。MapReduce的关键特点是它能够对开发人员隐藏操作并行语义 — 并行编程的具体工作方式。

(责任编辑:吕光)

时间: 2024-10-10 13:36:51

下代MapReduce预览 节点数翻倍最大达10000的相关文章

Xp系统下图片无法预览怎么查看

  Xp系统下图片无法预览怎么查看              解决方案: 1.打开开始-运行中输入: regsvr32 %systemroot%system32shimgvw.dll 如果提示成功,下面的就不用看了. 2.提示如果找不到shimgvw.dll文件.打开360卫士的系统急救箱,点系统文件修复区. 3.点手动添加--输shimgvw.dll,点击添加. 4.提示成功后回到第一步,开始运行: regsvr32 %systemroot%system32shimgvw.dll 至此问题解决

android自带相机删除预览照片后怎么回到下一张预览而不是回到相机

问题描述 android自带相机删除预览照片后怎么回到下一张预览而不是回到相机 打开照相机----随便照几张照片----照完后照相按钮上方会有刚才照的照片的预览(一个小方框)----点击小方框预览照片----随便删除一张----此后将回到照相界面--怎么改代码让它回到下一张的预览照片? 解决方案 你打开图片是跳转到另一个activity了吗?如果是的话,把 activity的启动方式 可以改为 singleTop,不然你每次打开一张图片就会新建一个activity,这样浪费内存,且会造成你说的后

VC、IE、ASP环境下打印、预览的完美解决方案

打印|解决 一种基于XML的报表开发工具,它支持从设计报表,调用API打印.预览,能支持分布式报表.方便报表的存储.转发.在报表中能嵌入VBScript,能方便地访问VB,VC的变量,能访问COM组件.ADO等遵循ActiveX标准的控件. 包括报表可视化开发界面.报表语法解释器,基于COM的组件.是分布式报表的完美解决方案 语法如下: <?xml version="1.0" encoding="GB2312" ?><!DOCTYPE report

win10预览版10041无斯巴达浏览器 IE浏览器Edge渲染引擎更新

  3月19日消息,微软在官方IE博客中不仅确认了斯巴达浏览器预览版将包含在下个Win10版本中,而且还列出了本次Build 10041版本中IE浏览器Edge渲染引擎更新的细节.本次更新的引擎功能是斯巴达浏览器的一部分,感兴趣的用户可以暂时用IE浏览器实验功能来"抢先"体验. 本次更新的渲染引擎内容比较丰富,主要包括以下几个方面: • 提升ECMAScript 6兼容性(在当前Win10预览版的Kangax ES6兼容性测试中提高74%) • 扩展支持DOM L3 XPath • 支

win7旗舰版系统下图片无法预览只显示图标如何解决

  1.首先鼠标右击Ghost win7系统桌面的计算机图标,然后选择"属性"; 2.在弹出来的计算机属性面板中,点击"高级系统设置"; 3.在弹出来的系统属性面板中,切换到"高级"选项卡,然后点击性能的"设置"按钮; 4.接着在弹出来的性能选项界面中,找到并勾选"显示缩略图,而不是显示图标"选项,然后点击"应用-确定"这样就可以了.

win7系统下任务栏预览速度的妙招

  1.首先在win7系统的开始菜单中打开运行窗口,输入"regedit",回车打开注册表; 2.打开注册表编辑器之后,依次展开"HKEY_CURRENT_USER-Software-Microsoft Windows-CurrentVersion-Explorer-Advanced"; 3.然后单击鼠标右键新建一个"DWORD(32-位)值"; 4.并将键值重命名为"ThumbnailLivePreviewHoverTime"

体验Word2013预览版阅读和编辑pdf文件

Adobe公司的PDF文件格式是非常流行的文档格式,但pdf文档的阅读和编辑并不是那么方便.微软Office2010在Word软件中提升了对PDF文件的支持,但它只能将文档在本地存储为PDF格式,并不能编辑PDF文件.近日,微软推出了新一代Office预览版,在Word2013预览版中,我们看到了传说中的Pdf文件查阅和本地编辑功能,一起来体验一下. 打开Word2013预览版,在初始界面中我们可以看到左边列出了最近打开过的文档,右边是丰富的模板.我们可以点击"Open Other Docume

Word2013客户预览版 阅读、修改PDF文件更方便

在Word2013预览版中,我们看到了传说中的Pdf文件查阅和本地编辑功能,一起来体验一下. 打开Word2013预览版,在初始界面中我们可以看到左边列出了最近打开过的文档,右边是丰富的模板.我们可以点击"Open Other Documents",从文件夹中挑选自己想要浏览的pdf文件. 图示:Word2013预览版初始界面,点击"Open Other Documents" 如果我们已经在Word2013预览版的编辑界面,则可点击"File",

《Adobe After Effects CS5经典教程》——1.6 预览

1.6 预览 也许您急切地想看看作品的效果.After Effects提供几种预览合成图像的方法,包括标准预览.RAM(内存)预览和手动预览(关于手动预览控制列表,请参见After Effects帮助).这3种方法在Preview(预览)面板都很容易实现,标准工作区中该面板位于应用程序窗口的右边. 1.6.1 使用标准预览 标准预览(通常称为空格键预览)从当前时间标志点开始播放合成图像至结束点.标准预览方式播放速度通常比实时慢.当合成图像较简单或在其早期制作阶段,不需要额外内存来显示复杂动画.特