Spark-云计算大数据领域的新霸主

  据相关数据显示,2013年上半年中国手机网民规模已经突破5亿大关,预计14年第一季度,国内手机网民规模将超PC端,手机用户超过10亿,3G 用户持续增长,以及4G的强势劲头,都催生移动大数据的爆发。大量新数据无时无刻不在涌现,移动互联网正影响着人类生活的方方面面。

  这将是一个前所未有的时代。所有的公司和机构都已经或者正在成为移动互联网组织。所有的公司和机构也终将是云计算大数据组织。移动互联网及云计算大数据的浪潮正在并将最终彻底的变革所有的公司和机构的架构模式、生产模式、服务模式以及管理模式。

  Spark-新一代全能大数据计算平台崛起

  随着大数据相关技术和产业的逐渐成熟,单个组织内往往需要同时进行多种类型的大数据分析作业:传统Hadoop MapReduce最为擅长的是离线海量数据的统计分析,由于Hadoop本身的特性,导致使用Hadoop处理大数据的结果的获取往往是要延迟在几分钟甚至是几个小时,这在很多场景下都是不可接受的。更为重要的是在Spark出现前,要在一个组织内同时完成各种机器学习算法为代表的迭代型计算、流式计算、社交网络中常用的图计算、SQL关系查询、交互式即席查询等数种大数据分析任务,就不得不与多套独立的系统打交道,一方面引入了不容小觑的运维复杂性,另一方面还免不了要在多个系统间频繁进行代价高昂的数据转储。

  Spark是基于内存,是云计算领域的继Hadoop之后的下一代的最热门的通用的并行计算框架开源项目,尤其出色的支持Interactive Query、流计算、图计算等。

  Spark在机器学习方面有着无与伦比的优势,特别适合需要多次迭代计算的算法。同时Spark的拥有非常出色的容错和调度机制,确保系统的稳定运行,Spark目前的发展理念是通过一个计算框架集合SQL、Machine Learning、Graph Computing、Streaming Computing等多种功能于一个项目中,具有非常好的易用性。

  Spark无可比拟的优势,占据云计算大数据领域霸主地位

  Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark当下已成为Apache基金会的顶级开源项目,拥有着庞大的社区支持(活跃开发者人数已超过Hadoop MapReduce),技术也逐渐走向成熟。

  作为下一代云计算及大数据的核心技术,Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了 100倍以上。甚至在Hadoop最擅长的离线数据统计分析领域,Spark比Hadoop也至少快了一个几何级数;Spark另外一个无可取代的优势是:“One Stack to rule them all”,Spark采用一个统一的技术堆栈解决了云计算大数据包括如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题,具有完善的生态系统;这直接奠定了其一统云计算大数据领域的霸主地位;

  Spark应用现状及未来发展

  目前SPARK已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project,可以预计的是2014年下半年到2015年在社区和商业应用上会有爆发式的增长。

  国外一些大型互联网公司已经部署了Spark.甚至连Hadoop的早期主要贡献者Yahoo现在也在多个项目中部署使用Spark;国内的淘宝、优酷土豆、网易、Baidu、腾讯等已经使用Spark技术用于自己的商业生产系统中,国内外的应用开始越来越广泛。

  前段时间,mahout宣布了一个重大的消息,mahout社区表示从现在起,他们将不再接受任何以MapReduce形式实现的算法,但是他们仍然将维护那些常用算法的MapReduce实现。另一方面,mahout宣布新的算法将基于Spark实现,他们相信Spark更丰富的编程模型及更优秀的性能将对mahout有着至关重要的作用。另一方面,Cloudera的机器学习框架oryx的执行引擎也会替换成Spark,之前oryx也是使用 mapreduce.种种迹象表明,Spark已经开始各种屠杀了,非常有希望成为新一代分布式机器学习事实上的标准。让我们拭目以待。Spark正在逐渐走向成熟,并在这个领域扮演更加重要的角色。

时间: 2024-09-20 10:50:59

Spark-云计算大数据领域的新霸主的相关文章

云计算大数据被提新高度

计算机行业-"数据+产业+金融"三维研究体系之数据端推进点评:数据纲要和软件百家企业相继发布,云计算大数据被提新高度. 事件: 1.9月10日晚,根据国家统计局批准.工业和信息化部统计的2014年全国软件和信息技术服务业年报数据为基础, 2015年(第14届)中国软件业 务收入前百家企业(以下简称软件百家企业)揭晓.华为技术有限公司以软件业务年收入1482亿元,连续十四年蝉联软件百家企业之首,浪潮集团荣获第四位. 2.9月6日,国务院发布<促进大数据发展行动纲要>:信息技术

Apache Spark是大数据领域的下一个大家伙吗?

作者观察到http://www.aliyun.com/zixun/aggregation/14417.html">Apache Spark 最近发出一些不同寻常的事件,Databricks将提供$14M美金支持Spark,Cloudera决定支持Spark,Spark被认为是大数据领域的大事情. 美好的第一印象 作者认为自己已经与Scala的API(Spark使用Scala编写)打交道了一段时间,说实话,起初是相当深刻的印象,因为Spark是看上去这么小而好.基本的抽象是有弹性分布式数据集

Spark成云计算大数据时代的集大成者

Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库.流处理和图计算等多种计算范式,是罕见的全能选手.Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理.图技术.机器学习.NoSQL查询等方面的所有核心问题,具有完善的生态系统,这直接奠定了其一统云计算大数据领域的霸主地位. 伴随Spark技术的普及推广,对专业人才的需求日益增加.Spark专业人才在未来也是炙手可热,轻而易举可以拿到百万的

怎样为云计算大数据Spark高手?

Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库.流处理和图计算等多种计算范式,是罕见的全能选手.Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理.图技术.机器学习. NoSQL查询等方面的所有核心问题,具有完善的生态系统,这直接奠定了其一统云计算大数据领域的霸主地位. 伴随Spark技术的普及推广,对专业人才的需求日益增加.Spark专业人才在未来也是炙手可热,轻而易举可以拿到百万

河南互联网大会“上线” 云计算大数据产业联盟揭牌

昨日,河南省第三届联网大会在郑州拉开大幕,中国工程院院士邬江兴等业内著名专家以及阿里巴巴.腾讯.华为.中国电信等国内互联网.电信业巨头纷纷前来助阵.河南获批建国家大数据综合试验区后也终于迎来了自己的"云端产业联盟"!大会期间,河南云计算大数据产业联盟正式揭牌. 昨天上午,由省政府指导,河南省通信管理局和省网信办共同主办的河南省第三届互联网大会在郑州美盛喜来登酒店开幕. 中国工程院院士邬江兴.阿里研究院高级顾问梁春晓.中国电子商务协会副理事长郑砚农等业内著名专家,以及国内互联网巨头阿里巴

第八届中国云计算在京召开:云计算大数据加速发展

由中国电子学会主办的第八届中国云计算大会5月18日~20日在北京国家会议中心盛大召开.本次会议由工业和信息化部.中国科学技术协会.北京市人民政府指导,中国云计算技术与产业联盟.中国大数据专家委员会.中国电子学会云计算专家委员会承办,世界工程组织联合会创新专委会(WFEO-CEIT)作为协办单位,ZD至顶网.计世资讯.锦囊专家协办,大会主题为"技术融合,应用创新".工业和信息化部副部长怀进鹏出席会议并讲话,云计算大数据领域的9位院士和200多位专家在全体大会和专题论坛上作报告,三天共有超

第八届中国云计算大会寻找双创明星:云计算大数据创新创业评选正式启动

近年来,国内云计算大数据领域的技术创新成果不断涌现,创业项目层出不穷,正成为创新创业的重要领域和方向.为了更好地推动云计算大数据创新创业健康发展,由中国云计算技术与产业联盟.中国大数据专家委员会和中国电子学会云计算专家委员会主办的"2016云计算大数据创新创业评选"活动,于2016年3月正式启动,并将在5月19日的第八届中国云计算大会(http://ciecloud.org/2016)上发布评选结果.   "2016云计算大数据创新创业评选" 一经推出就获得了广泛关

云计算大数据“一带一路”国际合作论坛在京举行

本文讲的是云计算大数据"一带一路"国际合作论坛在京举行[IT168 资讯]2017年6月13日,由中国电子学会主办的云计算大数据"一带一路"国际合作论坛在北京国家会议中心成功举办.中国科协国际联络部副部长王庆林出席会议并致辞.中国电子学会副理事长兼秘书长徐晓兰主持开幕式. ▲中国科协国际联络部副部长王庆林致辞 ▲中国电子学会副理事长兼秘书长 徐晓兰 主持开幕式 中国.印度.新加坡.斯里兰卡.缅甸.尼泊尔.澳大利亚.乌克兰.塞尔维亚.立陶宛.保加利亚.沙特阿拉伯.孟加

揭密出席第九届中国云计算大会的专家—近20个国家学者共话云计算大数据生态、应用

2017年6月14日-16日,一年一度的第九届中国云计算大会将在北京国家会议中心拉开大幕.中国云计算大会迄今已经成功召开八届,历届大会都受到云计算大数据领域院士.专家.产业高管.技术大咖以及其他各界人士的关注.支持和参与. 那么,今年围绕"生态构建 云化应用"的主题,又有哪些院士.专家.大腕将坐镇现场,共同为大家呈现一场云计算.大数据的科技盛宴呢? 近日,大会主办方透露,多位院士(拟)将出席本届大会,为大家带来具有权威性.前瞻性的主题分享,其中包括中国科学院院士.中国电子学会云计算专家