2017年大数据领域,这7大技术将退役!

文章讲的是2017年大数据领域,这7大技术将退役,我们已经在大数据领域进行了很长时间的探险了,虽然大数据已经不再让人眼前一亮和感到新鲜,但技术的不断更新足以让你时刻关注这个领域。同时,这也是很多企业技术更新最快的领域,但还是有一些技术会长期占据靠前的位置,直到有更好的替代品出现为止。

  许多技术在未来面临着很大变化,或者重大升级。以下的这些技术,你或许可以考虑替换掉了:

  1、MapReduce。 MapReduce速度很慢,它很少成为解决问题的最佳方式。还有其他算法可供选择 - 最常见的是DAG,其中MapReduce可以被认为是一个子集。如果你做了一堆自定义的MapReduce作业,Spark在性能上的优势绝对值得你为了切换在Spark上运行付出的成本。

  2、Storm,虽说不敢确定Spark是否占据了整个流媒体市场。但是相比于Spark而言,Apex或者Flink似乎在性能上更加优秀,有着更低的延迟,更适合作为Storm的替代品。选用工具之前,你应该先评估你能允许的延迟范围是多少以及代码的最低出错率是多少。Hortonworks作为Storm的唯一支持者,也在面临着越来越大的市场压力,未来的Storm可能不会得到太多关注。

  3、Pig。Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig最大的作用就是对mapreduce算法(框架)实现了一套shell脚本 ,类似我们通常熟悉的SQL语句。但Pig现在也备受打击,似乎用它可以完成的事情,很多其他技术也可以完成。

  4、Java。不仅仅是JVM,而是一门编程语言。大数据很多任务所用的语法都很笨重。而且,即便是Lambda这样较新的结构也以一种尴尬的方式被放在一边。大数据的世界中很多工作已经转移到Scala和Python上了(如果你能承受性能损失,可以使用Python库或雇佣Python开发人员)。 当然,你可以使用R语言的stats包,但最后你可能还是会用Python重写它,因为R语言缺少很多特征。

  5、Tez。这是Hortonworks的另一个项目,支持DAG作业的计算框架,而其开发人员认为Tez更像是“汇编语言”。与此同时,随着Hortonworks将其发布,你就完全不需要在Hive或者其他工具之后使用它了,你可以在其发行版中使用Spark作为引擎。 虽说发行了,但Tez总是有各种bug。 同样地,这也是一个供应商项目,没有其他技术厂商或社区支持。相比其他解决方案,它似乎并没有什么优势。

  6、Oozie。它不是一个单纯的工作流引擎或调度程序,它二者都是。它并不难用,与Tez相比,Tez偏底层,Oozie偏顶层,但你应该可以在StreamSets,DAG实现和其他工具之间,找到可以替代Oozie的。

  7、Flume。 在StreamSets、Kafka以及其他解决方案之间,你总能找到一个足以替代Flume的。 Apache Flume是一个分布式、高可靠和高可用的收集、集合和将大量来自不同来源的日志数据移动到一个中央数据仓库。目前有两个可用的发布版本,0.9.x和1.x。但Flume是时候快速发展了,再不往前一步,就只能后退了。

  可能2018年会这样......

  接下来会发生什么?一些技术可能已经到年龄了,但完全合适的替代品可能还没出现。

  1、Hive。Hive好像是地球上性能最差的分布式数据库。如果没有数据仓库这个概念,谁会开发这样一个东西呢?只在数据仓库的统计分析上有些用处,不适用于所有要求低延迟的任务。

  2、HDFS。在Java中编写系统级服务不是最好的想法。Java的内存管理也使得推送大量的字节有点慢。HDFS NameNode的工作方式不是很理想,并构成瓶颈。各种供应商都有解决方法,但老实说,更好的工具是存在的,还有其他分布式文件系统,比如MaprFS就是一个不错的选择,还有Gluster.......

  结语

  总结下来,未来的Spark、Apex、Flink还有着广阔的发展前景,而Storm、Hive、HDFS等等看起来已经过时或者用处不大的技术应该从你的名单上剔除了。或者也可以看看,还有哪些值得添加到名单里的,评论告诉我。

作者:zyy

来源:IT168

原文链接:2017年大数据领域,这7大技术将退役!

时间: 2024-10-26 14:28:31

2017年大数据领域,这7大技术将退役!的相关文章

2017年大数据领域的十大趋势

文章讲的是2017年大数据领域的十大趋势,曾有媒体将2013年称为"大数据元年",经过两三年大数据依然热度不减,但是也有专家认为前几年大数据一直处于一个很尴尬的局面,大数据不接地气,人人都在谈大数据,但真正应用大数据的人很少.2016年,各行各业的大数据应用都渐渐从空洞的理论落地,所以很多专家认为2016年才是真正意义上的大数据元年. 无论如何,大数据已经成为IT领域的流行趋势.据不完全统计,2016年1-6月,全球大数据行业共计发生157起投融资事件,涉及金额超过600亿元,亚马逊.

深耕大数据领域 联想斩获大数据产业大奖

 近日,主题为"产业互联网时代的云计算和大数据"的2016中国软件大会在北京新世纪日航酒店盛大召开,联想集团副总裁.首席研究员田日辉荣获"2016中国大数据产业十大领军人物"奖.这次评奖是对活跃在中国软件和信息技术服务产业链上下游的实力企业.领袖人物的集中肯定,而"中国大数据产业十大领军人物"的荣誉桂冠,更是对我国大数据产业发展做出突出贡献的领袖人物的褒奖. 田日辉自2011年起负责联想集团大数据平台业务,构建了联想统一的大数据整合平台.端到端的

2016大数据领域最有“钱”途的十大职业

缺人,这是全国乃至全球大数据圈都挺蛋疼的一件事儿,一边是"大数据热"疯狂蔓延,一边是 "供血"严重不足.企业家们着急得很,服务器齐齐杵那儿,光耗电不输出也很闹心.Gartner公司早前预测,2015年仅凭大数据就能为全球增加440万个就业岗位,但只有三分之一的岗位可以招到人,意味着近300万的岗位"虚位以待". 而2015年,中国的大数据人才缺口已经超过100万人.在技术.资本和市场的强推下,大数据今年发展的势头更加迅猛了,但大数据人才只有46万

联想大数据入选工信部国家“大数据优秀产业、服务和应用解决方案”

   近日获悉,由联想创投集团大数据平台推出的"联想大数据企业应用解决方案"成功入选由工信部组织的全国"大数据优秀产业.服务和应用解决方案"征集.该方案聚合了联想创投集团在大数据领域的多项技术成果与行业经验,成为国内极具影响力的企业级大数据平台及多行业解决方案. 此次征集是国内首次在大数据领域进行的政府权威征集."联想大数据企业应用解决方案"以全球部署超大规模集群的行业实力.多年海量数据分析与持续性业务支撑的行业积累.行业领衔的先进技术.多角度贴

盘点2016年大数据领域成果及趋势

2016即将结束,外媒KDnuggets日前针对大数据领域在2016年度取得的重大发展,以及2017年度可能出现的变化趋势,询问了8位行业内的顶级专家. 虽然各位专家的意见不尽相同,但从其发言中大约可以总结出一个共通点:大数据研究正在由前几年的新鲜技术变得越来越普及和商业化.同时,由于研究的向前推进,以数据为基础的人工智能.机器学习和物联网等其他各个领域也将会取得越来越大的成果. 1. Craig Brown,大数据.数据科学.数据库技术领域专家.美国知名的青年导师.科技导师,以及作家. 在20

大数据领域2016年有哪些成果及趋势?听听专家怎么说

外媒KDnuggets日前针对大数据领域在2016年度取得的重大发展,以及2017年度可能出现的变化趋势,询问了8位行业内的顶级专家. 虽然各位专家的意见不尽相同,但从其发言中大约可以总结出一个共通点:大数据研究正在由前几年的新鲜技术变得越来越普及和商业化.同时,由于研究的向前推进,以数据为基础的人工智能.机器学习和物联网等其他各个领域也将会取得越来越大的成果. 1. Craig Brown,大数据.数据科学.数据库技术领域专家.美国知名的青年导师.科技导师,以及作家. 在2016年,数据科学领

大数据领域在 2016 年都有哪些成果及趋势?

外媒KDnuggets日前针对大数据领域在2016年度取得的重大发展,以及2017年度可能出现的变化趋势,询问了8位行业内的顶级专家. 虽然各位专家的意见不尽相同,但从其发言中大约可以总结出一个共通点:大数据研究正在由前几年的新鲜技术变得越来越普及和商业化.同时,由于研究的向前推进,以数据为基础的人工智能.机器学习和物联网等其他各个领域也将会取得越来越大的成果. 1.CraigBrown,大数据.数据科学.数据库技术领域专家.美国知名的青年导师.科技导师,以及作家. 在2016年,数据科学领域出

2017年大数据发展的十大趋势以及在各行业的应用潜力

2016年,大数据已从前两年的预期膨胀阶段.炒作阶段转入理性发展阶段.落地应用阶段.2017年,大数据依然处于理性发展期,依然存在诸多挑战,但前景依然非常乐观.2017年大数据的发展呈现十大趋势: 趋势1:越来越多的企业实现数据孤岛的打通,驱动大数据发挥更强的威力 企业启动大数据最重要的挑战是数据的碎片化.在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不通,导致企业内部数据无法打通.若不打通,大数据的价值则难以挖掘.大数据需要不

大数据领域33个预测,开启未知的2016

数据平民崛起 甲骨文公司预测一种新型用户:数据平民(Data Civilian)会崛起.该公司称:"虽然复杂的数据统计可能仍局限于数据科学家,但数据驱动的决策不会是这样.在未来一年,更简单的大数据发现工具让业务分析员可以寻找企业Hadoop集群中的数据集,将它们重新做成新的混搭组合,甚至运用探索性机器学习方法来分析它们. "大数据"会消亡 Nucleus Research公司公开发表了不同意见,预测我们所知道的大数据会消亡.该公司称:"在过去两年,每家公司及其人员似