大数据技术应用列表Top10,还不快一键收藏起来!

1.Hadoop

Hadoop是稳定企业实力和其他一切工作的基础。你需要利用YARN,HDFS和Hadoop中的基础设施,存储原始数据以及运行关键的大数据服务和应用程序。

2.Spark

Spark易于使用,并且支持所有重要的大数据语言(Scala,Python,Java,R)。同时,Spark还是一个巨大的生态系统,发展迅速,便于支持microbatching/batching/SQL。这是另一个不费脑筋的技术。

3.NiFi

NiFi是NSA工具,它可以用最少的编码和一个光滑的UI,提供简单的数据摄取、存储和处理各种来源数据。这些数据的来源包括社交媒体,JMS,NoSQL,SQL,Rest/JSONFeeds,AMQP,SQS,FTP,Flume,ElasticSearch,S3,MongoDB,Splunk,Email,HBase,Hive,HDFS,AzureEventHub,Kafka等等。如果NiFi没有你需要的来源或汇集,你可以为NiFi直接用Java代码编写自己的处理器。NiFi是另一个推荐选入工具箱中的Apache项目,是大数据工具中的瑞士军刀。

4.ApacheHive2.1

ApacheHive是运行在Hadoop之上的永久SQL解决方案。在ApacheHive2.1最新版本中,性能和功能上的增强使Hive成功作为SQL大数据解决方案留在榜单。

5.Kafka

Kafka是大数据系统间进行异步、分布式消息传递的选择,它能够进入大多数的堆栈。从Spark到NiFi,到第三方工具,再到Java和Scala,它很好地维系了系统。Kafka需要在栈中应用。

6.Phoenix-HBase

由于很多公司都在应用HBase,也就导致了这个开源项目的数据规模极大。在HDFS支持下,NoSQL能够很好地集成所有工具。所以,在HBase上额外构建的Phoenix成为了NoSQL首选。这增强了HBase的SQL、JDBC、OLTP和运营分析能力。

7.Zeppelin

在使用Hive,Spark,SQL,Shell,Scala,Python以及许多其他的数据挖掘和机器学习工具时,Zeppelin是一款便捷、集成性较高的notebook工具。在易于使用的同时,Zeppelin能够以很好的方式来探索和查询数据。而且这个工具可以支持多种环境和功能,用户只需要经常更新图表和映射数据即可。

8.SparklingWater

SparklingWater弥补了Spark中MachineLearning和其他工作间的空缺,提供所有可能用到的机器学习服务。

9.ApacheBeam

ApacheBeam是一个用Java编写的统一框架,用于数据处理和管道开发。同时,它也可以支持Spark和Flink。其他的框架很快也会上线,用户不必再去学习太多的框架。

10.StanfordCoreNLP

NaturalLanguageProcessing目前应用极广且增长迅速,StanfordCoreNLP也在不断地提高他们的框架性能。

时下有数不清的大数据项目,所以最好的办法就是合并及测试不同项目版本,来确保他们在安全和管理上都能够顺畅运行。

本文转自d1net(转载)

时间: 2024-09-13 20:52:40

大数据技术应用列表Top10,还不快一键收藏起来!的相关文章

除Hadoop外你还需要知道的9个大数据技术

Hadoop是大数据领域最流行的技术,但并非唯一.还有很多其他技术可用于解决大数据问题.除了Apache Hadoop外,另外9个大数据技术也是必须要了解的. Apache Flink Apache Samza Google Cloud Data Flow StreamSets Tensor Flow Apache NiFi Druid LinkedIn WhereHows Microsoft Cognitive Services Apache Flink:是一个高效.分布式.基于Java实现的

时下最热开源大数据技术TOP10

文章讲的是时下最热开源大数据技术TOP10,眼下大数据成为最热技术,并且呈现爆炸式增长.全世界的新项目雨后春笋般的出现.对于这些新的公司.项目来说,利好就是所有可用的技术是开放源代码的,直接采用. 海外开发者Tim做了一个整理,小编最快速为大家呈现.(ps:不足之处,请来信指正,我的微信就在文章最下方)以下是十大热门开源的大数据技术: 1.Hadoop 特点高可用,能够为你的数据存储项目提供所需的YARN.HDFS和基础架构,并运行关键的大数据服务和应用程序. 2.Spark 易使用.支持所有重

《Spark大数据分析:核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问"华章计算机"公众号查看. 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都与大数据

Facebook前主管谈大数据技术趋势和演变

本文讲的是Facebook前主管谈大数据技术趋势和演变,全球系统架构师大会于8月10-12日在深圳万科国际会议中心隆重举行.首先给大家带来分享的是前Facebook数据基础设施团队主管,Qubole创始人,CEO Ashish Thusoo,他主要介绍了大数据架构以及怎么样不断的演进,与其说演进,不如说革命.其中主要包括三个方面的主题: ▲全球系统架构师大会现场报道 第一,大数据的需求.当今世界需要大数据,有哪些驱动因素促使我们不同方式考虑大数据?以不同方式处理数据. 第二,技术给我们带来哪些架

《Spark大数据分析:核心概念、技术及实践》一 第1章 大数据技术一览

第1章 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都与大数据有关,而且这类项目的数量在迅速增长.聚焦在大数据方向的创业公司在近年来呈爆发式增长.很多知名公司在大数据技术方面投入了大笔资金. 尽管"大数据"这个词很火,但是它的定义是比较模糊的.人们从不同方面

大数据技术在发展 挑战与机遇并存

大数据技术是在传统数据处理手段无法应对海量数据的实时需求的情况下,采用新的信息技术来应对大数据爆发进行数据处理的技术.大数据技术一般可以包括基础架构支持.数据采集.数据存储.数据计算和数据展现交互等. 大数据技术的分类 大数据技术涵盖的范围十分广阔.基础架构支持方面主要包括了支撑大数据处理的基础架构级数据中心管理.云计算平台.云存储设备及技术.网络技术.资源监控等技术.而为了处理数据,则需要有大规模物理资源的云数据中心和具备高效的调度管理功能的云计算平台的支撑. 数据采集技术方面包含了数据采集的

115期:在线大数据技术峰会回顾合集!

本期头条   票选最美云上大数据暨大数据技术峰会上,阿里云飞天一部计算平台高级专家无庸为大家带来题为"高可用大数据计算服务如何持续发布和演进"的演讲.本文先对MaxCompute架构进行了介绍,接着重点介绍在大数据计算服务下,高可用服务持续改进和发布的工具,包括Playback工具.Flighting工具和灰度上线.细粒度回滚等,点击查看. • [资料合集]在线大数据技术峰会:讲义PDF+活动视频! • 提速1000倍!阿里率先采用Intel Optane SSD • 东京见闻:快速走

中国大数据技术大会走向新阶段

摘要: 由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,中科院计算所与CSDN共同承办的第七届中国大数据技术大会(Big Data Technology Conference 2013,BDTC 2013) 将于2013年12月5-6日在北京世 由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,中科院计算所与CSDN共同承办的第七届中国大数据技术大会(Big Data Technology Conference 2013,BDTC 2013)将于2013年12月5-6日在北

仁人帮探索大数据技术

前两期小帮为大家介绍了仁人帮的大数据定义与大数据在仁人帮后台的应用.今天也不跟大家卖关子了,接下来,小帮为大家奉上的是大数据平台技术的探索. 大数据技术,小帮认为可以分成两个大的层面,大数据平台技术与大数据应用技术.要使用大数据,你先必须有计算能力,大数据平台技术包括了数据的采集,存储,流转,加工所需要的底层技术,如hadoop生态圈,数加生态圈. 数据的应用技术是指对数据进行加工,把数据转化成商业价值的技术,如算法,以及由算法衍生出来的模型,引擎,接口,产品等等.这些数据加工的底层平台,包括平