【Hadoop Summit Tokyo 2016】基于Apache Spark的数据科学

本讲义出自Robert Hryniewicz在Hadoop Summit Tokyo 2016上的演讲,主要介绍了数据科学以及机器学习的相关基本概念以及机器学习的例子,并分享了机器学习的方法,还分享了K-means的聚类方法、决策树以及随机森林等相关知识。

时间: 2024-07-29 08:38:19

【Hadoop Summit Tokyo 2016】基于Apache Spark的数据科学的相关文章

【Hadoop Summit Tokyo 2016】Apache Spark & Apache Zeppelin的安全状态

本讲义出自Vinay Shukla在Hadoop Summit Tokyo 2016上的演讲,主要介绍了 Spark的安全体系.以及YARN AM上的Spark驱动以及Kerberos身份验证等相关内容,最后还介绍了SparkSQL的相关内容.

【Hadoop Summit Tokyo 2016】Apache NiFi的先锋派

本讲义出自Joe Percivall在Hadoop Summit Tokyo 2016上的演讲,主要对于Apache NiFi进行了介绍,还介绍了NiFi中新的特性,并且对于MiNiFi的相关概念以及架构设计进行了介绍. Apache NiFi是Apache基金会的开源项目,其设计目标是自动化系统间的数据流.基于其工作流式的编程理念,NiFi非常易于使用,强大,可靠及高可配置.两个最重要的特性是其强大的用户界面及良好的数据回溯工具.NiFi的用户界面允许用户在浏览器中直观的理解并与数据流举行交互

【Hadoop Summit Tokyo 2016】Apache Storm中的资源感知调度

本讲义出自Jerry Peng在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache Storm的相关知识内容.目前遇到的挑战和问题并且对于资源感知调度器进行了详细介绍.

【Hadoop Summit Tokyo 2016】Apache Hadoop 3.0 :YARN和MapReduce有什么新特性?

本讲义出自Junping Du在Hadoop Summit Tokyo 2016上的演讲,主要分享了在Apache Hadoop 3.0中YARN和MapReduce已经拥有和正在演进的新特性,并且对于Apache Hadoop 3.0 版本的时间轴进行了分享.

【Hadoop Summit Tokyo 2016】Apache NiFi速成课

本讲义出自Rafael Coss在Hadoop Summit Tokyo 2016上的演讲,主要分享了与Apache NiFi相关的知识,Apache NiFi 是一个易于使用.功能强大而且可靠的数据处理和分发系统,Apache NiFi 是为数据流设计.它支持高度可配置的指示图的数据路由.转换和系统中介逻辑.讲义中还讲解了与数据流相关的基本概念,以及在数据流的使用中面临的挑战和困难.

【Hadoop Summit Tokyo 2016】Apache NiFi 1.0概论

本讲义出自Koji Kawamura与Arti Wadhwani在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache NiFi的相关内容,并分享了Apache NiFi 1.0版本的增强以及目前 NiFi的边界,以及与NiFi相关的问题和未来展望.

【Hadoop Summit Tokyo 2016】当Spark邂逅智能电表

本讲义出自Michael Plazzer在Hadoop Summit Tokyo 2016上的演讲,主要分享了Spark在电力行业中的智能电表上的应用,并分享了通过大数据分析能源情况的研究以及能源时间数据序列的相关的内容.

【Hadoop Summit Tokyo 2016】Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来

本讲义出自Enis Soztutar与Ankit Singhal在Hadoop Summit Tokyo 2016上的演讲,在他们的演讲中按照HBase之上SQL的过去,现在和未来进行划分进行了分别的讲解,对于"过去"部分讲义中分享了Phoenix的基础.架构和目前具有的特点,在"现在"部分讲义中分享了Phoenix最新的版本以及Phoenix查询服务器,而在未来部分则分享了Calcite的集成以及Phoenix与HBase的相关知识.

【Hadoop Summit Tokyo 2016】中型组织的数据基础设施架构:收集、存储和分析的技巧

本讲义出自 Egor Pakhomov在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据收集.存储和分析的技巧,介绍了为什么SQL如此的重要以及如何在Hadoop中使用SQL,以及在数据存储过程中如何此案呢过做到使得存储的数据能够既能易于查询又能容易地进行改变,以及如何使用BI工具聚合数据.