开源大数据周刊-第16期

阿里云E-Mapreduce动态

E-Mapreduce团队

1.4版本（已经发布）

作业运行失败报警
作业并行提交
添加sqoop、shell类型的作业

1.4.1版本（正在研发）

完善失败报警
完善定时任务，增加小时、分钟定时任务

1.5.0版本（正在研发）

集群整体运行情况的仪表盘
集群状态监控报警

1.6.0版本

交互式查询（支持hive、spark）

资讯

Apache Spark 2.0.0 发布，APIs 更新
该版本主要更新APIs，支持SQL 2003，支持R UDF ，增强其性能。

spark2.0技术预览，更易用、更快速、更智能
spark2.0统一了streaming与batch的api，引入了dataset，另外就是tungsten等性能优化，让spark成为更加优秀的分布式计算引擎。

Spark 分析与+ MongoDB 提供数据库即服务
MongoDB的快速部署，是其大受欢迎的主要原因。在其年度会议上，这个NoSQL数据库背后的公司展示了一系列的改进，包括与Spark分析的互联。

飞一般的感觉！当Spark遇到Redis~
一些内存数据结构比其他数据结构来得更高效;如果充分利用Redis，Spark运行起来速度更快。

变不可能为可能，Tachyon帮助Spark变小时级任务到秒
Tachyon就可以帮你让这些数据长期处于内存中并且在不同应用之间共享。

Spark多数据源计算实践及其在GrowingIO的实践
本文主要介绍如何使用Apache Spark中的DataSource API以实现多个数据源混合计算的实践。

用Spark进行大数据处理之机器学习篇
讨论机器学习概念以及如何使用Spark MLlib来进行预测分析。

Spark Streaming图片处理案例介绍
本文首先介绍了流式处理框架的设计原理、Spark Streaming 的工作原理，然后通过一个基于 Spark Streaming 编写的读取、分析、写入图片的示例帮助读者加深了解 Spark Streaming 的工作原理。

国内大数据相关会议

会议	地点	时间	费用
Strata + Hadoop World	北京	2016年8月04- 2016年8月06日	收费
2016北京云栖大会	北京	2016年08月07日	免费

版权声明

信息都是来自互联网，都给出了原文的链接，如果侵权，请联系我们，我们负责删除。
阿里云E-Mapreduce团队出品

历史周刊链接

开源大数据周刊-第15期
开源大数据周刊-第14期
开源大数据周刊-第13期
开源大数据周刊-第12期
开源大数据周刊-第11期
开源大数据周刊-第10期
开源大数据周刊-第9期
开源大数据周刊-第8期
开源大数据周刊-第7期
开源大数据周刊-第6期
开源大数据周刊-第5期
开源大数据周刊-第4期
开源大数据周刊-第3期
开源大数据周刊-第2期
开源大数据周刊-第1期

时间： 2024-10-21 21:48:57

开源大数据周刊-第16期

阿里云E-Mapreduce动态

资讯

国内大数据相关会议

版权声明

历史周刊链接

开源大数据周刊-第16期的相关文章

开源大数据周刊-第12期

开源大数据周刊-第15期

开源大数据周刊-第13期

开源大数据周刊-第17期

开源大数据周刊-第14期

开源大数据周刊-第45期

开源大数据周刊-第60期

开源大数据周刊-第36期

开源大数据周刊-第38期