开源大数据周刊-第13期

阿里云E-Mapreduce动态

E-Mapreduce团队

1.3.4版本 (已经发布)

  • 升级jdk到1.8
  • 升级Hadoop到2.7.2
  • 添加python2.7.1及python3.4版本
  • 添加numpy库
  • 支持Presto、phoenix、jstorm、oozie
  • 支持Hadoop跟Hbase混合部署
  • 支持深圳、上海机房

1.4版本(正在研发):

  • 用户执行计划及集群运行状态自定义报警

1.4.1版本

  • 集群整体运行情况的仪表盘
  • 集群状态监控报警

资讯

从Hadoop Summit 2016看大数据行业与Hadoop的发展
总体来讲,Hadoop在各行各业得到了广泛的应用,在IOT、机器学习、实时方向是最近的热点。

从理论到实践,深谈大数据可视化
大数据的挑战在于数据采集、存储、分析、共享、搜索和可视化。本文的目的是通过介绍传统可视化方法及其在处理大数据时的扩展方法,来展现大数据可视化的前沿技术。同时讨论大数据可视化的挑战,并其取得的进步

spark结构化数据处理:Spark SQL、DataFrame和Dataset
spark的三种查询语言的详细对比。

Spark数据分析实战:大型活动大规模人群的检测和疏散
主要是以一个数据分析者的角度来与大家分享如何使用spark进行大数据分析。

spark流数据处理:Spark Streaming的使用
已经有越来越多的公司使用spark streaming,本文深入分析了spark streaming及在用的过程中遇到的问题,值得一看。

Spark大数据处理系列之Machine Learning
对spark mllib有一个简单的介绍,新入门的同学可以看下。

spark 应用程序性能优化|12 个优化方法
讲述了spark 12个性能优化的点,例如:avoid shuffle when possible、use reduceByKey instead of GroupByKey when possible等

国内大数据相关会议

会议 地点 时间 费用
2016上海china Hadoop Summit 上海 2016年07月29日-2016年07月30日 收费
Strata + Hadoop World 北京 2016年8月04- 2016年8月06日 收费
2016北京云栖大会 北京 2016年08月07日 免费

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。
阿里云E-Mapreduce团队 出品

历史周刊链接

开源大数据周刊-第12期
开源大数据周刊-第11期
开源大数据周刊-第10期
开源大数据周刊-第9期
开源大数据周刊-第8期
开源大数据周刊-第7期
开源大数据周刊-第6期
开源大数据周刊-第5期
开源大数据周刊-第4期
开源大数据周刊-第3期
开源大数据周刊-第2期
开源大数据周刊-第1期

时间: 2024-11-03 00:43:27

开源大数据周刊-第13期的相关文章

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.5.0版本 交互式查询(支持hive.spark) 资讯 中国大数据发展10大趋势5大挑战 中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 大数据投资人必读:中国大数据发展与投资分析报告 随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新 该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案 文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 5W1H(六何分析法)全景洞察大数据 我

开源大数据周刊-第28期

阿里云E-Mapreduce动态 E-Mapreduce产品即将发布的版本信息如下: 1.5.2版本 增加预定制配置,如试用型/入门配置/高计算配置/高存储配置等 1.6.0版本 交互式查询(支持Hive.Spark) 资讯 干货报告丨医疗大数据的行业应用研究 报告从医疗大数据的概念.政策财政支持.发展背景以及现状,到相关具体的应用场景进行了详细介绍,该领域具有广阔的前景. 大数据的价值:找到别人的"集体智慧" 作者为数据咨询师车品觉,文章主要内容:①大数据行业正在发生三大颠覆性变化:

开源大数据周刊-第61期

EMR资讯: 在北京举行的Strata Data 会议上,EMR团队的木艮进行了<Hadoop遇到云上对象存储--实现原理.陷阱和性能优化>的主题分享 EMR + ECS D1机型的数据高可靠方案进行中,8月底将会正式提供服务. EMR团队将会在Hadoop上进行改造,支持阿里云的主子账号的AK认证访问Hadoop体系. 资讯 全球最顶级大数据盛会Strata Data Conference在北京成功落幕 2017年7月13-15日,全球最顶级大数据会议Strata Data Conferen

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型 国际站上线,海外用户可以购买E-MapReduce服务 资讯 看行业观察家和技术专家对大数据在2017年的发展预测 业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技