开源大数据周刊-第33期

阿里云E-MapReduce实践

  • 使用E-MapReduce服务将Kafka数据导入OSS
    kafka是一个开源社区常用的消息队列,对阿里云文件存储系统OSS没有官方的支持。本文通过一个例子,实现了kafka的数据写入阿里云OSS。

资讯

  • 能源行业将被重构,大数据有哪些“挖”法?
    能源互联网的风口已来。在能源 互联网应用中非常重要的一点,是要对每一个节点进行精准画像,以能源用户为中心,将每个用能设备各个环节数据化,提高管理能力,产生新的价值。
  • 到2017年,大数据有望实现这六大预言
    大数据正在以开天辟地的方式让企业获得巨大的潜能,到2017年有望实现六大预言。
  • Face++融资1亿美元,曾为马云刷脸
    人脸识别服务Face++开发商旷视科技(Face++)宣布完成新一轮融资,投资者包括富士康、建银国际控股。 Face++成立已有五年,已为包括公安部、中信集团、平安集团、阿里巴巴、东软集团、万科、滴滴出行提供了智能数据服务。
  • 2016年十大数据泄露事件:社交网络成泄露重灾区
    近年来,随着互联网、大数据的发展,数据安全已经成为时下人们最为关注的问题。本文从今年全球范围内所发生的数据泄露事件中,选出了十个经典案例,以供参考。
  • (技术)Hadoop平台中SQL优化的四个思路
    本文介绍了如何快速找到SQL的性能优化点。首先简单介绍了当前主流计算机硬件的性能指标,结合性能指标提出了四个优化方向:减少数据访问(减少磁盘访问),减少中间结果量(减少网络传输或磁盘访问),减少交互次数(减少网络传输、减少调度开销),改进算法,减少服务器CPU开销(减少CPU及内存开销)。
  • (技术)Apache Spark:大数据处理统一引擎
    在大数据领域,不同的计算模型越来越多,用户需要一个 统一的系统将不同的模型整合到一起。本文介绍了spark的编程模型,性能,主要的功能组件,未来的发展方向。
  • (技术)新加坡政府数据科学部门如何利用大数据协助诊断环线地铁故障
    本文揭示了新加坡政府是如何利用大数据技术来捕获引发地铁被中断的反常列车,我们得以再一次见识大数据技术的神奇力量。

欢迎加入阿里云开源大数据交流钉钉群

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。

阿里云E-Mapreduce团队 出品

时间: 2024-10-22 15:46:57

开源大数据周刊-第33期的相关文章

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 5W1H(六何分析法)全景洞察大数据 我

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.5.0版本 交互式查询(支持hive.spark) 资讯 中国大数据发展10大趋势5大挑战 中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第13期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 从Hadoop Summit 2016看

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 大数据投资人必读:中国大数据发展与投资分析报告 随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新 该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案 文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第30期

阿里云E-MapReduce实践 泰为在E-MapReduce上的考量与实践 阿里云EMR是基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务OSS等云服务进行无缝数据交换,方便用户将数据在存储平台和计算平台之间进行输入输出,以满足不同业务类型的需要,所以对阿里云EMR充满期待. HIVE MapJoin在E-MapReduce上的调优与处理总结 HIVE被很广泛的使用,使用过程中也会遇到各种千奇百怪的问题.这里就遇到的MapJoin Local 内存不足的问题进行讨论,从问题

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型 国际站上线,海外用户可以购买E-MapReduce服务 资讯 看行业观察家和技术专家对大数据在2017年的发展预测 业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技