开源大数据周刊-第31期

阿里云E-MapReduce实践

  • 专注年轻一代,基于E-MapReduce梨视频推荐系统
    在2016杭州云栖大会的“开源大数据技术专场”上,梨视频大数据负责人杨智带来了《基于E-MapReduce梨视频推荐系统》的精彩分享。分享中,他重点介绍了梨视频中基于阿里云的数据处理系统和梨视频推荐系统,精彩不容错过。

资讯

  • 上海社科院惠志斌:数据生态治理要啃硬骨头
    数据生态治理面临一场艰巨的战役,长期来看,这场战役的成败将决定移动互联网时代下公民的权利、企业的利益和社会的信任,更关系到数据时代国家的命运和前途
  • 数据科学与火箭科学如何将人类送上火星?
    在最近的CNN专栏中,奥巴马总统再次证实,美国将不遗余力地实行将载人航天器送上火星的任务。如果你觉得自己面临的数据科学难题太有挑战性,那你应该想一想,用挖掘数据的方式来探究火星远征对健康的影响,是多难的一件事
  • 一点资讯大数据揭露:《我不是潘金莲》争议背后的故事
    根据刘震云的同名小说改编的电影《我不是潘金莲》,由冯小刚执导、范冰冰主演,凭借冯、范二人的人气、影片技术和原作影响力,影片自开拍便备受瞩目,近日,一点资讯基于平台海量用户数据推出“《我不是潘金莲》电影大数据报告”
  • (技术)大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
    本文将介绍大数据系统一个最基本的组件:处理框架。处理框架负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据。数据的计算则是指从大量单一数据点中提取信息和见解的过程。
  • (技术)大数据时代快速SQL引擎-Impala
    在Dremel论文发表之后,开源社区涌现出了一批基于MPP架构的SQL-on-Hadoop(HDFS)查询引擎,典型代表有Apache Impala、Presto、Apache Drill、Apache HAWQ等,看上去这些查询引擎提供的功能和实现方式也都大同小异,本文将基于Impala的使用和实现介绍日益发展的基于HDFS的MPP数据查询引擎。
  • Apache 基金会宣布 Geode 升级为顶级项目
    Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用,最初由 GemStone Systems 公司开发(位于美国俄勒冈州的比弗顿市),商标为 GemFire。 此项技术初期被广泛应用在金融领域, 用于华尔街交易平台,作为事务性, 低延时的数据引擎。2015年4月将 代码提交给 Apache 孵化器作为孵化项目。
  • (技术)主流大数据SQL引擎技术博弈,谁为王?
    近日,AtScale公布了第四季度主流大数据SQL引擎的测试结果,主要针对Spark、Impala、Hive/Tez以及Presto。

欢迎加入阿里云开源大数据交流钉钉群

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |
| CBIS 2016中国(上海)大数据产业创新峰会 | 上海 | 2016.12.1 | 2080元起 |

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。

阿里云E-Mapreduce团队 出品

时间: 2024-07-29 02:47:02

开源大数据周刊-第31期的相关文章

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 5W1H(六何分析法)全景洞察大数据 我

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.5.0版本 交互式查询(支持hive.spark) 资讯 中国大数据发展10大趋势5大挑战 中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第13期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 从Hadoop Summit 2016看

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 大数据投资人必读:中国大数据发展与投资分析报告 随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新 该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案 文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型 国际站上线,海外用户可以购买E-MapReduce服务 资讯 看行业观察家和技术专家对大数据在2017年的发展预测 业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技

开源大数据周刊-第38期

阿里云E-Mapreduce动态 E-MapReduce 2.3.1镜像版本(已发布) 基础镜像CentOS 6.5内核版本升级到2.6.32-642 支持Hadoop YARN Job failover 资讯 大数据的寒冬已至,谁将倒下,谁成巨人? 本文就近期百分点和亚信数据内部人事调整的新闻出发,提出了"大数据寒冬已至"的观点,而过度竞争是大数据寒冬的主要因素.对于未来大数据公司如何生存,文章中提出了产品聚焦.成本控制等方向,为度过寒冬做准备. 大数据第一案,微博为什么赢了? 微博