开源大数据周刊-第46期

阿里云E-MapReduce实践

  • 云HBase建设之开篇
    阿里云云HBase团队在2月份推出了云HBase产品,此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化,本系列将会为用户详细介绍这些点。

资讯

  • 自助式大数据分析时代正在来临
    对于大数据而言,更多企业和机构在存储和处理各种形态和规模的数据,并从中提取有价值的信息。Gartner在其2017年《商业智能和分析平台魔力象限》中提到的Tableau预测:随着数据管控和保护系统以及大数据分析系统的日趋成熟,人们将要迎来自助式大数据分析时代。
  • 云计算与移动化成为新型智慧城市"助推器"
    在今年两会上,智慧城市成为一个高频词。两会代表指出:新型智慧城市已经成为未来城市进化的方向,要充分利用云计算、大数据等新一代信息技术,形成具备可持续、内生动力的安全、便捷、高效、绿色的智慧宜居新形态。那么,在推动新型智慧城市落地方面,需要具备哪些关键的能力呢?
  • 告别盲目建设大数据,国家即将出台两项大数据重要标准
    企业用户如何避免在大数据建设中“东一榔头西一锤子”?或者完全被厂商牵着鼻子走?如何能真正获取大数据的价值?这都是企业用户在大数据建设中真正关注的问题。现在,能帮助企事业机构更系统、更科学地建设和使用大数据的参考标准来了。
  • (技术)SparkSQL的3种Join实现
    Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。SparkSQL作为大数据领域的SQL实现,自然也对Join操作做了不少优化,今天主要看一下在SparkSQL中对于Join,常见的3种实现。
  • (技术)Hadoop生态安全管理框架Apache Ranger升级为顶级项目
    Apache Hadoop生态系统中的安全管理框架Apache Ranger晋升为顶级项目。Range是一种定义和管理安全策略的集中式组件,这些安全策略在受支持的Hadoop组件间强制执行,包括Apache HBase、Hadoop(HDFS和YARN)、Apache Hive、Apache Kafka、Apache Solr等。
  • (技术)获得PCC性能大赛背后的RocksDB引擎:5分钟全面了解其原理
    在 3 月 4 日举办的高可用架构 PCC 性能挑战赛上(PCC 是 Performance Challenge Championship 的缩写),以 RocksDB 为存储的队伍获得了显著的优势。在另外一方面,RocksDB 被存储相关架构师在各种讨论中反复提及,高可用架构翻译了官方的 rocksdb 基础说明,让读者 5 分钟可以全面了解。PCC 大赛的获奖作品将会另文介绍。。
  • (技术)Apache Kylin - 大数据时代的OLAP利器
    ApacheKylin 是一个Hadoop生态圈下的MOLAP系统,是eBay大数据部门从2014年开始研发并开源的支持TB到PB级别数据量的分布式OLAP分析引擎。

欢迎加入阿里云开源大数据交流钉钉群

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。

阿里云E-Mapreduce团队 出品

时间: 2024-09-21 09:48:54

开源大数据周刊-第46期的相关文章

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案 文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 5W1H(六何分析法)全景洞察大数据 我

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.5.0版本 交互式查询(支持hive.spark) 资讯 中国大数据发展10大趋势5大挑战 中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第13期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 从Hadoop Summit 2016看

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 大数据投资人必读:中国大数据发展与投资分析报告 随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新 该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第43期

阿里云E-MapReduce动态 E-MapReduce发布新版本,可以在控制台管理meta表结构. 资讯 人脸识别,要靠哪些技术支撑,是否会泄露个人隐私? 本文介绍人脸识别用到哪些技术,讨论如何保护用户隐私 一图看懂AI阵营:学习AI 站错队可导致自取灭亡 本文介绍现在AI技术阵营,对AI各流派进行细分,梳理了17种方法,并用 图直观展现. 物联网大规模爆发成既定现实 安全标准亟待建立 物联网大规模爆发式增长的序幕已经开启.但在物联网发展中不断涌现新技术的同时,新问题也逐渐暴露出来. 大数据投

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型 国际站上线,海外用户可以购买E-MapReduce服务 资讯 看行业观察家和技术专家对大数据在2017年的发展预测 业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技