开源大数据周刊-第35期

阿里云E-MapReduce实践

  • 如何在E-MapReduce上使用引导操作安装kafka组件

当前E-MapReduce中没有kafka组件,需要额外安装。本文介绍如何用E-MapReduce引导操作来安装kafka_2.10-0.10.0.0版本。

资讯

  • 大数据行业成资本市场新宠 数据源或成大数据公司核心竞争力
    日前,大数据发展浪潮正在席卷全球,资本也敏锐追逐着高增长市场。大数据是我国的战略性新兴产业,而投资界持续看好大数据产业的发展未来,这种趋势明显增强。
  • LinkedSee灵犀获5000万元A轮融资,把大数据落地硬件运维
    LinkedSee灵犀的定位是运维大数据公司,主要侧重帮企业解决硬件运维方面的需求。 LinkedSee灵犀对市场的判断是,小微企业为了节约成本使用公有云会偏多,虽然不需要自己去维护机房,但仍需监控别人维护的状况,对这部分企业提供告警服务比较合适。而大企业依旧会用私有化部署,即使有业务迁移到共有云上,对机房管理的需求不是消失,而是转嫁到像阿里云这种底层IaaS厂商身上,也就是说,厂商的硬件维护成本是越来越高的,针对这种情况,提供一套监控维护方案就比较合适。
  • 2017年值得关注的十大IaaS云发展趋势
    如今各云服务供应商开始为客户提供更多选择,包括遍布全球各地的主机、更多虚拟化实例配置以及工作负载优化机制,同时亦推出了更多对云环境内数据进行管理与分析的选项。文章分析了 IaaS公有云市场在2017年又将迎来哪些转变

技术

  • Catalyst — Spark SQL中的函数式关系查询优化框
    Catalyst是Spark SQL中的一套函数式关系查询优化框架,本演讲将Catalyst中最为关键的TreeNode和Rule结构提炼出来,并用之实现了一个完整的带编译优化的Brainfuck解释器, 全部代码不到三百行。通过这个迷你解释器,观众将可以完整理解Catalyst的基本工作原理,并体会到函数式、申明式编程的强大
  • Apache Flink 1.2.0新功能概述
    文章介绍了Apache Flink 1.2.0新功能。在Apache Flink 1.1+版本上,社区主要的集中点在操作性(Operations)、生态系统(Ecosystem)、更广泛的用户(Broader Audience)以及应用特性(Application Features)等方面的开发
  • HBase RegionServer宕机数据恢复
    为了防止数据写入缓存之后不会因为RegionServer进程发生异常导致数据丢失,在写入缓存之前会首先将数据顺序写入HLog中。如果不幸一旦发生RegionServer宕机或者其他异常,这种设计可以从HLog中进行日志回放进行数据补救,保证数据不丢失。HBase故障恢复的最大看点就在于如何通过HLog回放补救丢失数据
  • Spark Streaming + Elasticsearch构建App异常监控平台
    文章介绍了美团使用Spark和ES在实时日志监控/查询中的一些实践

欢迎加入阿里云开源大数据交流钉钉群

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。

阿里云E-Mapreduce团队 出品

时间: 2024-09-11 14:28:07

开源大数据周刊-第35期的相关文章

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案 文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 5W1H(六何分析法)全景洞察大数据 我

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.5.0版本 交互式查询(支持hive.spark) 资讯 中国大数据发展10大趋势5大挑战 中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第13期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本 添加numpy库 支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署 支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本 集群整体运行情况的仪表盘 集群状态监控报警 资讯 从Hadoop Summit 2016看

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 大数据投资人必读:中国大数据发展与投资分析报告 随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警 作业并行提交 添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警 完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘 集群状态监控报警 1.6.0版本 交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新 该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第41期

阿里云E-MapReduce动态 云数据库HBase公测开始 EMR产品价格全面优惠,价格和ECS自建一致 资讯 Spark Summit East 2017 Spark Summit East 2017 recap 阿里云VS亚马逊AWS:两者之间到底有多大差距? 随着阿里巴巴与亚马逊公司先后发布2016年第四季度的财报,云计算鼻祖亚马逊AWS与云计算新贵阿里云最新业绩之间的比较又成为了云计算领域的一个热点.亚马逊AWS季度销售额达到35亿美元,全年销售额达到122亿美元,两个数字都创下历史新

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型 国际站上线,海外用户可以购买E-MapReduce服务 资讯 看行业观察家和技术专家对大数据在2017年的发展预测 业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技