开源大数据周刊-第50期

资讯

谷歌TPU之后还有高通，人工智能芯片竞赛已经展开

谷歌有了自己的人工智能芯片TPU，现在构建适用于深度学习的计算芯片已成为所有科技巨头共同的发展目标，英特尔、高通、英伟达等都在人工智能芯片上投入巨大，芯片公司正在争相占领这个新的市场。
火力全开：大数据领域2017年全景剖析
大数据技术用了多年时间进行演化，才从一种看起来很酷的新技术变成企业在生产环境中实际部署的核心企业级系统。本文从人工智能领域、企业并购情况、云端大数据竞争等方面展示了数据生态系统在2017年全景视图，并针对这一行业的见解总结为关键趋势。
Apache软件基金会宣布Apache CarbonData成为顶级项目
Apache CarbonData是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持“交互式分析、详单查询、任意维度组合的过滤查询等”多种大数据应用场景，并通过丰富的索引技术、字典编码、列存等特性提升了IO扫描和计算性能，实现百亿数据级秒级响应，与大数据生态Hadoop、Spark等无缝集成。

技术

Apache Kylin 在今日头条的实践

今日头条在去年引入了 Apache Kylin，主要帮助其加速多维分析。今日头条目前在一些重要场景下基于 Hive 构建 Kylin 的 Cube。例如头条用户的阅读行为分析，大多数情况下 Cube 查询都能做到秒级或者亚秒级。
Kudu vs. HBase
Cloudera在2016年发布了新型的分布式存储系统——Kudu。HBase作为Google BigTable的开源产品，一直是Hadoop生态圈中的核心组件，其数据存储的底层采用了HDFS，主要解决的是在超大数据集场景下的随机读写和更新的问题。Kudu的设计有参考HBase的结构，也能够实现HBase擅长的快速的随机读写、更新功能。那么同为分布式存储系统，HBase和Kudu二者有何差异？两者的定位是否相同？本文通过分析HBase与Kudu整体结构和存储结构等方面对两者的差异进行比较。
如何使用Solr、Spark、OpenTSDB和Grafana进行日志分析
各企业机构出于各种原因需要进行日志分析，典型使用场景包括预测服务器故障、分析客户行为及打击网络犯罪等。在本篇博客中展示了Cloudera公司如何使用自己的技术栈来提高开源软件的质量，如何使用开源工具构建一个日志分析框架。
用于图像分割的卷积神经网络：从R-CNN到Mark R-CNN
卷积神经网络（CNN）最初用于图像分类，但它的作用远不止分类那么简单。在本文中，我们将看到卷积神经网络如何在图像实例分割任务中使用，并提升其结果。

欢迎加入阿里云开源大数据交流钉钉群

版权声明

信息都是来自互联网，都给出了原文的链接，如果侵权，请联系我们，我们负责删除。

阿里云E-Mapreduce团队出品

时间： 2025-01-01 23:53:04

开源大数据周刊-第50期的相关文章

开源大数据周刊-第12期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.4版本 (已经发布) 升级jdk到1.8 升级Hadoop到2.7.2 添加python2.7.1及python3.4版本添加numpy库支持Presto.phoenix.jstorm.oozie 支持Hadoop跟Hbase混合部署支持深圳.上海机房 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 1.4.1版本集群整体运行情况的仪表盘集群状态监控报警资讯 5W1H(六何分析法)全景洞察大数据我

开源大数据周刊-第15期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警作业并行提交添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘集群状态监控报警 1.5.0版本交互式查询(支持hive.spark) 资讯中国大数据发展10大趋势5大挑战中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起.可视化推动大数据平民化.智能

开源大数据周刊-第13期

开源大数据周刊-第17期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警作业并行提交添加sqoop.shell类型的作业 1.4.1版本(已经发布) 完善失败报警完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘集群状态监控报警 1.6.0版本交互式查询(支持hive.spark) 资讯大数据投资人必读:中国大数据发展与投资分析报告随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海.大数据正以一

开源大数据周刊-第16期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(已经发布) 作业运行失败报警作业并行提交添加sqoop.shell类型的作业 1.4.1版本(正在研发) 完善失败报警完善定时任务,增加小时.分钟定时任务 1.5.0版本 (正在研发) 集群整体运行情况的仪表盘集群状态监控报警 1.6.0版本交互式查询(支持hive.spark) 资讯 Apache Spark 2.0.0 发布,APIs 更新该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强

开源大数据周刊-第14期

阿里云E-Mapreduce动态 E-Mapreduce团队 1.4版本(正在发布): 作业运行失败报警作业并行提交添加sqoop.shell类型的作业 1.4.1版本集群整体运行情况的仪表盘集群状态监控报警资讯创业公司如何构建数据指标体系? 对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴,作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法. 怎样选择数据平台的建设方案文中对比了MPP.Hadoop传统的数据库等不同方案的优缺点,值得一

开源大数据周刊-第60期

资讯 Apache Spark 2.2.0正式发布 Spark 2.2.0 持续了半年的开发,近期发布了2.2.0版本,此版本是 2.x 版本线的第三个版本.在这个版本 Structured Streaming 的实验性标记(experimental tag)已经被移除,这也意味着后面的 2.2.x 之后就可以放心在线上使用了.除此之外,这个版本的主要集中点是系统的可用性和稳定性.关于 Apache Spark 2.2.0 的详细新功能介绍请参见文章 <网络安全法>实施一个月,大数据创业进入迷

开源大数据周刊-第36期

[阿里云E-MapReduce动态] 1.6.0版本上线,增加交互式工作台.支持独享机型国际站上线,海外用户可以购买E-MapReduce服务资讯看行业观察家和技术专家对大数据在2017年的发展预测业界权威市场研究和咨询机构Ovum公司日前估计,大数据市场规模将从2016年的17亿美元增长到2020年的94亿美元.随着市场的增长,企业的挑战正在转变,对人们的技能需求正在改变,而大数据服务供应商的景观也在风云变幻.2017年将是大数据专业人士更为忙碌的时刻.文章介绍了来自相关行业观察家和技

开源大数据周刊-第38期

阿里云E-Mapreduce动态 E-MapReduce 2.3.1镜像版本(已发布) 基础镜像CentOS 6.5内核版本升级到2.6.32-642 支持Hadoop YARN Job failover 资讯大数据的寒冬已至,谁将倒下,谁成巨人? 本文就近期百分点和亚信数据内部人事调整的新闻出发,提出了"大数据寒冬已至"的观点,而过度竞争是大数据寒冬的主要因素.对于未来大数据公司如何生存,文章中提出了产品聚焦.成本控制等方向,为度过寒冬做准备. 大数据第一案,微博为什么赢了? 微博