书评:《大数据处理之道》大数据热门技术遍历

大数据无疑是当今时代最前沿最炙手可的概念,所以对于这种新技术,只有不断掌握最新的思想,时刻学习新的技术。作为大数据研发人员,时刻保持学习新技术,方能立于技术。

这本书,系统的讲解了当前流行的大数据软件Hadoop, Spark, Storm, Dremel/Drill,MapReduce, HDFS, Hive, Hbase, Pig, ZooKeeper等等,深入浅出的讲解,每个软件的优缺,这种横向比较如何把“死”的数据,变成真正有效的“资源”,最后再变成活生生的“金子”,可是说是大数据工具软件的集大成作品。

对于这么一个讲软件讲概念的书籍,更为难得的是幽默大话的表述风格,读起来畅快容易理解,可以轻松掌握。重点从各个技术的起源、设计思想、构架方面阐述,帮助读者能从根源上悟出大数据处理的核心道理,可以说每个人都会在读完有感触颇深的感觉。

本书最难能可贵之处在于全面,从广度上,涵盖了目前几乎所有的大数据处理热门技术,实为大数据行业的入门人员和从业人员的一顿饕餮盛宴。书中全面介绍了目前大数据处理领域的热门技术的精髓和适应的场景,实用性很强,特别是通过目录发现了后面章节有专门设计日志分析这一当前热门领域的机器学习场景,着实更加期待了。

时间: 2024-10-22 18:51:37

书评:《大数据处理之道》大数据热门技术遍历的相关文章

大数据处理之道书评

这本书算是我接触的第一本大数据类书籍,之前学习大数据相关知识都是通过阅读网上的博客和相关大数据技术文章.然而,对于一门比较复杂的技术来说,如果不能系统性的学习,是很难真正掌握的.<大数据处理之道>覆盖了最近比较热门的大数据处理技术,其中包括Hadoop,Spark等.本书不仅仅只停留在大数据技术技术的表面.比如说Spark,本书从Spark的诞生,Spark的发展,Spark与其他大数据技术的横向比较,Spark的应用场景,Spark的硬件配置,到Spart的构架,深入浅出的为读者描述了Spa

【好书试读】大数据处理之道

开始试读:https://yqfile.alicdn.com/e62f864d518c11f5d19f53d0719de69c.pdf 天猫购买链接:大数据处理之道 近年来,"大数据"已然成为IT界如火如荼的词,与"云计算" 并驾齐驱,成为带动IT行业发展的两列高速火车.尤其是在物联网快速发展的时代,数据已经被称为新的资源,是支撑物联网发展的基石. 那么,如何把"死"的数据变成真正有效的"资源",成为近年来IT界人士共同思考的

读《大数据处理之道》--Spark星火燎燃,Spark是否可以支持运营商的数据处理工作

Spark同时支持复杂的批处理.互操作和流计算,而且兼容支持HDFS和Amazon S3等分布式文件系统.Spark是否可以替换现有运营商的数据批处理工作? 运营商的数据仓库一直以来采用的小型机+关系型数据库的方式的建设,随着大数据技术在互联网的使用,运营商也在考虑逐步用大数据平台替换现有的数据仓库建设方式.但始终在探索,要真正的落地实施还有一段很长的路要走. 某省运营商的数据仓库离线数据处理数据架构分为五层,分别是接口层,负责接口的装载,设计原则是与原系统结构保持相同:存储层,负责全量数据的存

并发大数据处理-如何从下面数据中判断出正确的期望值

问题描述 如何从下面数据中判断出正确的期望值 三组数据分别代表了三种投资价,想问下哪种投资组合风险最小,取值最优?后面尾数部分代表的是权值:有点类似于股票上下盘的分析,但不是股票数据

独家 | 一文读懂大数据处理框架

前言 说起大数据处理,一切都起源于Google公司的经典论文:<MapReduce:Simplied Data Processing on Large Clusters>.在当时(2000年左右),由于网页数量急剧增加,Google公司内部平时要编写很多的程序来处理大量的原始数据:爬虫爬到的网页.网页请求日志:计算各种类型的派生数据:倒排索引.网页的各种图结构等等.这些计算在概念上很容易理解,但由于输入数据量很大,单机难以处理.所以需要利用分布式的方式完成计算,并且需要考虑如何进行并行计算.分

为什么我们说海量大数据处理技术会火

大数据处理技术正在改变目前计算机的运行模式.我们已经从中获得了大量收益,因为正是大数据处理技术给我们带来了搜索引擎 Google.然而故事才刚刚开始,基于以下几个原因,我们说大数据处理技术正在改变着这个世界:* 它能处理几乎各种类型的海量数据,无论是微博.文章.电子邮件.文档.音频.视频,还是其它形态的数据. * 它工作的速度非常快速:实际上几乎实时. * 它具有普及性:因为它所用的都是最普通低成本的硬件 大数据为以下这些公司提供了解决方案:eBay.Facebook.LinkedIn.Netf

大数据处理与分析方法解读

越来越多的应用涉及到大数据,这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以,大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素.基于此,大数据分析的方法理论有哪些呢? 大数据分析的五个基本方面 PredictiveAnalyticCapabilities(预测性分析能力) 数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断. DataQualityandMaster

一季度大数据热门工具相关事件整理

文章讲的是一季度大数据热门工具相关事件整理,今年一季度,大数据开源圈内最热闹的一件事大概就是Hadoop迎来了它的十岁生日,收到了来自世界各地的各种祝福.Hadoop正式诞生于2006年1月28日,作为一个开源项目的生态系统,它从根本上改变了企业存储.处理和分析数据的方式:Hadoop可以在相同的数据上同时运行不同类型的分析工作. 那一周,有媒体整理了Hadoop这十年来的数据变化:核心Hadoop中目前的代码行数为170万+.自2006年来对Hadoop的提交数量超过12000.自2006年来

盘点九大热门开源大数据处理技术

随着全球企业和个人数据的爆炸式增长,数据本身正在取代软件和硬件成为驱动信息技术行业和全球经济的下一个大"油田". 与PC.web等断层式信息技术革命相比,大数据的最大的不同是,这是一场由"开源软件"驱动的革命.从IBM.Oracle等巨头到雨后春笋般的大数据创业公司,开源软件与大数据的结合迸发出惊人的产业颠覆性力量,甚至VMware这样的过去完全依赖专有软件的厂商都开始拥抱开源大数据工具. 下面,我们就列举九大最热门的大数据开源技术供大家参考. 一.Hadoop A