大数据处理之道书评

这本书算是我接触的第一本大数据类书籍,之前学习大数据相关知识都是通过阅读网上的博客和相关大数据技术文章。然而,对于一门比较复杂的技术来说,如果不能系统性的学习,是很难真正掌握的。《大数据处理之道》覆盖了最近比较热门的大数据处理技术,其中包括Hadoop,Spark等。本书不仅仅只停留在大数据技术技术的表面。比如说Spark,本书从Spark的诞生,Spark的发展,Spark与其他大数据技术的横向比较,Spark的应用场景,Spark的硬件配置,到Spart的构架,深入浅出的为读者描述了Spark的特点和应用场景。

本书中涉及到的大数据技术,除了Spark之外,还包括了Hadoop,Storm,Dremel,Drill等。是一本非常适合初学者的大数据技术类书籍。

时间: 2024-11-16 03:18:30

大数据处理之道书评的相关文章

【好书试读】大数据处理之道

开始试读:https://yqfile.alicdn.com/e62f864d518c11f5d19f53d0719de69c.pdf 天猫购买链接:大数据处理之道 近年来,"大数据"已然成为IT界如火如荼的词,与"云计算" 并驾齐驱,成为带动IT行业发展的两列高速火车.尤其是在物联网快速发展的时代,数据已经被称为新的资源,是支撑物联网发展的基石. 那么,如何把"死"的数据变成真正有效的"资源",成为近年来IT界人士共同思考的

书评:《大数据处理之道》大数据热门技术遍历

大数据无疑是当今时代最前沿最炙手可的概念,所以对于这种新技术,只有不断掌握最新的思想,时刻学习新的技术.作为大数据研发人员,时刻保持学习新技术,方能立于技术. 这本书,系统的讲解了当前流行的大数据软件Hadoop, Spark, Storm, Dremel/Drill,MapReduce, HDFS, Hive, Hbase, Pig, ZooKeeper等等,深入浅出的讲解,每个软件的优缺,这种横向比较如何把"死"的数据,变成真正有效的"资源",最后再变成活生生的

读《大数据处理之道》--Spark星火燎燃,Spark是否可以支持运营商的数据处理工作

Spark同时支持复杂的批处理.互操作和流计算,而且兼容支持HDFS和Amazon S3等分布式文件系统.Spark是否可以替换现有运营商的数据批处理工作? 运营商的数据仓库一直以来采用的小型机+关系型数据库的方式的建设,随着大数据技术在互联网的使用,运营商也在考虑逐步用大数据平台替换现有的数据仓库建设方式.但始终在探索,要真正的落地实施还有一段很长的路要走. 某省运营商的数据仓库离线数据处理数据架构分为五层,分别是接口层,负责接口的装载,设计原则是与原系统结构保持相同:存储层,负责全量数据的存

没有大数据处理 就没有航运的复兴

随着世界创造的数据越来越多,而且数据产生也越来越快,所谓"大数据时代"无疑就在眼前了.大数据的生成.占有,成为当今所有产业领域的核心议题.建立独特的大http://www.aliyun.com/zixun/aggregation/14345.html">数据处理方案成为所有企业实现转型,占领未来产业制高点的新捷径.推而广之,甚至在政治.经济.军事.社会,大数据也成为改变以往治理方式的契机.当下,借助互联网技术,与人们生活息息相关的消费.支付乃至社交,正在形成一种基于大数

大数据处理——Hadoop解析(一)

概述 这个时代被称之为大数据时代,各行各业生产的数据量呈现爆发性增长,并且基于这些爆发性增长的数据做深层次的数据挖掘.分析.处理.因此,我们可以很容易的感觉到,在这样一个大数据的时代,我们很多做事情的方法正在发生了改变.例如,基于大数据分析可以做疾病预测控制;基于大数据分析可以做交通流量预测控制;基于大数据分析可以做大型系统故障诊断预测;基于大数据分析可以做客户消费推荐.可以说,大数据时代可以解决很多以前非常难以解决的问题.可以这样讲,在这样一个时代,大数据可以让我们的生活变得更加美好. 突如其

网友解读:大数据处理工具哪家强?

文章讲的是网友解读:大数据处理工具哪家强,近年呈爆发之势的大数据随着两会的召开再次被聚焦,在两会议题中成为高频词汇.各大报道中,利用大数据打造智慧城市.促进金融行业发展.建立两会大数据平台--两会委员"提案夹"中关于大数据的提案层出不穷."大数据外部环境推动着商业模式及行为的变化,对于企业来说,不对大数据善加利用就等于折了翅膀.面对亟待处理的庞大数据资源,企业遇到了哪些困难?处理数据的"利器"该如何选择? Hadoop高人气获最佳工具,魅力何在? 当讨论到

大数据处理——Hadoop解析(二):MapReduce

大http://www.aliyun.com/zixun/aggregation/14345.html">数据处理模型MapReduce (接<大数据处理--Hadoop解析(一)>) 大数据时代生产的数据最终是需要进行计算的,存储的目的也就是为了做大数据分析.通过计算.分析.挖掘数据背后的东西,才是大数据的意义所在.Hadoop不仅提供了数据存储的分布式文件系统,更重要的是提供了分布式编程模型和分布式计算系统,通过该编程模型和分布式计算架构可以解决大数据时代所面临的数据处理问

必备知识:大数据处理应遵循的原则

简约原则 这是牛顿创设的一条"极简主义"的节约规则.在牛顿看来,神奇的自然界在创设过程中选择的简单性和对繁琐的讨厌,使得人类也形成如下观念:"在用很少的东西就能够解决问题的情况下,决不劳力费神和兴师动众";要始终体现大自然所遵循的简约性.精准性.合理性与有效性.欲达此目的,就需要在云计算或大数据处理中,遵循简约原则,选择有用数据,淘汰无用数据;识别有代表性的本质数据,去除细枝末节或无意义的非本质数据.要能够确识数据之间的巨大差距或差异;要能够鉴别和挑出那些"

为云服务和大数据处理提供弹性计算能力,YC支持的创业公司推出分

企业数据库市场很庞大,在这个领域既有Oracle这样行家,也有IBM(DB2)和微软(SQL Server)这样的跨界巨头.它们都与中小企业常用到的开源数据库MySQL一样,都属于传统关系型数据库.似乎数据库市场已经发展得很成熟,基本格局也已确定,所以创业者再无机会? 事实上并非如此,新技术的出现与发展,总是会带来新的机遇.正如面向对象编程技术的发展和成熟,催生了DB4O这样纯面向对象数据库.云计算服务与大数据处理的崛起,让传统关系型数据库在很多应用场景显得力不从心.于是在YC的支持下,创业公司