三本书让你了解大数据

团购、社交媒体、电商;云,O2O,大数据。每个阶段都有热点词。这会儿最热的应该就是“大数据”了。不过,有点滥,有点俗,似乎也有点泡沫化了。不用担心,一般来讲,讲得最厉害的时候,时候还早呢;等到无声无息了,那真是随风潜入夜了。但是,说真的,处于这个风云激荡创业年代的人们,如果能够静下心仔细了解点有关大数据的概念、框架、实质,对于形成所谓的“大数据观”,真心有必要,真心有帮助。

市面上如今关于大数据的书,近20种。挑出这三本,是有理由的。不仅单本比较靠谱,讲述得有意思,而且串联起来,竟然有逻辑联系,有互补,好像商量好了似的首先看巴拉巴西的《爆发》,在一个历史故事的连续讲述中,了解大数据的概念实质;接着看舍恩伯格的《大数据时代》,明白大数据理念和生活工作及思维变革的关系;最后翻翻涂子沛的《大数据》,看美国政府在大数据开放上的进程与反复,算是个案。如果能够基本了解这三本的观点,出门有底气,见人腰杆直,不再被忽悠。

“人生看似杂乱无章,其实有规可寻”,巴拉巴西整本书讲述的大数据根本目的,是预测。他甚至有零有整地判断,人类行为93%是可以预测的。打个比方,千百年前人类无法如今天般准确预测天气,以致某些大致预测的行为都被认为是“通神”,其实核心在于对天气数据的海量占有和分析能力。但假如全人类的所有基础及行为数据全部被占有全部能分析呢?比如通过智能终端LBS功能采集全部运动轨迹、通过金融系统采集所有支付记录、通过SNS采集所有社会关系和通过邮件、文档、社会视频监控和自我视频监测采集所有言行记录,24小时,每分每秒,一生,全地球70亿人,那会如何?

人往极大和极小处思考哪怕想像的话,一方面头会疼会晕,一方面会因为这种宏大性或穷尽性而恐惧。科幻迷看到上面的描述,不知会否想起科幻小说巨匠阿西莫夫的《基地》系列,起源就是主角对银河帝国社会未来数千年的发展和危机的宏大预测,导致一系列绵延千百年的基地、第二基地拯救计划。也就是说,阿西莫夫大约在50年前就在思考“大数据”问题了。

巴拉巴西不是个通俗科幻小说家。他是全球复杂性网络科学领域最前沿的领军科学家,他要传递的不是科幻故事,而是一整套新的理解人类行为时空模式的观念和理论。作者的核心观点,是认为当我们将生活数字化、公式化和模式化的时候,会发现大家都很相似,都具备爆发模式,而且非常规律,看上去随意偶然,其实极易预测前提自然是占有和分析海量大数据而在计算机运算能力、网络发展阶段和社交逻辑被成熟之前,这些做不到而已。

科学的尽头和哲学、宗教是交融的。因此,巴拉巴西的理论不止是互联网复杂科学的一项探索,本质是一种新历史观的论证,甚至是一种哲学。这么深艰的命题,作者讲述得非常漂亮,十几章节讲述了十字军的一段历史故事,泰勒格迪预测主人公塞克勒起义并一路发展至兵败坐上“燃烧的御座”,带上烧红的铁王冠;讲述了艺术家哈桑的旅行,因为被安检不断怀疑是恐怖分子,而自愿“自我量化”,记录自己所有行踪并不断公布在个人网站,实现个人数据全积累全公开;一张一美元钞票被跟踪被记录所有的轨迹。可以说,这本书整个就在讲故事,这是我最佩服老外科学作者的地方,如此艰涩的话题,我们可以写成只有几个人懂的论文,他可以写成一气呵成的故事集!

转到《大数据时代》这本书。它被包括宽带资本董事长田朔宁、知名IT评论人谢文等专业读者鉴定为“大数据领域最好的著作没有之一,一本顶一万本”。有这么好吗?看完自己评价吧。这本书对这个大规模产生、分享和应用数据的新的大时代进行了阐述和厘清,作者围绕“要全体不要抽样、要效率不要绝对精确、要相关不要因果”三大理念,通过数十个商业和学术案例,剖析了万事万物数据化和数据复用挖掘的巨大价值。

如作者所言“大数据开启了一次重大时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们看清微生物一样,大数据要改变的是,我们的生活方方面面以及理解世界的方式”。比如,谷歌通过全球搜索分析,比国际疾病控防中心更早更准地预测了流感爆发。

在思维变革部分,作者讲述的重点是:样本=总体,我们需要对全部数据的占有和分析;因此,数据缺乏时代的精确性不必执迷,接受混杂基于大数据的简单算法比小数据的复杂算法更有效;样本推断的因果关系不重要了,知道“是什么”的相关关系,或者结果就可以了。如果说上一本《爆发》是通过讲故事阐述一个核心观点的话,这一本倒是不遗余力、不计巨细就大数据的方方面面进行系统分析和介绍,而且案例非常精彩非常时新。所以,个人觉得,就实务而言,这本的裨益确实比较大。

涂子沛那本冠以《大数据》名字的书,我是在三星NOTE上完整看完的第一本手机电子书(花了30元,我是愿意为好数字内容花钱的!)。全书讲述的,是大数据在美国政府管理中的应用,以及美国政府运行方式大数据变革的历史与斗争,其实也是故事性的。从奥巴马上台就颁布《信息公开法案》,到设立第一个美国政府首席信息官开始,讲述美国政府与民间在社会数据公开的斗争史,以及美国社会管理向大数据思维转变的过程。首先,这算是一个最详实的案例;其次,这代表的不是某种管理方式变革,深处是对民主运行机制的变革与进步。说好了,这本书用心良苦,远远超越科普技术领域;说坏了,其心可诛。有一段,民间斗争,逼迫奥巴马公布所有每日白宫全部日程,包括接见了谁、谈话的全部内容,这不就是个人大数据全公开在公众人物上的应用吗?这可比现在所谓官员公开财产的要求高了几十倍这要求政府全部行为、全部数据、全部公开,全体公众随时可查技术和成本上其实已经可以做到或至少努力接近如果不这么做,不止是落后问题而是真正的其心可诛了。

三本书,延续观点实务案例分析的路径,全景展示了大数据这个东西。但重要的是,大数据是个概念,是个趋势,更是一种“观”,看世界、看未来的一种方法。我们可以拒绝那些言必称大数据的人的浮躁,但绝对不能拒绝世界潮流的确定走向。而就企业而言,包括全球的谷歌、苹果、FACEBOOK等互联网巨头,沃尔玛、塔吉特、亚马逊等零售巨头,中国的BAT三巨头,早就实质上已经是大数据玩家,并且狂奔在大数据潮流上很久,而其他叫唤“大数据”的其实连基本资格都没有叫的狗不咬人。可以说,除了巨头,所有其他家伙都跟大数据沾不上实质的边,只有打打下手的机会;但实际上,每个企业,甚至个人,都已经是大数据的一部分、一环节了。

数千字难言书中真谛。马上开始你的拯救大数据白痴之旅吧。

原文链接http://www.huxiu.com/article/8740/1.html

(责任编辑:蒙遗善)

时间: 2024-08-17 21:53:49

三本书让你了解大数据的相关文章

无处不数据的时代 三大运营商如何变现大数据价值?

5月18日消息,昨天是世界电信日,其主题是"发展大数据,扩大影响力". 其实我们已经处在了无处不数据的时代,但大数据的发展才刚刚开始,城市中的数据利用率仅为0.4%,且大部分数据还在政府手里或者各个角落闲置.拿电信运营商本身,价值数千亿的数据尚未得到变现. 运营商既是大数据的拥有者,又是大数据技术的拥有者,同时可以面向各类用户提供大数据的应用服务.三大运营商也纷纷规划大数据发展步骤,逐渐将数据价值变现. 中国电信:大数据2+31模式 2013年中国电信着手布局大数据业务,坚持深化挖掘应

三位创业者解答:大数据创业的价值、模式和挑战

近几年来,大数据的应用场景扩展到几乎每一个垂直行业.在得到资本青睐的同时,也面临着如何将数据的价值最大化利用,如何面对信息监管等诸多问题. 在日前IT桔子·腾讯云沙龙"对话垂直行业大数据×创业"活动中,三位大数据方向的创业者解读了大数据创业者的动力和迷茫,也回答了诸多大家关心的问题. 本文根据现场提问环节整理,有删减. 大数据到底有哪些价值?如何通过产品和技术将这些价值最大化? 白冬立<热云数据>:我是三位当中,唯一一个专注在移动互联网用户行为的大数据创业者.我们有足够多用

吴军:三个案例透析大数据思维的核心

逻辑推理能力是人类特有的本领,给出原因,我们能够通过逻辑推理得到结果.在过去,我们一直非常强调因果关系,一方面是因为我们常常是先有原因,再有结果,另一方面是因为如果我们找不出原因,常常会觉得结果不是非常可信.而大数据时代,大数据思维要求我们从探求因果联系到探索强相关关系. 以下三个案例分别来自药品研发.司法判决与广告投放,从三个不同的角度了解大数据思维的核心. ◆ ◆ ◆ 大数据与药品研发:寻找特效药的方法 比如在过去,现代医学里新药的研制,就是典型的利用因果关系解决问题的例子.   青霉素的发

三个案例透析大数据思维的核心

逻辑推理能力是人类特有的本领,给出原因,我们能够通过逻辑推理得到结果.在过去,我们一直非常强调因果关系,一方面是因为我们常常是先有原因,再有结果,另一方面是因为如果我们找不出原因,常常会觉得结果不是非常可信. 逻辑推理能力是人类特有的本领,给出原因,我们能够通过逻辑推理得到结果.在过去,我们一直非常强调因果关系,一方面是因为我们常常是先有原因,再有结果,另一方面是因为如果我们找不出原因,常常会觉得结果不是非常可信.而大数据时代,大数据思维要求我们从探求因果联系到探索强相关关系. 以下三个案例分别

三大运营商唤醒海量大数据

[ http://www.aliyun.com/zixun/aggregation/2272.html">三大运营商并不甘"为他人作嫁衣裳",他们有着海量的大数据,但56.html">一直处于沉睡状态,如果能够把多年积累下来的客户数据用起来,甚至都可以用来开银行 ]

大数据的三个思维变换

维克托·尔耶·舍恩伯格在<大数据时代:生活.工作与思维的大变革>中最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系.也就是说只要知道"是什么",而不需要知道"为什么".这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战. 知名IT研究机构Gartner以它对专业IT市场的"魔力象限图"发布作为一种评价方式,在其二维矩阵里,横轴是前瞻的完整性,纵轴是执行力,

《大数据算法》一1.4 本书的内容

1.4 本书的内容 基于大数据的定义.大数据算法的定义以及大数据算法的特点,本书按照如下方式组织:第一部分是亚线性算法,包括时间亚线性算法(第2章)和空间亚线性算法(第3章),其中包括如何利用近似算法和随机化算法设计思想来设计和分析亚线性算法.第二部分是外存算法,将讨论如何面向外存来设计I/O有效的算法,包括外存算法概述(第4章).外存查找结构(第5章)和外存图数据算法(第6章).第三部分是并行算法,由于并行算法的内容非常广泛,本书仅介绍数据密集型并行算法,包括MapReduce算法概述(第7章

三大运营商新战场:与BAT争夺大数据金矿

"发展大数据,扩大影响力",这是今年世界电信日的主题. 大数据一词,早已在众多行业开始渗透,但距离规模应用尚有一定距离.通信行业作为目前数据量最大.覆盖面最广的行业之一,拥有大量具有社会属性.消费属性的数据资源,是一座储量惊人的"数据富矿". 随着三大运营商大数据战略的相继发布,大数据业务开始走向成熟,也成为继2G语音短信.3G上网.4G视频后三大运营商竞争的新战场. 中移动大数据业务全面落地 据预测,到2020年全球总连接数将达500亿,其中中国国达100亿,是2

成立大数据公司 新华三“数据引擎”要干些什么事?

大数据与大互联.大安全.云计算共同形成了新华三的新IT战略,即"三大一云".2016年底,新华三集团决定在郑州成立大数据公司,同其他三条业务线相比,大数据业务线略显面生,不过新华三计划未来三年对大数据公司研发投入近千人规模,这无疑将成为新华三一个全新的增长极. 新华三集团副总裁.大数据产品线总裁孙德和表示,在郑州成立大数据公司是新华三集团业务板块布局的一个重要环节.新华三希望根植郑州.面向全国,展开大数据业务,并通过几年的投入和市场覆盖,成为中国企业市场中第一集团的大数据公司.   新