解读《大数据时代》:大数据时代的神话

  

  地球人都知道我们处在大数据时代,或许地球人也都知道关于大数据时代最著名的一本书就是迈尔-舍恩伯格所著的《大数据时代》。

  我本以为大数据这么高深的学问绝不是我们这样的屌丝能够理解或者使用的,所以一直对此书敬而远之,不敢阅读。不料周边谈论大数据的人越来越多,谈论《大数据时代》这本书的人也越来越多,似乎不读《大数据时代》,估计连屌丝都做不成了。所以斗胆请来《大数据时代》。一读,果然不懂,许多疑问。

  何为大数据?

  这是一个很令人困惑并且绝对屌丝的问题,平时都不好意思开口问别人,希望从书中得到答案。遗憾的是,迈尔大叔在书中就根本没有告诉我们什么是大数据,这对像我这样习惯在课堂里死记硬背的学生来说,就产生了轻微的智障:怎么似乎什么都是大数据。可要我记住哪一个却十分困难。

  看完此书,我只能回答说大数据就是数据多数据大。可是这个回答似乎有明显的问题。迈尔大叔在书中就举了一个大数据的例子,这个大数据只有“4000”和“两小时”。

  在解释大数据时代不需要精准性时,迈尔大叔这样写道:

  “互联网上最火的网址都表明,它们欣赏不精确而不会假装精确。当一个人在网站上见到一个Facebook的“喜欢”按钮时,可以看到有多少其他人也在点击。当数量不多时,会显示像“63”这种精确的数字。当数量很大时,则只会显示近似值,比方说“4000”。这并不代表系统不知道正确的数据是多少,只是当数量规模变大的时候,确切的数量已经不那么重要了。另外,数据更新得非常快,甚至在刚刚显示出来的时候可能就已经过时了。所以,同样的原理适用于时间的显示。谷歌的Gmail邮箱会确切标注在很短时间内收到的信件,比方说“11分钟之前”。但是,对于已经收到一段时间的信件,则会标注如“两个小时之前”这种不太确切的时间信息。”

  4000个“赞”或者两小时(120分钟)也是大数据?我开始崩溃了!

  我想是不是迈尔大叔可能考虑到我们对过万的数字数不过来所以有意简化,挑选我们能够理解的“大数据”来说明他的论断。

  指鹿为马是谓荒唐。可是,如果对马没有定义,那指鹿为马就无所谓了。

  呵呵,迈尔大叔还真幽默。

  何为大数据时代?

  我读西洋人写的书,总是觉得读书时很爽,读完后基本记不住。读《大数据时代》也有同感。很多很多的大数据例子,读完合上书后基本上一个都记不住。不过迈尔大叔可能知道我的这个毛病,所以提纲挈领,总结了大数据时代的三大特征。这就是地球人都知道的大数据时代的三大特征:1)不是随机样本,而是全体数据;2)不是精准性,而是混杂性;3)不是因果关系,而是相关关系。

  一本书,三句话,一个时代的特征!楚汉河界,泾渭分明,一目了然。

  小数据时代是随机样本、精准性和因果关系,大数据时代是全体数据、混杂性和相关关系。

  可是我的脑子就是转不过来,没法从迈尔大叔的三个简单扼要的特征总结中悟出大数据时代来。这个看上去忒简单的总结,其实真的很深奥。简直可谓深不可测!

  一大堆的问题等着迈尔大叔来回答。

  比如说,是不是大数据时代就不要随机取样分析了?小数据时代是否也有所谓的全体数据?比如说30年前互联网未流行前美国银行或保险公司拥有的数据是不是全体数据?怎样定义全体数据?谷歌、百度、FACEBOOK或者腾讯,哪个公司拥有所谓的全体数据?为什么有了全体数据分析就要完全抛弃随机样本分析?如果考虑到随机样本分析会影响到分析结果的精度,不是大数据时代不追求精度吗?

  关于大数据时代不要精准性,我怎么也拐不过弯来。你说,大数据时代的老师教学生“2+2或许等于3.9”,公司会计记账错了也可以对老板理直气壮地说“现在是大数据时代了”,甚至到饭店吃饭付账也不要精准了....。.呵呵,这日子还让不让人活啊?!

  还有有关因果关系和相关性的问题,这也要命!我一直认为人与猴子的根本区别在于人喜欢问个“为什么?”。原本两个猴子,一个不断好奇地问“为什么日落就要睡觉”,结果大脑不断进化变成了人;另一个只是看到日落就上树睡觉,结果至今还是猴子。现在好了,大数据时代不需要问“为什么”了,岂不苦了我们从猴子变人过程中长期培育起来的好奇心了。

  因果关系与相关关系的区别,就是因果关系在相关关系上问了个”为什么“。

  流传甚广的有关超市将啤酒与尿布一起卖的大数据例子。说是通过大数据分析发现,人们在买尿布时通常也会买啤酒,于是就将啤酒与尿布陈列在一起卖。

  如果你生活在大数据时代,故事到此结束了。

  如果你还好奇地想知道为什么人们买尿布时要买啤酒。呵呵,对不起,你和我一样还生活在小数据时代。

  我们无疑生活在一个互联网的时代,这是一个充满海量数据的世界。数据的多种形式、数据的多种来源、数据之间的多种复杂的联系,都使我们这个世界变得更加神秘但也更加激动人心。这就是大数据时代。

  对大数据时代的探索,犹如当年美国对西部的探险,充满许多传说和神话。《大数据时代》或许可能就是这样一本充满神话与传说的探险记。我们为之心动,但依旧要活在现实的生活中,现实生活中的那些规律依旧适用。

  即使是大数据时代,我们依旧需要问”为什么“,我们依旧需要教会孩子“2+2=4”,我们甚至依旧要做随机样本分析。

  大数据并没有改变我们现有社会的基本生活逻辑。

  大数据时代,平常人,平常心。

时间: 2024-11-02 23:04:33

解读《大数据时代》:大数据时代的神话的相关文章

数据为王的时代,零售行业的大数据趋势

零售行业随着数据采集与存储技术的进步也逐步形成了零售业大数据.通过对这些数据进行挖掘分析,能够给零售企业带来巨大的商业价值以及服务创新,诸如能够更好地了解和洞察消费者,从而实现精准化营销,或者变革供应链模式,实现货品精细化管理等. 2015年,IBM商业价值研究院联合ECR中国,针对中国零售行业大数据应用的现状进行了调研.数据为王的时代,如何利用大数据分析提高企业生产经营效率?IBM商业价值研究院发布<大数据助力中国零售业转型>报告为大家解读. 中国的零售行业,特别是线下传统零售行业,大数据分

引领共享时代驾驭数据浪潮 2016全球大数据峰会在京盛大开幕

ZD至顶网CIO与应用频道 01月20日 北京消息: 2016年1月20日,由全球大数据联盟(GBDC).全球移动游戏联盟(GMGC).世界O2O组织(WOO).光合资本主办,中国互联网协会(ISC)O2O工作组.中国汽车流通协会(CADA)支持的2016全球大数据峰会GBDC2016,在国家会议中心举行.这场行业盛会吸引了来自IBM.TaikingData.微软.高通.阿里巴巴.联想.Akamai中国公司等众多企业的业界精英参与.与此同时,全球大数据联盟(GBDC)也在此次峰会上正式成立. 随

用数据“治病” 大数据时代的个人健康革命

中介交易 SEO诊断 淘宝客 云主机 技术大厅 IT巨头扎堆涉足公共医疗健康 维克托•迈尔•舍恩伯格的<大数据时代>一书中有两个关于大数据与公共卫生结合的案例令人印象深刻: 乔布斯自罹癌至离世长达8年之久,这几乎创造了胰腺癌历史上的奇迹.据悉,乔布斯曾在此期间支付大量费用获得了自己包括整个基因密码在内的数据文档.借此,医生们能基于乔的特定基因组成以及大数据按所需效果用药,并调整医疗方案. 如果上述案例是个体的,那么带来群体价值的案例,便是Google成功预测流感爆发期.2009年甲型H1N1流

六年亲历,见证中国大数据技术与应用时代的到来

转自:http://www.csdn.net/article/2013-09-30/2817098-big-data-technology-conference-dec 六年亲历,见证中国大数据技术与应用时代的到来 发表于2013-09-30 09:39|8875次阅读| 来源CSDN|34 条评论| 作者郭雪梅 BDTCHBTC大数据Hadoop 摘要:08年至今,六年的时光,伴随技术大会的发展,我们亲历和见证了中国大数据技术与应用时代的到来!第七届中国大数据技术大会(Big Data Tec

大数据:冷兵器时代到热兵器时代的变革

文章讲的是大数据:冷兵器时代到热兵器时代的变革,世界著名的未来学家John Naisbitt认为"我们首次拥有一个基于关键资源(信息)的经济体制,不仅是可再生的而且是自发生产的.耗尽它没关系,但不要淹没在其中."John提到的关键资源就是被誉为下一代自然资源的"大数据".与其他资源不同,大数据资源是取之不尽.用之不竭的,其核心在于如何挖掘数据中的价值. 近日,主题为"行胜于言"的2013 IBM大数据与分析高峰论坛在北京举行,会上正式发布了大数据

大数据时代,数据=财富!

拥有财富.名声.世界上的一切的男人 "商业王,阿里巴巴,马云.说了一句话,让全世界的人都涌向了市场."想要我的宝藏吗?如果想要的话,那就到数据上去找吧!我吧我的未来全部都放在那里.",世界开始迎接"大数据时代"的来临. -------前言 什么是大数据呢? 故名思意大数据便是数量巨大,类型众多,结构复杂的数据集合.数据具有较小的价值,而数据的集合因为数量的众多量变引起的质变所以其价值无可估量. 数据出现的最早的时间可以追溯到18000年前,原始人类.开始用

高德开放平台:位置大数据将成 人工智能时代的基础设施

未来的移动互联网会是什么样的?当你走进一家商场,App能够自动向你推荐打折的店铺,并规划路线导航至该店:在午餐时间,App能够根据你的口味自动推荐最适合你的餐厅:如果去景区游玩,App能够预判景区客流热度,使游客错峰出行-这些看似"黑科技"的场景,其实离我们并不遥远,实现这些功能的关键,则需要借助基于位置信息的大数据系统.近日,在上海举办的全球互联网技术大会上,高德开放平台的技术总监杨少航为大家揭示了高德基于位置信息的智能化大数据最新应用.  位置信息已经成为移动互联网时代最重要的特征

解析智媒体时代大数据应用:网络编辑会否被取代

7月28日,第三期新浪未来媒体峰会系列沙龙在北京举行.如今,网络媒体智能化已经成为未来的发展趋势.在本次创想日沙龙上,来自清华大学计算机系.中国传媒大学新媒体研究院以及新浪网的科技新媒体研究专家,就媒体创新领域的最新热门话题进行了分享与讨论. 在沙龙上,新浪新闻还宣布成立创新联盟,这是一个汇集媒体创新领域顶级专家的沟通.交流联盟,成员包括媒体行业的总编辑.学者和专家.在会议结束时,新浪新闻向首批创新联盟专家颁发了聘书. 个性化推荐的基础是大数据 新浪网信息系统算法部总监李云辉首先做了分享.在他看

智能+大数据 在云+互联时代下创造的精准营销

全球智能移动营销平台AdTiming继2016年4月,在GMIC 2017上与全球近500家展商和3,000多位行业领袖共同探讨数据与新技术驱动下的数字营销生态及未来趋势之后,又一次宣布同业内媒体分享了AdTiming智能数据营销平台两年来在市场上做出的成绩,而这些都得益于其切实的把握云+互联时代商机,利用自主知识产权大数据智能平台帮助了200多个国家的用户创造了营销价值. 两年覆盖200多个国家 AdTiming是谁? DSP和RTB被验证是广告投放的趋势,且飞速增长,广告投放将从按媒介购买转

大数据时代的数据新闻:源于数据但高于数据

数据新闻报道是互联网发展背景下催生的新型报道,可视化表达是数据新闻的一种重要表现方式.数据新闻不仅仅是指在新闻实践中直接引入数据分析技术和可视化设计,其更核心内容是数据背后的新闻叙事. 为了将抽象数据具体而直观地展现出来,从而通过数据表达其背后的概念和内涵,可视化是数据新闻叙事的一种主要的表达手段. 类型 7种视觉叙事分类交融 美国学者爱德华·西格和杰弗里·希尔曾在相关研究中把数据新闻的视觉叙事类型做出如下分类:杂志式.图表式.分栏图式.流程图式.连环画式.幻灯片式及视频式.这7种分类并不相互排