背离现实世界,大数据毫无价值

  经过一代人的时间,“技术天才”与社会的关系发生了改变,他们从宅男变成了救世主,从反社会群体变成了社会的最大希望。许多人似乎确信,当下理解我们世界的最佳方式便是坐在屏幕前,分析海量信息——我们称其为“大数据”。

  来看看“谷歌流感趋势”吧。2008年,当它面世时,硅谷的许多人员鼓吹其将成为大数据的另一个里程碑,并且会很快淘汰掉传统分析。

  不过,他们错了。

  如果硅谷的大数据传教士们真想“了解世界”,那么他们不仅需要掌握数据的量,也要掌握数据的质。

  “谷歌流感趋势”不仅没有提供流感传播的精确图表,它也无法实现大数据作为传道者的美梦。没有“厚数据”,大数据就什么也不是。你必须离开电脑,深入到现实世界当中来获取这些丰富且带有情境化的信息。电脑极客们一度因不擅社交而被嘲笑,他们被告知应该“多出去走走”。事实上,如果大数据最主要的拥趸者希望理解这个他们也参与塑造的世界,他们真的需要出去走走。

  与修改算法无关

  “谷歌流感趋势”试图通过识别人们在流感季可能搜索的词汇来发挥作用。当它追踪的词汇搜索达到高峰时,谷歌会向大家预警新流感的爆发,这大约要比官方数据早两周时间。

  对很多人来说,“谷歌流感趋势”成为了大数据之力的代表。在畅销书《大数据:一场改变我们生活、工作和思考的革命》中,作者维克托-迈尔-舍恩柏格和肯尼斯-库克耶称,与政府滞后的数据报告相比,“谷歌流感趋势”是更有用、更及时的流感指示器。为什么即便费心查看数据,人们还是会得病,我们何时才能知道究竟什么与疾病相关?“因果关系”他们写道,“不会被丢弃,不过其立意的根本正受到考验。”

  然而,本月发表在《科学》上的一篇文章表明,自2011年八月起,“谷歌流感趋势”几乎每周都会高估流感的流行性。

  回溯到2009年,在发布后不久,“谷歌流感趋势”完全没预警到猪流感。这证明人们在流感季搜索的许多词都与流感无关,而与每年这一季相关的词通常都有:冬天。

  如今,很容易说(像许多人做过的那样)“谷歌流感趋势”的失败源于大数据的不成熟。不过,这样便错过了问题的关键。当然,调整算法、提高数据收集技术将会让下一代大数据工具变得更有效。然而,大数据真正的狂妄之处不在于我们对一套不成熟的算法和方法过于自信,问题是我们盲目地相信坐在电脑屏幕前,捣鼓一些数字就足以让自己对周围广阔的世界有个了解。

  为什么大数据需要“厚数据”

  大数据仅仅是在收集人文学科中所谓的”薄数据“,它们由我们的动作和行为路径产生。我们每天最常走的路线,在网上搜索的东西,睡了多久,人与人之间的多种联系,我们所听的音乐类型等等。这些数据来自于你浏览器中的cookies,你腕上的fitbit或是你手机里的GPS。人们的这些行为内容无疑是重要的,但它们并不是全部。

  为了真正地了解人,我们也必须了解经验的那部分,即人类学家所指的“厚数据”。它不仅仅捕捉事实。比如说,美国有86%的家庭主妇每周会喝掉6夸脱以上的牛奶,但是她们为什么喝牛奶呢?而且这像什么呢?一块带有星星和条纹的三色布是薄数据,而一面在风中高高飘扬的美国国旗便是厚数据。

  在探寻“我们做了什么”的基础上,大数据简单地认识我们;厚数据尝试通过我们如何与所在的不同世界相联系来了解我们。只有了解我们的世界,人们才能从整体上真正认识它,这恰恰也是谷歌、facebook这类的公司想要做的。

  用0和1认识世界

  想想当下硅谷的那些宏伟宣言,谷歌有名的宗旨是“组织全球信息,使人人皆可访问并从中获益。”最近,马克-扎克伯格跟他的投资人说,在全球性连接变得日趋重要、知识经济不断受到强调的背景下,Facebook带来了一个全新的视角,即”认识世界”。他描述了未来“认识”的样子:“人们每天向graph(Facebook的算法搜索机制)发布数十亿条内容和链接,由此建立各种有待了解事物的最明晰模本。”在这个追求认识的过程中,即便是一些小公司也可以分享信息。去年,捷波朗软件的副总裁耶利米-罗宾逊说道,他们的健康跟踪设备JawboneUP试图“认识行为变化的科学。”

  与收集的数据一样,这些目标也非常“大”。毋庸置疑,商业渴望更好地认识社会。毕竟,与客户行为及文化相关的信息不仅是经营的关键;在知识经济时代,它们也逐渐成为一种货币,用来交换点击数、浏览量、广告费,或是更简单直接的——权力。在此过程中,倘若谷歌、facebook这类公司能帮助我们不断地增进对自己的认识,它们便将获得更大的权力。问题是声称电脑终将组织所有数据,或是向我们提供对流感、健康、社交联系或任何其他事情的全面认识,这彻底拉低了数据和认识的意义。

  如果硅谷的大数据传教士们真想“了解世界”,那么他们不仅需要掌握数据的量,也要掌握数据的质。不幸的是,要实现后者,人们要将电脑放下,不仅“从谷歌眼镜中看世界”(或是从facebook中、从虚拟现实中),还要去体验真实的世界。这样做有两个重要原因。

  要了解人,你就要了解他们所处的情境

  如果你对一个领域高度熟悉,薄数据则是最有用的。你有能力填补信息的不足,设想到人们为什么这样做或为什么有这样的反应——当你能想象并重建行为发生的情境时,薄数据便是有意义的。如果不知道情境,想推断出任何因果关系或是了解人们的行为动机则是很难实现的。

  这也是为什么在科学实验中,研究人员需要竭尽全力掌控实验室环境的方方面面,以求打造一个人为场所,使各种影响因素都在可计量范围内。不过,真实世界并不是一个实验室。能确保你对陌生情境有所了解的唯一途径即是置身其中地去观察、去内化并阐述正在发生的每一件事。

  世上大部分是我们所不知道的隐性知识

  如果说大数据擅长测量人们的行为,那么它在认识人们日常事物的隐性知识方面则是失败的。我怎么知道刷牙时该挤多少牙膏?什么时候该并入行车道?眨眼是表示“这东西真有趣”还是“我的眼睛进了东西”?这些都是内化的能力、无意识的行为,一种内隐的认识在控制着我们的行为。跟身边的事物一样,这些不可见的隐性知识只有主动去看,我们才能发现。不过,它们却对每个人的行为方式有着重要影响。它能够解释事物是怎样、以哪种意义与我们联系起来的。

  人类及社会科学中有一系列俘获和解释人的方法,他们所处的情境,他们的隐性知识,而且这些都拥有一个特质:它们要求研究者进入杂乱而真实的生活。

  没有哪一个工具可以成为认识人类的快捷方式。尽管硅谷有许多出色的发明,不过我们对数字技术的期望还是要有个限度。“谷歌流感趋势”真正教给我们的是:不能仅仅问这个数据有多“大”,还要问问这个数据有多“厚”。

  有时,走进真实的生活将会得到更好的效果。有时,我们必须要离开电脑一会儿。

原文发布时间为:2014-07-03

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-09-19 01:21:06

背离现实世界,大数据毫无价值的相关文章

将彻底改变我们生活的十大现实世界大数据部署方案

关于大数据话题的炒作与争论似乎永无停歇,但全球数据量迅猛增长.每十八个月总量翻上一倍的客观现实却没人能够否认.对这些新增数据的利用已经延伸到我们生活中的几乎各个方面,只是有些相对直观.有些却在悄然发生.今天我们就来一同回顾那些不为人知却实际存在的十大大数据部署案例. Netflix Netflix已经成为美国国内规模最大的商业视频流供应商--目前拥有2900万视频流客户.这家公司同时也成为吸收新增数据的海绵--用户在看什么.喜欢在什么时段观看.在哪里观看以及使用哪些设备观看,爆增的信息量成为Ne

大数据的价值实现之旅

大数据开启了人类数据管理史的一段崭新旅程.人类想要测量.记录和分析世界的渴望是驱动大数据技术不断向前的动力.但如同此前的电子商务.云计算等创新构想一样,大数据也不得不怀抱变革理想在现实中披荆斩棘. 我们该如何定义我们所身处的信息技术时代?是云计算.社交.移动,还是大数据?相信每位从业者和客户都会有自己的认知与解读."一千个人眼中就有一千个哈姆雷特",很多时候是一个放之四海皆准的道理,更何况我们正在经历一段创新趋势叠加.创新领域融合的独特时期.而对于那些想要体会技术创新真正内涵的人士,有

寻找大数据真正价值:决策支持系统

文章讲的是寻找大数据真正价值:决策支持系统,2012年秋天,全球广告巨头WPP集团首席执行官苏铭天爵士约访谷歌首席执行官拉里•佩奇时,佩奇派出无人驾驶汽车去接他.这是一辆集大量高科技设备.自动驾驶的雷克萨斯SUV汽车,车上配有雷达.传感器和每秒可测量超过150万次的激光扫描仪.它自助行进了20分钟,驶过280号州际公里和繁忙的85号州公路.汽车通过自动驾驶仪进行自动巡航,自行校正路线,在前方出现车辆和行人时减速,然后又加速驶出临近车辆的盲区,最后来到距谷歌公司约32公里外的瑰丽酒店.(根据<财富

PureData专家力量成就大数据时代价值

本文讲的是PureData专家力量成就大数据时代价值,在人类发展的历史上经历过几次大的变革阶段,这是今天人们有目共睹的.第一个阶段,人类语言的产生;第二个阶段,铁器时代的到来;第三个阶段,印刷术让人类文明能够得到承载;第四阶段,19世纪利用电磁波技术传播信息的时代,加速了信息传播的速度和广度;第五个阶段,二十世纪开始的新变化,数据的变化. 有一个触目惊心的数字对比能够充分展现人类进步的速度."近3500年人类文明发展所产生的数据放到今天,大约等于我们这个世界两天所产生的数据." IBM

对大数据毫无贡献的社会底层,该何去何从

      人类日常生活的数据信息,主宰着越来越多的商业决策.那么对大数据毫无贡献的人群,又该何去何从?       大数据时代,不少人担心自己的私人生活受到形形色色的监控.追踪,进而简化为数据点,经过一番运算,用于见不得人的政府或企业勾当.另一方面,相对脱离数字世界的人群却可能面临完全相反的问题,根据<斯坦福法律评论>(StanfordLawReview)最近刊载的一篇文章表明,该群体缺乏关注.        "大数据对没有被它吞噬的群体也构成一定风险,这个群体的信息没有得到定期的

如何正确认识大数据的价值和效益?

大数据已成为媒体与大众关注的新技术,大数据的应用也预示着信息时代将进入一个新阶段,但人们对大数据的认识有一个不断加深的过程.首先从"信息时代新阶段".数据文化和认识论的高度阐述了对大数据的理解:接着通过对驱动效益和大成智慧的解释,探讨了如何正确认识大数据的价值和效益,并从复杂性的角度分析了大数据研究和应用面临的挑战:最后对发展大数据应避免的误区提出几点看法. 1 大数据兴起预示"信息时代"进入新阶段 1.1 看待大数据要有历史性的眼光 信息时代是相对于农业和工业时代

2014中韩大数据论坛发现大数据的价值

ZDNET至顶网CIO与应用频道 06月06日 北京消息:2014年5月30日上午,由中国软件行业协会主办,北京软件和信息服务交易所(简称"软交所").中关村大数据产业联盟.韩国大数据学会.韩国经营信息学会联合承办的"2014第十八届中国国际软件博览会中韩大数据论坛"在北京展览馆正式召开. 2014中韩大数据论坛"发现大数据的价值"主论坛现场嘉宾 中国软件行业协会秘书长谢渡婴,韩国大数据学会会长吴在仁,软交所副总裁刘东华.中关村大数据产业联盟秘书

安防行业的大数据应用价值

       视频信息的丰富与清晰让安防数据不再仅仅局限于事后的查证功能,同时也给了智能化技术应用的空间.如何利用现有视频存储数据,更有效率地满足客户安全需求,甚至是提高客户的业务发展,近年来一直是业内关注的热点.从云平台与大数据,随着IT技术的不断演进,它们对安防业务的影响也逐渐凸显,谁能在这种大融合.大发展的时代受益? 安防大数据的价值在哪? 谈到大数据始终绕不过云计算.IT界对两者的关系也有过一些不同的观点,不过总体来看,认为这两者是互相补充的仍为多数.比如,VMware全球高级副总裁范承

如何寻找并发掘地理大数据的价值?

如今,地理大数据产业在中国方兴未艾.通过地理大数据为企业提供决策服务的GeoHey,是其中的代表.如何寻找并发掘地理大数据的价值.我们请来GeoHey的数据总监高楠,分享了他对地理大数据这座金矿的"掘金秘籍". 如何获取"无处不在"的地理大数据? 我们先来说说如何获取和清洗地理大数据. 作为一个互联网用户,你是否会留意到不少手机应用在启动时会向你发出获得个人位置定位的请求?比如,你在马路上打开喜马拉雅的FM广播听个相声,边走边听的时候你的位置数据便被不断采集起来,这