大数据时代还没有真正到来

  导语:在大数据时代,我们只需要知道“什么”,而不需要知道“为什么”。但大数据真的给科学带来很大的变革吗?它是否有传说的那样神奇呢?还是这仅仅是一场过度宣传所引出的幻境呢?作者告诉你,大数据时代还没有真正到来。

  如果不考虑目前大数据已取得的成就的话,大数据会给科学带来彻底的变革吗?它会帮助我们建设一个更加美好的世界吗?

  在回答这个问题之前,让我们先在时间上退回一点儿。近期,我被邀在英国海伊小镇(Hay-on-Wye)举行的“追寻光之源”(How the Light Gets In)文化艺术节上发言。文化节的主办方将我安顿在美丽的大宾顿庄园(Great Brampton House)中。在那里,我遇到了其他文化节的被邀演讲者,如物理学家George Ellis、Carlo Rovelli、Carlos Frenk、Tara Shears、生物学家Rupert Sheldrake、精神病学家David Nutt,以及记者Colin Tudg)与David Malone等。(我希望尽快地与埃利斯和谢尔德雷克进行交流。)

  一天下午,我参加了一场有关大数据的公开辩论,一同参加的还有记者Kenneth Cukier与Angela Saini,以及社会学家Laurie Taylor。文化节的手册为我们的这次辩论环节做了这样的宣传:“在一个可以收集到浩如星海的数据量的时代,我们会用复杂的真实数据模型来代替简洁的理论吗?大数据是否意味着理论的终结?”这些问题是由《经济学人》(The Economist)数据编辑Cukier和牛津大学网络治理教授Viktor Mayer-Schonberger共同提出,发表在他们2013年的畅销书《大数据:一场改变人类生活、工作与思维的革命》中。

  他们在一篇基于这部著作的文章里写道:“目前,有远超过从前的大量数据信息在我们周围进行传播,大数据正是伴随着着这一现实条件崭露头脚的,而且它还被赋予了很多令人意想不到的用途。尽管网络使数据信息的收集和分享更加便捷,但大数据并不能等同于互联网。相比于互联网,大数据关注的内容要远超普通的沟通和交流。大数据的理念是,通过分析大体量的数据信息,我们可以理解很多只依靠少量数据信息所不能理解的事情。”

  Cukier 和Mayer-Schonberger最有趣的观点就是,大数据将使我们可以在不必要理解问题的情况下解决问题。他们在文章中写道,大数据将会把研究人员关注问题的重点从“因果关系转移到相互联系”上。前《连线》(WIRED)杂志编辑Chris Anderson在他2008年的文章“理论的终结”里也提出过相似的言论,即“这代表着思维方式的改变,从试图理解这个世界运作方式的深层原因到只是简单地了解事件间的相互联系,然后利用这种联系解决问题。”

  如果大数据意味着一种数字技术的话,那么我热爱大数据。数字技术已经改变了记者以及科学家采集、分析和传播信息的方式。举个例子来看,我可以用电脑在谷歌上搜索到Cukier的信息,连家门都不用出,还可以瞬间找到其他读者对他的书评,甚至包括《纽约时报》上性情古怪的评论员Michiko Kakutani出人意料的好评。

  不仅如此,Cukier还认为仅仅通过挖掘数据之间的相关性,科学家可以得到很多结论,这也是正确的。例如,在一个半世纪以前,流行病学研究就表明,在吸烟和癌症之间存在很强的相关性。但到目前为止,我们依然无法确切地理解吸烟引发癌症的机制。然而,这种相关性的发现在过去的几十年里引发一场又一场的反烟运动。毫无争议的是,这些运动比我们在检测和治疗手段方面取得的所有进步都更加明显有效地减少了癌症的发病率(正如我在最近一篇文章中指出的那样)。

  同时,我也同意Cukier的另一个观点,即理论可能会阻碍问题的解决。打个比方来说,你是一名法官,正纠结于已被证明有罪的杀人犯是否会再次作案。你可能会去咨询精神病学家或者其他所谓的心理学专家,让他们基于自己最喜欢的心理学派理论来做一下预测。但是你还不如使用保险公司用来计算保费的那一套方法,看看跟你这位杀人犯背景相似的罪犯的再次犯罪率就可以了。

  然而,基于很多原因,我对Cukier和其他支持者对大数据的热情依然不敢苟同,甚至感到有些厌烦。首先,他们的说辞让我想起混沌学以其后继者“复杂性理论”的研究者的炒作。对于混沌和复杂性,我在自己1996年的书《科学的终结》里将两者归并到一起,创造了一个新的名词“混杂学”。两个领域都承诺,如果利用运算速度更快的电脑以及更加复杂的软件,科学家们可以分析解答那些被古板乏味的还原论者的方法所限制的问题。某些混杂学家希望能够发现一个新理论,可以解释一系列复杂现象的“自组织”系统——甚至是一个“反熵”力。

  然而,这样的发现从未发生过,而且Cukier和Schonberger所设想的那种实际中的的进展同样也没有出现。就拿基因学来说,由于电脑技术和其它技术的进步,人类基因组计划以低于预算的花费和时间于2003年提前完成。提取、分析人类和其他生物体基因数据的成本一直以来都在不断下降。

  但令人失望的是,所有这些进展并没有产生多少医学上的进步。在写作本文时,美国没有一种基因疗法被批准投入市场,而欧洲也仅通过了一项。人们对寻找调配复杂行为特征及机体紊乱的特定基因所作出的努力一直未取得成果,对癌症发动的战争也同样从未胜利。

  和遗传学家一样,神经学家也同样淹没在数据里。尽管扫描仪及其他工具的功能越来越强大,但是神经学家依然无法准确解释大脑产生思维的原因,或者思维为什么会经常出现问题。美国心理健康研究所(National Institute of Mental Health)的主任Thomas Insel最近提议,应该彻底反思我们对精神分裂症、抑郁症及其它精神疾病的定义与诊断方法。我们对这些疾病的治疗手段依然是原始得可怕。

  2008 年的经济崩溃提供了一个实际检验大数据的机会。华尔街的银行家们拥有计算速度最快的电脑、最精密复杂的软件以及金钱可以买到的最大的数据库,但许多人并没有预测到那年的经济崩溃。所以到目前为止,实践证明那些认为大数据能使经济学和其他社会科学变成真正科学(精确且具有预测性)的美好愿望依然是一个幻想。

  我希望并且坚定地认为,不断进步的信息技术在将来的某一天会真正地给医学、社会科学以及其它领域带来革命性的进步。但在那一天到来之前,让我们还是暂且抑制一下对大数据的盲目炒作与过度宣传吧。

时间: 2024-09-18 02:14:48

大数据时代还没有真正到来的相关文章

周鸿祎:真正的大数据时代还没到 硬件可以免费

奇虎360CEO周鸿祎此前便抛出过"得大数据者得天下"的观点,今日,他在2014福布斯中国创新峰会上表示,目前,多个行业将被大数据的云端化所改造,一个另人激动的IOT创业时代即将到来.http://www.aliyun.com/zixun/aggregation/20826.html">传统产业在面临着互联网的颠覆性冲击时,应更加贴近用户,才能孵化出具有价值的创新商业模式. IOT 模式在国内被称为物联网.周鸿祎认为,五年内,国内将有两百亿台设备连到互联网,并会产生巨量

Etu蒋居裕:大数据时代还处于早期

市场研究公司IDC预计,2012年全世界的数据总量将会达到2.7ZB,而且今后每两年将会增长一倍.同时,企业高层管理人员也意识到了数据的力量,普华永道的调查显示,71%的CEO认为数据是企业公司里面最重要的一种资产,但仅43%的CEO认为其IT机构在数据交付价值上是很有效的.在数据爆炸的情况下,有评论称,我们已经进入了大数据时代. 知意图(Etu)负责人蒋居裕 对此,知意图(Etu)负责人蒋居裕在精准推荐系统Etu Recommender发布会上发表了他的看法. 蒋居裕坦言:"美国是全世界最早有

大数据时代还剩多少真情实感

近来,一种可代写诗歌.情书.检讨书.简历,甚至小说的"网络生成器"软件走红.昨日是许多年轻人热捧的平安夜,不少人的邮件.短信.微博.微信中收到了这种电脑软件自动生成的祝福.今天,我们进入大数据时代,http://www.aliyun.com/zixun/aggregation/31687.html">面对网络生成器,让人们不得不反思,我们的生活还剩下多少真情实感? 网络生成器五花八门 让我怎样感谢你啊,我的阿岚 /当我走向你的时候 /我原想捧起一片云朵 /你却给了我整个

云空调代表大数据时代家电趋势

当下,"大数据"成为了时代的热点,人们正在憧憬并致力推动它的到来.相关专家指出:劳动工具的创造与发明是人类文明和社会进步的标志,像原始时代的石器,向标志人类文明时代的生火技术,云计算就是大数据时代最具代表性的劳动工具. 志高空调董事长郑祖义表示:很多人觉得大数据时代还很遥远,实际上在管理.教育.金融.城市建设等领域我们都享受到了云计算的便利.近年来,各个IT巨头都在不遗余力地布局云产业,各国政府也加大了引导和鼓励力度,意在抢占市场空白.但目前,云计算仍比较集中在IT和通讯领域.我们认为

高翔:大数据时代需要提倡一种体人文情怀

清华大学校友.国美在线CEO高翔 中国网财经3月14日讯 12日,清华大学校友.国美在线CEO高翔在清华经管学院举办的大数据时代的商务与管理变革论坛上表示,电子商务未来的核心竞争力在于对大数据利用.高翔强调,大数据时代还需要提倡一种体人文情怀. 高翔称,从大数据时代信息的透明和分享出发,电子商务未来的核心竞争力在于对大数据利用.在零售方面,他以国美线上为例.国美线上正在与搜索引擎公司展开合作,逐步实现数据的共享.通过对透明数据的分析,从而为用户提供个性化的服务.而在与线下实体店的互动方面,通过记

互联网大数据时代来袭:蕴藏创业空间待挖掘

用户的消费习惯.兴趣爱好.关系网络以及整个互联网的趋势.潮流都将成为互联网从业者关注的热点,而这一切的获取和分析都离不开大数据.一方面,社会化媒体基础上的大数据挖掘和分析将会衍生很多应用:另一方面,基于数据分析的营销咨询服务也正在兴起. 这些专注于数据挖掘和数据服务的公司将成为电子商务乃至互联网第三方服务业中的新兴力量. 数据背后潜藏着巨大的商业机会.以前只有Google.微软这样的公司能做大数据的深挖,现在已经有越来越多的创业公司进入,不同公司在不同维度的数据分析和服务正创造出新的商业模式.

专家热议大数据时代下的智慧城市建设

随着http://www.aliyun.com/zixun/aggregation/13565.html">大数据产业所蕴含的的商业价值在全球范围内的显现,关于中国大数据时代的产业探索和应用创新备受关注.近日,多名专家纷纷表示,中国必须抓住大数据时代的机遇,挖掘海量数据的潜在价值,进而推进智能城市建设. 中国工程院院士.中国科学院计算所研究员倪光南在"2012西咸新区大数据高峰论坛"上表示,随着云计算.移动互联网和物联网等新一代信息技术的创新和应用普及,海量数据正在中国

大数据时代你应该掌握哪些技能?

大数据已经逐渐渗透进我们生活的方方面面.网络安全公司利用大数据来提升日常侦查工作的安全性;数据服务行业利用大数据帮助顾客找到便捷的解决方案;在防诈骗的工作中,大数据可以提升工作的准确性,提高效率,以达到保护私人财产安全的效果. "大数据"是一个对于大量数据进行分装的概念.大数据可以是一家信用卡公司的交易信息.在线零售商的发票信息.气象站的气象测量指标等.所有的数据,都具有其独一无二的特征,很难用传统的计算方法和技术加以分类.分析.此外,数据还具有时效性,假如没有及时地加以分析,数据的性

互联网的大数据时代真来了?还是一直都在?

中介交易 SEO诊断 淘宝客 云主机 技术大厅 (文/Heven)这几天在微信上看到很多关于互联网大数据的文章,也有人说大数据已经作为云计算.物联网之后IT行业又一大颠覆性的技术革命,Heven在想,互联网的大数据时代真来了?还是一直都在?其实,数据分析技术的运用已经悄然开始了,比如淘宝网.京东等购物网站监视着我们的购物习惯,百度.谷歌等搜索引擎监视着我们的网页浏览情况,新浪微博.腾讯微博好像对我们的朋友很熟悉,还有就是QQ和QQ空间总能给我们推荐那些似曾相识的朋友,但是Heven觉得我们离真正