大数据的兴起将改变人类思考方式

       每个人都知道互联网改变了企业经营、政府运作以及人们生活的方式。但是一种新的、不那么明显的技术趋势却有着同样巨大的变革能力,那就是“大数据”。大数据的趋势发端于下面这个事实:如今到处传播的信息比以往任何时候都多出了许多,而且这一趋势正在应用于非同寻常的新用途。大数据与互联网截然不同,虽然互联网使数据的收集和共享方便了很多。大数据的意义并不仅仅是通信:其本质是我们可以从大量的信息中学习到从较少量的信息中无法获取的东西。

将改变人类思考方式

早在公元前3世纪,亚历山大图书馆被认为收藏了全部的人类知识。而如果把当今全世界的信息平分给每一个活着的人,那么每个人拥有的信息量将足足超过当年亚历山大图书馆全部藏书的320倍。如果把所有这些信息刻到光盘上并且分五摞叠起来的话,那么这些光盘可以一直堆到月球。

这种数据爆炸是相对新鲜的现象。仅仅在2000年的时候,全世界全部的存储信息中还只有四分之一是数字化的,其余的都保存在纸张、胶片和其他模拟介质上。但是由于数字数据数量的增长十分迅速——几乎每三年就翻一番,这种情形很快发生了逆转。如今,在所有存储信息中只有不到2%是非数字化的。

鉴于如此悬殊的比例,人们免不了在理解大数据的时候仅仅从数量上进行考虑。然而这将会产生误导。大数据的另一个特征是它能够用数据来表现世界的众多层面,而这些层面以往从来都没有被量化过——这种特征可以被称为“数据化”。例如,位置信息的数据化最早是由于经纬度的发明,而最近又有了GPS。当计算机对几个世纪内的书籍进行取样时,文字便成了被处理的数据。甚至连友谊和爱好也被数据化了——例如通过Facebook。

借助于廉价的电脑内存、高性能处理器、智能算法、聪明软件以及从基本统计学中借鉴来的数学知识,这样的一类数据正在被应用于难以置信的新用途中。这种新方法并不是试图“教会”计算机去从事驾驶或翻译这样的事情,而是要向计算机输入足够多的信息,从而使它们能够推断概率,例如交通指示绿灯亮、红灯不亮的概率,或者是在特定语境下“light”一词意为“光”而不是“轻”的概率。

以这种方式对大量数据加以利用,要求人们在三个方面彻底改变对数据的态度。第一是收集和使用大量数据,而不是像统计学家们在过去100多年里所做的那样,只满足于少量的数据或样本。第二是抛弃人们对有条理和纯净的数据的偏爱,转而接受杂乱无章——在越来越多的情形下,少许的不精确是可以容忍的。第三,在许多场合,人们需要放弃对事情原委的追究,而代之以对相关性的接纳。利用大数据,而不是试图弄懂发动机抛锚或药物副作用消失的确切原因,研究人员可以收集和分析大量有关此类事件的信息及一切相关素材,找出可能有助于预测未来事件发生的规律。大数据有助于回答是什么、而不是为什么的问题——通常有这样的回答就足够了。

互联网重塑了人类交流的方式。大数据则不同:它标志着社会处理信息方式的变化。随着时间的推移,大数据可能会改变人们思考世界的方式。随着人们利用越来越多的数据来理解事情和作出决定,人们很可能会发现生活的许多层面是随机的、而不是确定的。

从因果关系到相关性

人们看待数据的方式的两个变化——从局部变为全部以及从纯净变为凌乱——催生了第三个变化:从因果关系到相关性。这代表着告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系以及利用这些信息来解决问题。

加拿大的研究人员正在开发一种大数据手段,以便能在明显症状出现之前发现早产婴儿体内的感染。通过把包括心率、血压、呼吸和血氧水平等16种生命体征转化成每秒1000多个数据点的信息流,他们已经能够找到极其轻微的变化与较为严重的问题之间的相关性。最终,这项技术将使医生能够提前采取行动,从而拯救生命。

大数据所产生的影响将远远超出医学和消费品的范畴:它将深远地改变政府的运作方式和政治的性质。在推动经济增长、提供公共服务或进行战争等方面,那些能够有效利用大数据的人将拥有胜过别人的巨大优势。迄今为止,最令人兴奋的成果出现在市级,在这个级别上获取数据和利用这些信息进行实验要容易一些。纽约市长迈克尔·布隆伯格(他本人就是靠着数据行业发家的)率先进行了一项努力:该市正在利用大数据改善公共服务和降低成本。其中一个例子就是新的火灾预防策略。

非法在屋内打隔断的建筑物着火的可能性比其他建筑物高很多。纽约市每年接到2.5万宗有关房屋住得过于拥挤的投诉,但市里只有200名处理投诉的巡视员。市长办公室一个分析专家小组觉得大数据可以帮助解决这一需求与资源的落差。该小组建立了一个市内全部90万座建筑物的数据库,并在其中加入市里19个部门所收集到的数据:欠税扣押记录、水电使用异常、缴费拖欠、服务切断、救护车使用、当地犯罪率、鼠患投诉,诸如此类。接下来,他们将这一数据库与过去5年中按严重程度排列的建筑物着火记录进行比较,希望找出相关性。果然,建筑物类型和建造年份是与火灾相关的因素。不过,一个没怎么预料到的结果是,获得外砖墙施工许可的建筑物与较低的严重火灾发生率之间存在相关性。

利用所有这些数据,该小组建立了一个可以帮助他们确定哪些住房拥挤投诉需要紧急处理的系统。他们所记录的建筑物的各种特征数据都不是导致火灾的原因,但这些数据与火灾隐患的增加或降低存在相关性。这种知识被证明是极具价值的:过去房屋巡视员出现场时签发房屋腾空令的比例只有13%,在采用新办法之后,这个比例上升到了70%——效率大大提高了。

大数据的挑战和局限

大数据也正在帮助提高民主政府的透明度。一个建立在“开放数据”概念上的运动已经形成,其诉求超出了目前在发达民主国家已经十分常见的信息自由法。这一运动的支持者呼吁政府把手上浩如烟海的普通数据向公众开放。

与此同时,在政府推动使用大数据的同时,它们还需要保护公众免受不正当市场垄断的侵害。管理大数据的法规甚至可能成为国家间的角斗场。出于对反托拉斯和保护隐私的关切,欧洲各国政府已经在严查谷歌公司。脸谱网可能会成为世界各地类似行动的打击目标,因为它持有太多的个人数据。外交官们应该准备好围绕是否像对待自由贸易那样对待信息流动展开交锋。

大数据势必将改变人们生活、工作和思考的方式。建立在强调因果关系基础上的世界观正在受到推崇相关性的挑战。知识的占有曾经意味着对历史的了解,而现在却意味着预言未来的能力。解决大数据所带来的挑战将不是易事。
在决策越来越多地受到数据支配的世界里,人、直觉或是不顾事实的蛮干还有什么用武之地呢?如果每个人都求助于数据,都利用大数据工具的话,那么不可预测性——例如人类的本能、冒险、意外甚至失误——也许将会成为差异的关键。如果真是这样的话,那么需要专门为人为因素辟出一席之地——即为直觉、常识、运气留出空间,以确保它们不会被数据和机器生成的答案挤走。

这将对社会进步的观念产生重要影响。大数据使我们可以更快地进行实验,对更多的线索展开探索。这些优势应该会导致更多创新的产生。但在有些时候,发明的火花迸发是数据所无法表现的。倘若亨利·福特当初求助于大数据算法系统来研究顾客希望得到的东西,算法系统得到的答案会是“更快的马匹”,也就不会有福特著名的汽车生产线了。在大数据的世界里,需要培养的恰恰是与人类关系最密切的特性——创造力、直觉和上进心,因为人的聪明才智才是进步的源泉。

大数据是一种资源和一种工具。它的目的是告知,而不是解释;它意在促进理解,但仍然会导致误解——关键在于人们对它的掌握程度。人们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳这种技术。

原文发布时间为:2013-08-13




时间: 2024-09-21 19:40:34

大数据的兴起将改变人类思考方式的相关文章

洪小文撰文: 人工智能正在与机器学习、大数据构成一个足以改变未来的技术“铁三角”

雷锋网(公众号:雷锋网)按:继<我们需要什么样的机器人>之后,微软全球资深副总裁.微软亚太研发集团主席兼微软亚洲研究院院长洪小文再一次亲手撰写文章,与我们进一步分享了他对人工智能的见解与洞察--<HI+AI:人机协同 赋能未来>. <机器会产生自我意识吗?>是<HI+AI:人机协同 赋能未来>三篇系列文章的下篇.在本文中,洪小文博士以"中文房间"为例子,告诉我们现阶段的人工智能还很弱,离实现强人工智能还很远.而眼下,HI+AI.人类创意无

何帆:大数据时代正聚集改变的能量

以下内容来自社科院世界经济与政治研究所副所长何帆的一次讲座. 大数据时代需要重视统计学 我们现在要开始重视大数据,要重视统计学,因为在数据足够大了之后,我们突然发现一切社会现象到最后都有统计规律,它不像物理学那样可以准确的去描述因果的关系,它从本质上来说就是一个统计的规律.统计学学好了,你再去学别的都战无不胜,因为一切社会现象到最后都是一个统计规律. 为什么要强调统计学呢,因为我们的认知能力中最差的是统计思维.人的大脑有一些功能优良得超过我们的想象,比如我们的语言能力.著名的语言学家乔姆斯基曾说

何鸿凌:电信行业大数据应用案例的实践及思考

"中关村大数据产业联盟"推出"大数据100分"论坛,每晚9点开始,于"中关村大数据产业联盟"微信群进行时长100分钟的交流.探讨. [大数据100分]何鸿凌:电信行业大数据应用案例的实践及思考 文:何鸿凌 主持人:中关村大数据产业联盟 副秘书长 陈新河 主讲人:何鸿凌 承办:中关村大数据产业联盟 何鸿凌,中国移动集团公司业务支撑系统部项目经理,高级工程师.1978年生人,2001年获得重庆邮电大学计算机应用学士学位,2014年获得重庆大学软件工程

【行业】透过云计算、工业大数据对智能制造的一点思考

前言 2017中国大数据应用大会于7月13-14日在成都召开,会上大咖云集,干货良多,Ghostcloud也有幸参与了此次大会.Ghostcloud致力于做最专业的容器云PaaS管理平台和提供最佳行业解决方案,而这次大会围绕"大数据.大智能.大健康"的主题内容也引发了我们对大数据和智能制造相关行业的思考,在此与各位同仁分享,不吝赐教. 智能制造的发展历史和趋势 智能制造的概念来源于人工智能的研究,并在全球范围内不断实验和创新.20世纪90年代初,美国就开始了新技术的执行政策,其关键技术

传统制造业面临大数据的7种改变方式

文章讲的是传统制造业面临大数据的7种改变方式,中国是个制造业大国,在工业企业信息化.数据化.数据创新领域可以做的事情很多.应用数据的思维古已有之,如同所谓的互联网思维,其实几十年前的营销学原理就有涉猎.关键在于我们能通过适当的技术与工具把数据联结起来,进行分析,进行跨界创新应用.然而问题也跟着来了,制造业对大数据怎样看待和认识的? ▲图片来源于网络 制造业并不是信息化发达的行业,从流程的传统粗糙就体现出来.即便有现代化的设备,整体的信息化方案多数也是高科技企业类似某些设备的制造商以及代工厂商.在

大数据预测将会改变哪些行业?

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [i天下网商注]世界杯期间各家科技巨头利用大数据预测比赛结果,再现"章鱼保罗"雄风.世界杯结束了但大数据预测还会继续.随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变.大数据预测的逻辑基础是,每一种非常规的变化事前一定有征兆,每一件事情都有迹可循,如果找到了征兆与变化之间的规律,就可以进行预测.大数据预测无法确定某件事情必然会发生,它更多是给出一个概率. 文/ Mr.Jamie 从天气预报看大数据预测的四个

关于大数据时代传统商业存储的思考:中心存储与分布式存储的对比

今天和我们部门的老大1*1, 大家面对面沟通了一下到新的项目组的想法.而且也将我对传统商业存储在当前大数据云计算发展如火如荼的背景下,如何改进,融合交流了我的看法. 传统的商业存储,诞生于大型机,小型机时代.那时候将所有的硬盘集中的放到几个机架上,大型机通过光纤,ISCSI等高速连接到存储系统上.存储系统需要保证高并发,高IO读写速度,数据冗余备份等保护. 现在x86服务器,尤其是Google这种互联网公司都是通过廉价的硬件组装成高大上的集群,分布式文件系统(GFS,HDFS),各种基于内存的系

关于大数据时代传统商业存储的思考: 中心存储 VS 分布式存储

      尊重原创,转载请注明出处:http://anzhan.me ; http://blog.csdn.net/anzhsoft        今天和我们部门的老大1*1, 大家面对面沟通了一下到新的项目组的想法.而且也将我对传统商业存储在当前大数据云计算发展如火如荼的背景下,如何改进,融合交流了我的看法.        传统的商业存储,诞生于大型机,小型机时代.那时候将所有的硬盘集中的放到几个机架上,大型机通过光纤,ISCSI等高速连接到存储系统上.存储系统需要保证高并发,高IO读写速度

惠普加强HAVEn大数据平台以支持新型人类信息应用软件

ZDNET至顶网CIO与应用频道 07月07日 北京消息:HP Autonomy推出新版HP IDOL,其加强了与HP HAVEn大数据平台之关键组件(HP ArcSight.HP Vertica和Apache Hadoop)的集成,并且大幅提升了HP IDOL的分析能力.可靠性和易用性. 大数据曾是数据科学家专享的技术,而其算法复杂,但目前正在快速成为主流,让企业能够针对更多日常的运营应用软件进行强大的分析.这些企业寻求灵活.安全且高速的平台,可以经济地整合结构化数据.机器数据.新型非结构化数