“大数据”还不等于“大智慧”

ZDNet至顶网服务器频道 01月14日 新闻消息:技术开发商和媒体早早地为我们描绘了一个即将来临的“大数据时代”。“大数据”无所不知无所不能;有了“大数据”的支持,公司运行效率突飞猛进;“大数据”还能帮你做出最明智的决策,使你的公司所向披靡。简直不要太棒!但是在这里提醒各位,正如所有的高科技宣传一样,“大数据”也不可避免地被炒作夸大。于是,你还相信未来吗?

近几年以来,“大数据”已经传得沸沸扬扬。技术开发商和媒体记者铺天盖地式的宣传,你怎么可能不知道“大数据”?即使不知道也总会听说过。让我们来看看他们是怎么大力宣传所谓的“大数据”:“大数据”无所不知无所不能;有了“大数据”的支持,公司运行效率突飞猛进;“大数据”还能帮助你了解数据,做出最明智的决策,使你的公司时刻都充满了竞争优势。

多么具有诱惑力的宣传!当然我们不能百分之百地说报道违背了事实。只是人们对于高科技的宣传总是过于乐观超前。事实上,很多公司都发现以目前的条件实现“大数据”困难重重,理想很丰满,现实却很骨感。的确,在数据的收集和处理方面,可能具有可观的优势。但真正的使用这些数据、乃至借助这些制定更优化的决策则完全又是另一回事。那么问题出在哪里呢?多数公司表示在“大数据”和对大数据的“大理解”之间,缺少了某个重要的联系。如果这个问题得不到解决,那么人们只是空有一堆看似有用的数据,却难以从中挖掘出有用的价值。

正如硅谷的一名资深业内人士最近透露,尽管从近日创业公司的活动和融资情况来看,大数据的数据采集和处理似乎受到广泛关注,但是现实和预期之间的巨大差距依然无法视而不见。他说,“大数据还没有真正转化为大认识、大洞见和大智慧。”以他们的预测,我们离真正的“大数据”时代还有很长的一段路要走。

炒作和现实,不可混为一谈

我们希望从大数据中获取价值的方法越简单越好,比如导入数据,运行程序,最后得出富有远见的结论。你觉得这可能吗?如果智慧那么容易获得,那人人都可以是乔布斯了。事实上,从大数据中获得有价值的信息远比“导入、运行、输出三部曲”要复杂得多。“《数据预测:大数据战略》(Data Divination:Big Data Strategies)”一书的作者帕姆·贝克(Pam Baker)说,数据直接给出答案的实例确实存在,但只存在于特定的情况下,鲜有发生。我们不能寄希望于例外,我们需要的是普遍规律。

“也许,有人会辩解说,我们可以举出很多例子,在这些例子中,数据往往可以给出非常明确的答案。比如预测分析学可以精确地预测出飞机或供水系统中的某个零部件的报废时间,还能告诉我们替换零部件的最佳时间,以便于在旧部件报废之前最大化地利用其剩余价值。”贝克解释道。

“但是,”她马上又强调,“更多的情况下,我们是没有办法直接获得想要的答案的。你可以从诸多可能的行为中选择一个或者什么都不做,具体情况具体分析,这才是我们所面临的真实情况。”

贝克一语中的。一些基于数据的决策的确是这样。数据不是“冰冷的数字”,它们是“多愁善感的精灵”,正如布鲁斯·斯普林斯汀在一首歌中唱道,它们需要“一点点的人情味”。人们可以通过开发良好的指标和强大的算法来挖掘数据。但这远远不够,人们必须通过自己的认识和见解才能真正地了解数据的“内心世界”,才能充分利用数据背后的价值。有的数据很“直白”,有的却很“委婉”,我们不能一概而论。

算法的局限性

进一步说,我们更希望大数据可以让企业用户直接即时地访问数据,这样他们就可以随时随地、有如神助般的做出每一个最佳决策。愿望是美好的,只不过以我们当前的技术条件来看,我们还达不到这么复杂神奇的水平。

要做到这一点,首先我们需要足够多的数据专家来帮助我们分析处理数据,从大量的信息中提取出有效信息。同Kholsa Ventures一道投资了数家大数据技术公司(例如Parstream)的投资者基斯·拉波斯表示,公司非常需要一个数据专家来指导处理复杂数据分析,只不过大多数的企业用户很难做到这一点。

拉波斯说,你会需要这些数据专家来开发应用和算法,承担大量的数据研究任务。但是在已经拥有这些数据专家的公司里,这些数据专家也并非一直在从事这些高级复杂的数据工作,大概部分原因是由于他们需要花时间去处理一些比较简单的数据分析。数据专家的才能在这里大大地被埋没了。

在最理想的情况下,拉波斯继续说道,数据专家开发出一套工具,当有一方需要答案时可以迅速地在整个组织里寻找分析的答案。在现今这个时代,速度就是一切。我们最不希望看到发生的事情就是,当我们急切地需要答案时,我们只能寄希望于数据专家,然后被动地等待。

出发点固然是好的,但问题在于即使是最聪明的人开发出了最复杂的算法,对于复杂的问题仍然没有最直接的答案。无论多么复杂的算法,也无法做到全盘考虑,对于难以衡量的特定因素更加束手无策。如果某个算法可以全部做到这些,那就无异于人类的大脑,届时麻烦可能更大了。

我需要一个优秀的“中场手”

棒球比赛可以帮助我们更好地理解算法的局限性——水平相当的两个选手,他们的表现可以相去甚远。数据极客们会告诉你,经过多年的研究开发,他们创造了Sabermetrics算法,可以为你提供挑选最佳球手所需要的所有决策信息。他们还开发了一整个系列的数据统计算法,比如“替换胜率(Wins Above Replacement)”。FanGraphs对“替换胜率”的解释如下:“如果某一个队员负伤不能上场,他们的球队不得不找一个次级棒球联赛球队队员或者‘稍逊一筹’的板凳球员做替补时,损失有多少?”对此,他们采用了一系列标准来衡量计算两者之间的胜率差别。

这种复杂的算法若是仅仅用来准确地衡量球员的价值,那倒是没什么大问题。但是有些问题,比如某个球员在压力下的表现如何?他是否刻苦练习?他是哪一种类型的队长?又或者他跟队员的相处配合得如何?所有这些问题该怎么用算法去计算?难道这些问题就不重要了吗?如果要纳入算法的考虑范围,又要怎么去量化这些因素呢?

纯数据分析的追随者会告诉你一切都可以量化,也许他们说的没错。但是我也的确看到过很多水平相当的选手,在几乎相同的条件下,他们的表现是有差距的,尽管从数据分析上来看他们的表现应该很接近。

在企业中,人力资源专家在招聘自由程序设计师时也会遇到类似棒球选手的情况。你可能会有两个专业技能水平相当的应聘者前来应聘该职位,但其中一人的人际关系技能更胜一筹,能够很好地与同事合作,而另一个应聘者则难以相处和合作,显然仅从简历中很难看出这些“软实力”。即使有大量的数据支持,也很难顾及到方方面面可能产生的结果,尤其又涉及到人的时候。

差之毫厘谬之千里

任何一个负责任的医生都会严谨地告诉你,即使两个病人的症状非常相似,采取的治疗手段也不会相同,仍需要严格按照个体的差异性来决定,年龄、体重、其他的健康问题和特殊因素等等,都会影响最终的治疗效果。

就拿医疗过程中使用的智能分析平台IBM Watson来说。当我向一个朋友说起最近有的医生开始采用Watson辅助诊断和制定疗程时,他立刻炸毛了。他坚决表示自己的健康问题和治疗手段不需要一台机器来决定。他的担心完全在理,但是在Watson的例子中,这台机器并没有直接给医生提供可以盲从的答案,只是根据已有的迹象、患者信息、病症再结合当前对此病症的科学研究结果,给出治疗的参考方案而已。

正如我之前描述的数据专家的情况一样,医生们同样也很忙碌,他们不可能一边给患者看病一边还要熟知自己领域的所有最新进展。相关的研究实在太多了(当然这是一件好事)。所以他们需要Watson的辅助。Watson能够快速地过滤目前的研究,但是仍然需要医生根据实际情况来决定最终的治疗方向。我更愿意把这个过程称为科学中的艺术。知识给我们带来了无限的可能性,但最终的决定权仍在于医生而不是机器。

企业同样也会面临类似不确定性,这时候就需要人的介入,运用他们的知识,借助数据的力量,为不确定性做出决策。

未来我们能走多远?

很多时候机器可以给出人们需要耗费数年时间才能得出的答案和远见。贝克指出,比如大数据已经在帮助我们更深刻地了解疾病,尤其是癌症,有很多方面都是人类研究人员从未涉及过的。“没有大数据给我们提供足够的数据信息,我们永远都不会找到最佳治疗方案(至少最近几年毫无希望)。在这里,我想说的是,大数据‘的确’可以十分精准。”

而且她还相信机器的学习能力在不远的将来一定会达到一个足够成熟的阶段。届时机器或许可以替我们做更多的决策,因为人类的大脑能力毕竟有限,无法一下子处理所有的可用信息。

我不能说她的预想是错误的,然而就目前看来,采集和处理数据的能力远远超过了对这些数据的理解能力。贝克也谈到,预测分析一直在前进发展,有时候数据可以直接给出答案,但在更多的情况下,这仍然是一个复杂的人机交互过程。即使技术在不断向前发展,这两者之间如何才能完美的合作仍是一个难题。

除非我们能从中找到一个折中的办法或者机器的技术能有大幅度的提升,否则我们仍将面临一个智慧的鸿沟,需要时间和技术的进步来慢慢填补。

原文发布时间为:2015年01月14日

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-11-01 01:17:21

“大数据”还不等于“大智慧”的相关文章

“银发”出行大数据还须全面解读

10月9日重阳节,<旅行社老年旅游服务规范>正式实施一月有余,备受关注的老年人出行现状如何?去哪儿网8日发布<2016年度"银发"出行大数据报告>显示,60周岁及以上老年人出行目的地多在国内,今年超一半老人出游无子女随行.(据10月9日<北京日报>) "超一半老人出游无子女随行"作为新闻标题颇为夺目,尤其在重阳节尊老爱老的氛围下,白发老人自行出游多多少少显得有点"孤寂". 然而,"银发"出行

大数据还没有改变游戏规则

本文讲的是大数据还没有改变游戏规则,一度被认为是废物的各种来源的数据现在对某些人来说已经成为一种宝贵资源,这些人保存大数据并以此进行分析预测而为全球企业的改变服务.我们可能在某些细小的方面看到过案例.有些组织在与其对手的竞争中通过使用big data已经获得了绝对优势,但很多人会说并不能确定是胜在使用big data这一点上. 2012年已经被预测为大数据年.但到目前为止,研究的重点还集中在处理4V(高速.种类.容量和价值)big data以及如何操作它们.据我所知,还没有在商业角度使用这种数据

这几年是忽悠?大数据还没那么神奇

中介交易 SEO诊断 淘宝客 云主机 技术大厅 听到"大数据",你是否和大多数人一样,觉得多有耳闻又轮廓模糊?用美国数据可视化专家尼古拉斯·费尔顿 (Nicholas Felton)的话说,大数据就是超出传统数据管理工具处理能力的大规模.复杂的数据集合,衡量标准包括数据量.处理速度以及数据种类. 而大数据真像传说中的那么有用吗?在今年夏季达沃斯论坛上,一场名为"大数据还是大忽悠?"的辩论会如期登台,参会者热烈探讨大数据带来的机遇是否被过分炒作. 大数据有多有用 &q

巴西7:1后 百度大数据还能预测些什么?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 7:1,日耳曼战车把桑巴军团虐到爆.庄家又一次玩坏了大家.黄健翔再一次发出了激情的怒吼,丹特,你丫就是一内鬼!一场比赛,不仅让肥罗纪录作古泪奔无语,更让K神的励志鸡汤传遍微信朋友圈. 其实,巴西输给德国,早已被大数据预测.虽然谷歌.微软.高盛都在扮演章鱼保罗,跟乌贼刘抢生意.但淘汰赛14场全部命中的,只有百度和微软,此前的小组赛百度的准确率也

利用空间大数据还大众一片蓝天!

为期两天的"第十四届Esri中国用户大会"在北京国际会议中心召开.来自全国的5000余名空间信息产业从业者及爱好者参加了首日全体大会.国家测绘地理信息局副局长宋超智.中国地理信息产业协会秘书长胥燕婴.国家基础地理信息中心主任冯先光.国家防汛抗旱总指挥部副主任万海斌.中国石油信息管理部总经理刘希俭等领导与专家出席了大会. 在大会上,IBM中国研究院李文军博士结合IBM的认证计算和GIS的空间分析能力对环境大数据的分析.处理.挖掘和呈现,向受众展示空间大数据对于环境监测和节能环保的巨大作用

除了加强风控,大数据还能为FinTech做些什么?

近几年,处于互联网和科技风口上的许多事物都飞起来了.似乎一夜之间,云计算火了,人工智能火了,虚拟现实火了,O2O,P2P,以及支撑这些新鲜事物发展的大数据一并火了起来.不过,我们知道,大数据其实并非近几年刚刚萌生的新鲜事物,实际上,早在上个世纪80年代初期,世界著名未来学家阿尔文· 托夫勒就在<第三次浪潮>一书中预言,大数据极有可能是继农业革命和工业革命后的"第三次浪潮". 到了90年代,随着美国信息高速公路计划的推行,IT技术的对人类生活的发展越来越重要,大数据信息的价值

世界杯后,百度大数据还能干什么?

中介交易 SEO诊断 淘宝客 云主机 技术大厅 文/杂谈科技 虽然世界杯已经落下帷幕,但围绕世界杯预测产生的大数据分析话题仍在持续发酵.中国搜索引擎巨头百度在世界杯期间,成为唯一一家准确预测德国夺冠的世界科技巨头.并且在小组赛.淘汰赛期间,其预测准确率也要高于微软.高盛.谷歌.雅虎等国外科技公司. 世界杯虽然已经结束,但由此引发的百度大数据猜想却更加引人关注.利用大数据分析预测世界杯只是百度大数据的一种应用模式,百度表示,目前百度大数据已经在旅游.教育.赛事产业进行了多次尝试,部分产品有望在年内

理财APP距离大数据还远

屌丝理财催生了新的市场,也引爆了理财平台之间的竞争.正如好贷网总裁李明顺在清科2014中国互联网金融投资大会上所分享的,理财产品再多,可老百姓几乎只认收益率和流动性,企业差异化才有机会.而对于信用评估担保服务Z estF inance通过机器的大数据进行客户资质和信用等等评估,得到了不少业内人士的推崇.但这条路目前对于国内理财A P P来说似乎并不具有普世价值.铜板街创始人C E O何俊认为,理财A P P跟大数据暂时有点远,对于创业公司,帮客户做理财顾问或者资产配置更接地气.避开同质南都记者(

大数据还能这么用:看穿式监管 精准锁定异动账户

当前,资本市场内外环境更趋复杂,证券违法违规呈多元化.隐蔽化等特征,一线监管工作面临前所未有的挑战.用好大数据.人工智能等新技术,不断提高科技监管能力,是交易所一线监管面临的重要课题,也是新形势下做好一线监管工作的必然选择. 近年来,深交所积极推进科技监管.智能监管,充分运用文本挖掘.机器学习等先进技术,结合一线监管实践,开发了大数据智能监察系统.上市公司监管系统.风险监测监控系统等智能化应用系统,在交易监管.上市公司监管.债券监管.风险监测监控等方面精准发力,持续提升科技化.智能化监管水平,为