大数据预测世界杯不准

  人类一思考,上帝就发笑;世界杯一来到,上帝笑得血压也升高。倒不是足球踢得多欢乐,而是世界杯预测太恶搞。

  我略微总结了下,剔除掉贝利和大校这种声名卓着的反向指标,煞有介事的世界杯预测大致可以分为五类:一是实力决定论,以高盛和德银等投行为代表,将">FIFA排名、过往战绩、近期表现、球员身价、赌球赔率、国家经济等一系列数据综合反映出的球队实力作为预测依据,用计量模型计算出看上去精确至极的概率,只不过,计算结果有较大差异,比如,高盛预测巴西夺冠,德银则更看好英格兰。

  二是条件决定论,以霍金教授为代表,将各种客观条件对某一球队的表现影响糅到一个获胜公式里,这些条件包括球场选择、裁判国籍、球衣选择、阵型选择和交通工具选择等,只不过,这种公式的预测有效时段很短,所以在决赛还离得远的现在,公式还预测不出最后的冠军归属。

  三是流言决定论,以雅虎和微软Bing为代表,将以亿为单位的网络噪音转化为清晰的结果信号。虽然这种互联网魔术看上去既科学又玄妙,甚至可以从经济学的“预期自我实现”理论加以解释,但总让人联想到古时候无论中国还是西方,帝王对童谣和吟游诗人作品的格外关注。

  四是宿命归属论,以一则关于1966年和3721.html">2014年的时空重叠热帖为代表,1966年,欧冠冠军是皇家马德里,西甲冠军是马德里竞技,西乙冠军是拉科鲁尼亚,意甲冠军是尤文图斯,皇家贝蒂斯降级西乙,2014年无一例外都是如此。“Yesterday once more”就剩世界杯了,1966年是英格兰夺冠,按照宿命归属,2014年英格兰也将问鼎。

  五是动物先知论,以章鱼保罗为代表,2008年保罗预测欧洲杯6场5胜,2010年保罗预测南非世界杯8场全胜,只不过,保罗没能活到2014年巴西世界杯揭幕,于是,乌龟、大象、熊猫等动物先知又登上了预测舞台,只不过,保罗的辉煌再难复制。

  当然,所有这些世界杯预测或多或少都有恶搞的成分,当不得真。但稍微严肃一下,细致分析这五种方法论,除了最后一种,剩下四种都用到了大数据,这恰是时下大数据热的一种表现。从世界杯预测看大数据热,三个误区值得警醒。

  首先,大数据并不能解决所有问题。大数据是很有用的,几乎每一个环节,包括产品设计、市场定位、目标选择、销售策略和模式修正,都能靠大数据来解决问题,甚至连各种和商业无关的问题,也都能从大数据这里得到帮助。但大数据并不是万能的,大数据能解决的都是客观问题,而不是主观问题。就拿世界杯预测来说,谁能夺冠取决于多种因素,各种预测方法论本质上并无区别,只不过它们对不同决定要素赋予的权重不尽相同。也就是说,决定夺冠的要素是什么,这是一个主观问题,大数据只能说明客观的状态,无法对夹杂重要主观判断的问题直接给出解答。

  其次,数据并不是越大越好。数据分析早就存在,大数据火爆却是最近的事情,其中的区别就在一个“大”字。从道理上讲,数据种类越多、序列越长,包含的信息就越丰富。但值得强调的是,信息越丰富未必就越好,当下是一个信息大爆炸的时代,信息越多有的时候越不利于获知。而且更重要的是,像世界杯预测,明显是一个核心信息不突出的事情,所以信息之间反而容易形成无逻辑的冲突,这恰是预测方法论众多,谁都不靠谱的原因。此外,数据越大,数据处理过程中的选择就越多,而选择总是难以回避道德风险问题,每一个大数据分析者,都得面对为特定目标而选择的诱惑,“有选择的选择”往往是大数据反而模糊了真相的潜在原因。

  最后,大数据搞不定薛定谔的猫。在盒子打开前,薛定谔的猫既是活的,又是死的,只有打开盒子这一行为,才能导致状态叠加的坍塌,不确定性才会消失。也就是说,在世界杯真正开始前,32支球队都是冠军,又都不是冠军,只有踢起来才能见真章。大数据分析都是基于既成事实的,它更擅长于告诉我们,世界是怎样,而不是世界应是怎样和将会怎样。在不确定性面前,大数据是无力的,所以究其根本,大数据不是用来预测的。大数据能带给我们的,是知识,是获知,而不是判断,更不是武断,而尊重不确定性,才是正确使用知识的一部分。

时间: 2024-09-20 13:33:40

大数据预测世界杯不准的相关文章

若大数据预测世界杯靠谱谁会乐翻天?

最近,有报道称,一些公司利用大数据成功地预测了世界杯8分之1决赛的结果.不少人提出疑惑:若大数据预测世界杯靠谱,那谁会乐翻天? 一.有公司声称声场场预测准确 近日,对于利用大数据预测世界杯的报道屡见不鲜. 有公司声称他们利用大数据预测世界杯的结果准确率貌似很高. 例如谷歌.其产品营销经理本杰明·贝托谢姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前为止,谷歌的云计算平台已成功预测了世界杯16强比赛每场比赛的胜利者.注意:是16强(即8分之1决赛)比赛胜利者. 谷歌称,

大数据预测世界杯 八种方法谁靠谱

西班牙.英格兰连续两场失利,小组赛即遭淘汰,不仅让一些球迷伤心欲绝,让彩民损失不小,还顺便连累了众多预测世界杯的高人欲哭无泪. 这届世界杯在大数据火爆之后,不管是民间还是官方,都把大数据的概念运用到了世界杯预测上,但这些预测真的准吗?下面选取国内外主要的八种世界杯预测,对他们的预测方法进行简要的分析,看看谁的更准一些. 百度分析最传统 据验证,今年全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,被戏称"神预测".因此,这次百度收集网上的综合数据,然后进行整理.分析,最终通

首次大数据预测世界杯 百度超准预测并非偶然

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 世界杯是个大舞台,除了球员在赛场上挥洒汗水,赛场外的竞技抗衡也尤为精彩.本届世界杯期间,大数据崭露头角,微软.谷歌.百度.高盛等全球科技公司纷纷登台角逐.遗憾的是,中国互联网公司只有百度一家参与了这历史上首次世界杯预测的场外赛,稍显孤单. 不过,向来用数据说话是来不得半点虚假的,也是最公平的角逐.所以,我们才看到,中国大数据的代表队百度尽管形

投行凭“大数据”预测世界杯

"巴西国家队在2014年世界杯上将顺利出线,在1/8决赛中以3比1淘汰荷兰,随后3比1胜乌拉圭晋级半决赛,2比1取胜德国后巴西将与南美洲另一劲旅阿根廷国家队相会里约热内卢,最终3比1战胜梅西率领的球队而赢得世界杯."-- 近日,在长达60页的报告中,美国知名投资银行高盛这样预测世界杯.在巴西世界杯即将开哨的档口,这段话恐怕会激起无数球迷的欢呼或怒骂. 而离开了股票交易厅和资本运作"黑箱",投行在绿茵场上说的话"靠谱"吗? 预测胜负和"最

各位球迷 大数据预测世界杯靠谱吗?

目前采用http://www.aliyun.com/zixun/aggregation/13568.html">大数据技术预测世界杯的,既有百度这样的互联网公司,也有德银这样的知名投行. 一.预测确实使用了大量数据 通过采访百度的相关人士,我们发现百度预测世界杯的主要数据来源包括:百度搜索数据,球队基础数据,球员基础数据,赔率市场数据.百度大数据通过分析过去5年987支球队的3.7万场比赛数据,共涉及29610名球员,112,285,543条相关数据,构建了足球赛事预测模型. 为了验证模型

百度大数据创造世界杯比赛预测不败神话

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 文/科技有一说一 每当世界杯来临的年份,全世界激情指数就会直线上升,而智力指数就会直线下降.人越激动智力水平越低,这是有科学依据可循的,但是世界杯有种东西就没有科学依据可循,那就是世界杯魔咒. 最著名的世界杯魔咒莫过于贝利捧谁谁就"不得好死"!这条魔咒就是说,贝利公开声明看好谁,谁的成绩就不好.猜对谁输谁赢并不难,难得是,

忘了《黄金时代》,理性看待大数据预测

在世界杯预测时准确率超高的百度大数据预测在稳步推进时遇到了一个小障碍,尚处于内测的票房预测对<黄金时代>的预测与实际结果出现了偏差,被媒体长篇报道引发业内高度关注,笔者一直在观察大数据预测业务,对于百度预测<黄金时代>失利一事有自己的一些观点,不吐不快. 一.看待大数据预测失准要冷静客观 近年来,"大数据"一词频繁出现在各类媒体上,与大 数据相关的各种产业.产品也在蓬勃发展.今年2月,中关村管委会在<加快培育大数据产业集群推动产业转型升级的意见>发布

大数据预测:4个特征,11个典型行业

世界杯期间各家科技巨头利用大数据预测比赛结果,再现"章鱼保罗"雄风.世界杯结束了但大数据预测还会继续.从夜观天象到气象预报,从童话里的水晶球到今日的科技预言家,从地震云的传说再到科学家猛攻的地震预测,人类一直希望能够更早突破局限看穿未来.随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变. 预测是大数据核心价值 人们在谈论大数据的采集.存储和挖掘时,最常见的应用案例便是"预测股市""预测流感""预测消费者行

刘东明:百度大数据预测将颠覆传统商业和规则

中介交易 SEO诊断 淘宝客 云主机 技术大厅 导语:时下,从信息化到互联网化营销,成为传统企业营销最关注的话题,如果传统行业不能与互联网经济挂钩,就会与时代脱钩.而一个更值得关注的趋势是,过去大企业垄断行业资源,对市场有绝对的支配权.而如今,通过互联网.百度大数据预测等工具,中小企业能够提前获取信息,寻找不同信息间的关系和匹配度,从而及时洞察市场,精准的找到用户所求.这种颠覆传统的营销模式,也让中小企业迎来更大的发展空间. 在最近举办的"2014年互联网金融论坛"第二届中国中小企业投