大数据:预测本届世界杯赛事结果

  从今天开始,又一届世界杯赛事正式拉开帷幕,全世界的球迷与非球迷也将共同享受这段激情燃烧、热血澎湃的美好时光。清爽的啤酒已斟满、闪亮的屏幕已就绪,每个人胸怀对国家的热爱以及也许有些不切实际的期盼关注着绿茵场上的竞逐。目前关于本届世界杯的各项统计数据已经火热出炉;巴西预计将迎来全球各地共计370万名观众,由此带来的经济效应高达30.">3亿美元;专门销售球星卡等周边产品的帕尼尼公司预计单在巴西本土,由贴纸带来的营收就将高达8910万英镑;而在英国,达美乐披萨估计世界杯期间其销售总额也将达到8400万英镑。

  不过关于某个重要话题,相关统计结果与数字似乎较为稀缺,这就是——谁能成为本届世界杯的最后赢家。我们可以估算出有多少球迷会亲身赶赴巴西,多少英国人会在电视机前大嚼美好的披萨,又有多少狂热粉丝收集球星卡;但我们能否利用数据来预测谁会最终夺冠?为了避免有失偏颇,我们将一边了解怀疑论者的观点、一边感受高盛集团等支持者对于数据驱动模型能够成功预测世界杯冠军归属的坚定决心。

  怀疑论者:不,这不可能

  左侧球员为被换上场的弗拉米尼

  简而言之,足球是一项充满挑战的运动,我们很难利用分析手段准确预测其结果。正如《经济学家》去年在报道中所言,要在足球领域应用“魔球理论”绝非易事。相对于棒球中那些更易衡量的离散事件,足球运动场上的二十二位参与者需要不断移动并以无穷无尽的方式组合彼此作用。足球天然具有动态属性,这就让判断哪些因素需要考量并不断获取考量结果变得极具挑战。

  尽管难度极高,但这一切并非不可能;我们最近曾报道过同样充满动态要素的篮球运动,目前摄像系统已经能够破解复杂的数据、告知参赛队伍的教练员篮球以及球员在场上的具体位置——其精确程度甚至达到每个赛季每场比赛中的每一秒钟。类似的分析方式在足球领域同样行得通;ProZone以及Opta等企业已经开始追踪运动场上的一系列指标——包括比赛中运动员的位置、传球的方式以及进球机会等等。一般来说,每场比赛产生的数据事件约有2000个。

  不过这些数据的相对价值仍然有待观察。球队管理者在依靠原始数据进行球员选择时,既有成功的案例、也遇到过失败的状况。首先来看成功案例:阿森纳队主教练温格注意到了弗拉米尼在比赛中出色的全场跑动距离以及优秀的临场表现,并最终决定用他取代维埃拉。不过失败的状况同样存在:弗格森通过数据认定斯坦姆目前的抢断次数已经大不如前,并决意将其淘汰出队。然而后期数据显示,斯坦姆在意大利队用卓越表现证明了自己的价值。

  问题的核心在于,尽管数据能够说明哪些球员在赛场上奔跑速度最快或者跑动距离最长、谁的抢断次数最多,但一位优秀的足球运动员并不仅仅是几项数值的简单累加。数据所反映的是过去,而并不足以证明球员未来的临场表现仍将延续目前的综合指标结论。

  科学家:是的,我们可以

  在对世界杯赛事结果进行预测时,高盛集团明智地回避了球员特定属性这一棘手的分析角度,转而采取更具通行性的办法。他们观察各支国家队在历届世界杯上的表现及其目前的Elo(即竞赛水平数值)排名情况,并借此制定出一套预测模型。他们对自己的方法作出了如下解释:

  每场赛事的结果预测都基于一套完整的回归分析方案,并采用自1960年以来全部正式国际比赛——也就是说不包括友谊赛——结果作为参考信息。这为我们带来约14000条预测指标,用以评估我们所使用的模型计算系数。在回归分析当中,因变量为每周比赛参赛双方的进球数量。根据文献对足球比赛进行模型化归纳后,我们假定特定球队在匹配特定对手时的进球数量遵循以下泊松分布(一种常见的离散概率分布)。

  他们的这套模型发现巴西队拥有惊人的对阵胜出率——48.5%。他们预计巴西将在决赛中以3比1击败阿根廷队,而阿根廷方面的胜率仅为14.1%。巴西队之所以能够获得如此高的评价,其因素可谓多种多样,其中包括出色的Elo系统排名、在世界杯赛场上相对于其它赛事更为强劲的实际表现以及今年的东道主优势——自1930年以来,全部世界杯比赛中主办国队伍拿下大力神杯的比例高达30%。根据这套模型的推算,今年巴西在自家门前夺取冠军的机率高达65%;相比之下欧洲各劲旅的日子就不太好过了,历史记录显示他们从未在美洲诸国主办的世界杯上获得过最终胜利。

  不过这套模型完全依赖于过去的参考指标,显然无法反映未来可能出现的不确定因素。高盛集团曾经利用类似的分析模型以此前的表现为基础对英国在2012年伦敦奥运会上的表现作出过预测。他们预计英国将拿下30枚金牌与总计65枚奖牌,而事实上英国最终夺得29枚金牌与总计65枚奖牌。

  史蒂芬?霍金则采取另一种完全不同的分析方式得出了迥异于高盛的预测结论,他在考量了大量数据后认为英国今年最具夺冠潜力。在高盛的计算模型中,英国今年的表现将令人失望、甚至无法从小组赛中出线,看来英国队最好是采信霍金的结论、以免士气低落。在进一步建议中,霍金认为英国采取4-3-3阵形最能发挥自身实力,而比赛时间最好选在格林威治标准时间下午三点左右,并尽可能选派光头或者金发球员上场(因为这类球员的得分机率更高)。除此之外,他还建议罚任意球或者点球的运动员采取三步以上的助跑距离并用侧脚踢球(这种方式能让得分机率提高10%),并尽量让皮球的落点在球门的左上或者右上角(这一区域的进球成功率高达84%)。不过霍金也承认,这已经是数据在足球运动中所能给出的全部指导意见了。毕竟在实际罚球当中,英格兰队的表现一直相当糟糕。

  说了这么多,大数据到底能否帮助我们预测世界杯的比赛结果?获得答案的惟一办法就是持续关注未来的一系列赛事,看看巴西能不能在占尽天时地利的情况下成功登顶。当然了,各位也不妨留心一下英格兰队能否在其向来令人捉鸡的点球大战中有所突破。

时间: 2024-09-20 16:35:46

大数据:预测本届世界杯赛事结果的相关文章

大数据预测的世界杯靠谱吗?

问: 今年大数据取代了章鱼保罗,成为预测世界杯战局的热门手段.不过这种预测靠谱吗?大数据真的能预测世界杯? 答: 目前采用http://www.aliyun.com/zixun/aggregation/13568.html">大数据技术预测世界杯的,既有百度这样的互联网公司,也有德银这样的知名投行. 一.预测确实使用了大量数据 通过采访百度的相关人士,我们发现百度预测世界杯的主要数据来源包括:百度搜索数据,球队基础数据,球员基础数据,赔率市场数据.百度大数据通过分析过去5年987支球队的3

微软大数据预测2014世界杯:巴西夺冠

大数据时代的到来让求神问卜变成了科学,今年早些时候,http://www.aliyun.com/zixun/aggregation/13180.html">微软研究院David Rothschid与Office团队共同开发了一款Excel软件,用大数据来预测2013年奥斯卡奖,结果猜中了24个奖项中的19个. 今天,微软公布了Rothschild最新的一则访谈,利用同样的数据收集和分析方法,他公开了3721.html">2014年世界杯的预测结果:巴西将夺冠,根据数据预测,

大数据预测2014世界杯:巴西夺冠

微软公布了Rothschild最新的一则访谈,利用同样的http://www.aliyun.com/zixun/aggregation/12240.html">数据收集和分析方法,他公开了3721.html">2014年世界杯的预测结果:巴西将夺冠,根据数据预测,巴西队的夺冠率达到22.5%,远远高于其他对手.随后依次为阿根廷.德国.西班牙.比利时. Rothschild介绍称:"我们使用大量的公开数据--博彩市场.民意调查.社交媒体以及其它在线数据,更加幸运的是

大数据预测世界杯 八种方法谁靠谱

西班牙.英格兰连续两场失利,小组赛即遭淘汰,不仅让一些球迷伤心欲绝,让彩民损失不小,还顺便连累了众多预测世界杯的高人欲哭无泪. 这届世界杯在大数据火爆之后,不管是民间还是官方,都把大数据的概念运用到了世界杯预测上,但这些预测真的准吗?下面选取国内外主要的八种世界杯预测,对他们的预测方法进行简要的分析,看看谁的更准一些. 百度分析最传统 据验证,今年全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,被戏称"神预测".因此,这次百度收集网上的综合数据,然后进行整理.分析,最终通

首次大数据预测世界杯 百度超准预测并非偶然

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 世界杯是个大舞台,除了球员在赛场上挥洒汗水,赛场外的竞技抗衡也尤为精彩.本届世界杯期间,大数据崭露头角,微软.谷歌.百度.高盛等全球科技公司纷纷登台角逐.遗憾的是,中国互联网公司只有百度一家参与了这历史上首次世界杯预测的场外赛,稍显孤单. 不过,向来用数据说话是来不得半点虚假的,也是最公平的角逐.所以,我们才看到,中国大数据的代表队百度尽管形

若大数据预测世界杯靠谱谁会乐翻天?

最近,有报道称,一些公司利用大数据成功地预测了世界杯8分之1决赛的结果.不少人提出疑惑:若大数据预测世界杯靠谱,那谁会乐翻天? 一.有公司声称声场场预测准确 近日,对于利用大数据预测世界杯的报道屡见不鲜. 有公司声称他们利用大数据预测世界杯的结果准确率貌似很高. 例如谷歌.其产品营销经理本杰明·贝托谢姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前为止,谷歌的云计算平台已成功预测了世界杯16强比赛每场比赛的胜利者.注意:是16强(即8分之1决赛)比赛胜利者. 谷歌称,

为何大数据预测对于奥斯卡来说不靠谱?

对于奖赛结果的预测,似乎已经成为了大众参与各类奖赛的方式之一.不管是世界杯.超级碗,还是总统选举,人们很喜欢搞个预测来自娱自乐.预测形式很多,包括人肉.章鱼.乌龟.大数据.人工智能等等,不管是数据专家.赌徒或是粉丝都乐于参与其中. 但在众多预测当中,又数奥斯卡的预测最难,最难以言中,为何你永远预测不到奥斯卡的结果?#蒙对不算# 在奥斯卡颁奖几天前,微软研究院经济学家戴维·罗思柴尔德也在他和他的团队开设的"聪明预测(PredictWise)"网站上公布了大数据预测结果,预测了本届奥斯卡最

大数据预测:4个特征,11个典型行业

世界杯期间各家科技巨头利用大数据预测比赛结果,再现"章鱼保罗"雄风.世界杯结束了但大数据预测还会继续.从夜观天象到气象预报,从童话里的水晶球到今日的科技预言家,从地震云的传说再到科学家猛攻的地震预测,人类一直希望能够更早突破局限看穿未来.随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变. 预测是大数据核心价值 人们在谈论大数据的采集.存储和挖掘时,最常见的应用案例便是"预测股市""预测流感""预测消费者行

忘了《黄金时代》,理性看待大数据预测

在世界杯预测时准确率超高的百度大数据预测在稳步推进时遇到了一个小障碍,尚处于内测的票房预测对<黄金时代>的预测与实际结果出现了偏差,被媒体长篇报道引发业内高度关注,笔者一直在观察大数据预测业务,对于百度预测<黄金时代>失利一事有自己的一些观点,不吐不快. 一.看待大数据预测失准要冷静客观 近年来,"大数据"一词频繁出现在各类媒体上,与大 数据相关的各种产业.产品也在蓬勃发展.今年2月,中关村管委会在<加快培育大数据产业集群推动产业转型升级的意见>发布