1 前言
2014年巴西世界杯让球迷度过了一个充满激情、泪水、无奈的历程,体育竞技比赛其实就是因为充满了太多的未知性而让球迷更加兴奋和期待,足球的是圆的,在足球场上能发生一切奇迹,当然,黑哨和假球不在正常范围之内。
然而本届巴西世界杯上除了西班牙、意大利这样传统强队的提前出局外各家IT巨头运用大数据进行世界杯的比赛预测也成为一个亮点。同时我们也发现在现代的体育竞技中其实大数据的运用已经比较普遍,大数据的分析对于球队或者教练员来说是很重要的事情,通过这样的数据能更好的了解队员的情况和未来的发展趋势。
其实在一场比赛中的胜负包含很多因素在内,是通过数据计算更加准确还是直觉更靠谱?想必很多人都相信数据计算,不过对于体育迷来说,未知的结果才是充满激情的源泉和动力,当一切都在数据下显出真身的时候您还会有激情吗?不过本届世界杯在我们《说文解字》中成功预测世界杯的冠军得主,以后相信贝利要多学习中国文化了。
2 神奇的世界杯预测
今年的世界杯比赛结果让很多人大跌眼镜,相信也让一些球迷朋友损失了不少钱财,小组赛上届冠军西班牙的出局、葡萄牙的悲情、意大利、英格兰携手出局让我们大跌眼镜,完全不知道这些传统的世界强队是怎么踢的比赛。
球王贝利是有名的预测专家,上世纪90年代初,贝利钟情于前南斯拉夫队,90年世界杯他预测该队会进四强,结果前南斯拉夫1/4决赛不敌阿根廷。92年欧洲杯,他又看好前南斯拉夫捧杯,结果该队因为内战被禁赛,连比赛都没能去参加。因此贝利的预测变成了乌鸦嘴,今年本届世界杯上谨言慎行,但伴随内马尔的离去贝利又不小心说看好巴西,结果…………
而在我们中华大地上虽然国足只能在家看直播,但球迷依然热衷世界杯的比赛,其实一直有个不解的想法未得到的证实,那就是其他国家的球迷像中国球迷一样关注其他国家联赛吗?在不属于自己国家的足球狂欢季中彻夜看球吗?不过在观看比赛之余更是充分发挥了我们五千多年历史的文采,我们的网友充分发挥了《说文解字》的功夫,为四强排了座次,原来他们的命运全都隐藏在博大精深的中国文字中呢。
微博和微信流传的《说文解字》
德国的“德”字中间有一横,冠军非他们所属;阿根廷的“廷”字是两横,可能是老二的命了;荷兰的“兰”是三横,那就屈居为季军吧;巴西的“西”字如果去掉上面一部分,则分明就是“四”嘛。
微信中的歪猜
这还不算,在运用完说文解字的功夫完,我们的风水起名也成了网友笑侃世界杯的内容。中国人最讲究起名字:这次世界杯,意大离了、西班哑了、英格烂了、乌拉归了......1/4决赛:哥伦比哑了、法兰熄了、比利失了、哥斯达立家了!照这样的思路下去,接下去半决赛:巴熄了,荷烂了,决赛是德国和阿根廷,最后,阿根停了,冠军应该是德国!
3 大数据下世界杯
其实在本届世界杯开始之初就有消息称通过大数据对比赛进行分析,比如Google利用云平台大数据(Twitter信息,每场比赛的得分,处罚等信息)预测世界杯足球赛的每场比赛的结果。 利用实时体育比赛数据公司Opta的数据,Google使用了一套综合云数据分析进行数据提炼,BigQuery负责功能衍生,iPython和 Pandas进行建模,最后,Compute Engine负责数据处理。
各家预测结果
Google表示,利用这个方法,Google可以预测比赛的输赢。 目前为止,Google云平台已经预测16场比赛,取得了不错的成绩。 对于剩下的比赛,Google云平台的预测如下:
巴西vs哥伦比亚:巴西胜(胜率71%)
法国vs德国:法国胜(胜率69%)
荷兰vs哥斯达黎加:荷兰胜(胜率68%)
阿根廷vs比利时:阿根廷胜(胜率81%)
百度预测
百度则综合各球队比赛数据和彩票网站赔率数据。其中百度的分析模型共涉及近5年来19972名球员和1.12亿条相关数据,所参考的数据包括百度搜索数据、球队基础数据、球员基础数据、赔率市场数据等,所分析的球队不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。
SAP Match Insights足球解决方案
而且SAP也针对比赛有相关的准备,基于SAP HANA平台Match Insights足球解决方案也为德国国家队帮了忙,“Match Insight不仅能够实时追踪了所有场上球员的信息,每名选手和整体团队的移动数据、控球百分比等数据,还可以分析双方在比赛中的实时阵型变化、防守范围和防守空挡,使足球专家和球迷都能通过数据看懂比赛。”在本届世界杯上,德国队主教练勒夫在每场比赛之后能够在Match Insights中看到更详细的数据。
此外,我们还从SAS公司提供的一些数据可以看到在大数据下通过可视化的分析能了解到一些细节对于一场比赛胜负起到的作用,我们以传球举例说明。
小提示:较深的颜色=较高的相关性,反之相关性很低
果不其然,传球与胜利的关联性高达0.8694!有效的传球越多,越容易获得胜利,比参赛经验的关联度还略高一小点点。
通过以上举例我们不难发现本届世界杯就是笼罩在大数据的分析之下,通过这些分析让我们可以更好的了解球队和球员乃至比赛的走势分析。由此可见,在未来更多的体育赛事中将有更多基于大数据背景下的资料供我们去浏览和参考,大数据已经和体验深深结合。
虽然我们看到了这么多大数据对于世界杯的预测和应用,可惜我们并没有询问到一些公司在针对这些预测所投入的设备和在其他应用场景中可以到的一些结果,借用 SAS公司的回复:“设备是没法预估的,因为这跟设备的性能等各方面都有关系,没办法简单回答问题。SAS的高性能分析就是为这个应运而生的。以前要好几天时间,现在只要数秒或者几分钟就可以了,这要看数据量的大小和设备的性能。”
4 总结
世界杯终于在球迷的欢呼中落下了帷幕,四年后的俄罗斯我们再见,梅西、J罗、内马尔期待你们的再次绽放。对于IT巨头们来说在本次世界杯上对于大数据的运用也将彻底拉开大数据在体育竞技中的盖头,其实大数据在体育竞技中早有应用只不过那会儿还是比较小范围我们有理由相信未来用数据来分析的体育竞技会越来越多。
大数据虽好但是体育竞技毕竟有激情的运动和生硬的数字对比来说还是有激情的体育竞技是被人喜欢的,不论是数据下的比赛结果如何,激烈和充满想象的比赛才是观众喜欢的!