微软预测奥斯卡为何如此准确?

奥斯卡是一项国际影片的颁奖盛典,也是大众最拭目以待的意见大事,当获奖名单甫一公布,兴奋的不仅仅除了影迷们,微软亚洲研究院应该也在兴奋当中。他们的官微称,微软研究院的“David Rothschild带领的团队通过对入围影片相关数据分析预测出今年各项奥斯卡大奖将花落谁家”,“除最佳导演外,其他各项奥斯卡大奖预测全部命中。”

其实并没有微软所说的那么神,实际情况是,David团队对所有24个奖项都做出了预测,其中19项预测正确,有5项错误,出错的除去最佳导演外,还包括最佳男配角、最佳化妆、最佳纪录短片和最佳艺术指导这几个奖项。

当然,即使这样,也不得不说他们做出的预测结果准确率已经非常高。David在微软研究院的博客中介绍了他们是如何通过对数据进行挖掘,建立预测模型来得出这一结果的:

“预测奥斯卡的方法同我预测其他东西的方法一致,包括政治。”David说,”我关注最有效的数据,然后创建一个不受任何特别年份结果干扰的统计模型。所有模型都根据历史数据进行检测和校正,确保模型能够正确预测样本结果。这些模型能够预测未来,而不只是验证过去发生的结果。”

“我关注四种不同类型的数据:投票数据、预测市场数据和基础数据和用户生成数据( user generated data )。

对于大选来说,基础数据,比如说过去的选举结果、现任者和经济指数等,更为重要。在整个预测周期中,会通过基础数据建立一个基准,当预测市场数据和投票数据所含信息越来越丰富之后,再把重点转向后者。预测2012年总统大选时,我运用了少量的用户生成数据,但是Xbox LIVE的数据对于提供大事件的实时分析非常关键。

但是奥斯卡的预测缺少投票数据,而且票房回报和电影评分等数据在统计学上并不是那么地有效。所以我更多地把注意力放在预测市场数据上,再加入部分用户生成数据,这可以帮助我了解电影内部和不同类别之间关联度,比如《林肯》会赢得多少个项奖项。

只要我关注一个新的领域,我就会去思考对于一项有意义的预测来说,有哪些关键的事情:

首先,我会确定什么是最相关的预测。比如说,奥斯卡我会关注24个类别可能的赢家,也会思考某部电影的获奖总数;

其次,所有的预测会进行实时更新。从研究的角度看,了解从做出预测和最终结果之间所发生事件的价值很关键。对于奥斯卡来说,这些事件就是其他奖项(如金球奖等)的颁奖结果;

最后,我会利用这个领域的历史数据来建立这个模型,然后不断更新以确保模型的准确度。我想强调的是,我们做的每件事都是针对独立领域的,来保证它能扩展到很多问题上。如果这项研究能推演出更有效率的预测模型,能应用到更多领域来解决更多问题,那它对于微软、对于学术界和这个世界来说都将有很大的价值。”

David和他的团队开设了PredictWise网站,专门刊登对于各项重大事件的预测结果。他称,奥斯卡预测的难度非常大,因为它涉及到24个类别(通常只有6个),而且随着奥斯卡之前其他奖项的不断颁出,整个结果会不断地产生变化。

为了解决这个问题,David加大了动态数据在整个预测模型里的比重。

“实时预测是非常重要的。因为实时预测可以随时提供最新的预测结果,而动态数据的挖掘表明整个预测结果正在不断纳入新信息。此外,它可以提供一个更细的追踪记录,来展示什么时候/为什么发生了变化,是哪个部分影响了最后的结果。”

以最佳影片奖的动态数据为例,大热门电影《林肯》的胜率就在《逃离德黑兰》陆续获得多个奖项之后迅速滑坡——在奥斯卡提名刚公布的时候,《逃离德黑兰》仅有8%的可能性获奖,但是后期的奖项让它的获胜率迅速增长到了93%。

除了要考虑时间上的动态变化,还要注意数据之间的相互影响。David的模型指出,最佳影片奖和最佳改编剧本奖之间有着强烈的相关性,所以《林肯》和《逃离德黑兰》在这两个奖项里波动趋向基本一致,只是幅度略有差异。《林肯》最初有70%的可能性获得最佳改编剧本奖,但在它获得最佳影片奖的可能性一路走低后,《逃离德黑兰》的得奖率反超到了57%。

为了更好的实现动态数据的挖掘,David还和微软的Office部门一起合作,发布了一款名为“Oscars Ballot Predictor”的Excel App,可以实时更新预测情况。

不过,和David更多的是挖掘预测市场数据和基础数据不同,分析机构BranWatch选择的是利用社交数据建立自己的预测模型。它从各大社交网络中找出演员、导演和电影被提及的次数,通过计算所获得的积极评价数来预测他们获奖的几率。而Twitter占到了BrandWatch取样内容的约40%。

BrandWatch的做法并不新鲜,但是以往的分析数据有一点不同的是,它把专业人士的评论和普通大众的评论区分开来统计,而且只收集积极评价的数量。这里面就涉及到了两个变量,一是提及次数,还有一个就是背后的态度。BrandWatch认为,这样就确保可以过滤掉一定的无效数据,比如,大量Helen Hunt在红地毯上的穿着的评价,就不会作为主要数据纳入到统计中。

此外,因利用统计学成功预测去年美国总统大选的Nate Silver,也给出了他自己的预测结果和模型,我们就不再赘述,有兴趣的可以点击他在《纽约时报》的专栏。

【编辑推荐】

大数据挖掘云服务微软推出的云服务组合在竞争市场中“一骑绝尘”微软的24年数据中心之路SQL Server数据挖掘规则实现商品推荐1【责任编辑:箫韵 TEL:(010)68476606】

时间: 2024-11-05 18:05:13

微软预测奥斯卡为何如此准确?的相关文章

微软预测奥斯卡:金像奖24个,猜对21个

北京时间3月3日,第86届奥斯卡金像奖在洛杉矶揭晓.是不是很沮丧,此前在某些群体里夺奖呼声很高的.或许正是你喜欢的迪卡普里奥又落选影帝?其实,在奖项宣布前,微软纽约研究院的经济学家David Rothschild(大卫·罗斯柴尔德)的研究就显示,最佳男主角获胜概率最高的本来就是修·麦康纳.少数影迷趣味败,大数据赢. 现在,在美国预测总统大选.或者什么超级碗赛事结果时,很多人都会上PredictWise(Rothschild用以公布预测结果的官方网站)去看看大卫·罗斯柴尔德以及他收集到的大数据怎么

美ABC台出奇招效仿保罗邀负鼠海蒂预测奥斯卡

"对眼儿"负鼠海蒂聚焦奥斯卡,欲当"章鱼保罗第二"(资料图) 再过一周,第83届奥斯卡颁奖典礼将在美国揭晓.据海外媒体近日报道,美国A.B.C电视台从德国找来了"负鼠小妞"海蒂,打算让它预测本届奥斯卡的结果. 海蒂能否接任"章鱼哥"保罗的动物界"神算"名号,备受关注.哥伦比亚广播电视公司.BBC.路透社等各大媒体纷纷报道此事. 海蒂因其有一双大"对眼儿"而走红德国,随即这股"海

经济学家用大数据预测奥斯卡:准确率80%以上

虽然,大数据一直在被人诟病.但是i黑马发现,经济学家大卫·罗斯柴尔德居然用大数据成功预测了747.html">奥斯卡...准确率高达80%以上! 去年,微软纽约研究院的经济学家大卫·罗斯柴尔德(http://www.aliyun.com/zixun/aggregation/16482.html">David Rothschild)成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题. 今年罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个!继

另类数据预测奥斯卡影后

春节结束后就要开始一年一度的奥斯卡颁奖礼,这场盛典也是各大奢侈品集团及旗下品牌的争夺战.漫天的大数据预测获奖影片及获奖人的同时,英国时尚电商Lyst也通过往年的时尚数据来揭示奥斯卡影后的潜在获奖人. ◆ ◆ ◆ 获奖公式 此公式分析了80多套奥斯卡影后的时尚装扮   Lyst统计出影后们偏爱的时尚特征: J=珠宝:Chopard萧邦,Fred Leighton 弗莱德•雷德... H=发型:好莱坞复古式波浪卷发,高盘发... D=礼服样式:长礼裙,黑色,露肩,带有纺纱... D=设计师:Dior

XboX销量剧增33%微软预测财年收入将增30%

(编译/花落剑影)据海外媒体报道,微软今天宣布Xbox销售量增长了33%,在本财年的一季度收入达到12亿美元(约合78亿人民币).业内人士分析认为<光环:致远星>的发售对此作出了重要贡献. 微软娱乐和设备部(包括Xbox,Zune和Windows Phone7)在2010财年第一季度收入18亿美元(约合人民币117亿元),增长27%.其中,和去年同期的210万台相比,微软今年4到9月的Xbox销量达到了280万台,增长33%,在本财年的一季度收入达到12亿美元(约合78亿人民币).在网络发布的

人工智能预测莱昂纳多将拿下本届奥斯卡

文章讲的是人工智能预测莱昂纳多将拿下本届奥斯卡,奥斯卡奖就像扔骰子,但并不意味着完全不可预测.至少人工智能系统并不认可这一观点.人工智能公司Unanimous A.I.就刚刚对今年的6个大奖的归属进行了一番预测.那么谁会是今年奥斯卡奖的大赢家呢?人工智能系统预测,今年的最佳影片得主是<荒野猎人>;莱昂纳 多·迪卡普里奥(Leonardo DiCaprio)终将如愿以偿,获得最佳男主角;最佳导演奖则会由该片导演伊尼亚里图获得. 最佳女主角将归属于<房间>主演布丽·拉尔森(Brie L

为何大数据预测对于奥斯卡来说不靠谱?

对于奖赛结果的预测,似乎已经成为了大众参与各类奖赛的方式之一.不管是世界杯.超级碗,还是总统选举,人们很喜欢搞个预测来自娱自乐.预测形式很多,包括人肉.章鱼.乌龟.大数据.人工智能等等,不管是数据专家.赌徒或是粉丝都乐于参与其中. 但在众多预测当中,又数奥斯卡的预测最难,最难以言中,为何你永远预测不到奥斯卡的结果?#蒙对不算# 在奥斯卡颁奖几天前,微软研究院经济学家戴维·罗思柴尔德也在他和他的团队开设的"聪明预测(PredictWise)"网站上公布了大数据预测结果,预测了本届奥斯卡最

奥斯卡大奖花落谁家 专家利用大数据预测结果

第85届奥斯卡金像奖颁奖晚会将于美国当地时间2月24日举行,奥斯卡小金人最终将花落谁家?近日,由微软研究院的David Rothschild通过对奥斯卡入围影片相关数据分析,预测出本届奥斯卡各项大奖的最终归属. 大家可以在David Rothschild的博客上看到他的最新预测结果.作为预测努力的一部分,David Rothschild与微软团队合作开发了一款Excel应用--Oscars Ballot Predictor(奥斯卡投票预测器),该应用为所有24个类别的奥斯卡得奖奖项提供实时预测.

Topsy如何预测美国大选和奥斯卡结果

研究结论 Topsy提供基于Twiiter数据的搜索分析服务,销售人员.新闻工作者可以通过它了解商品或新闻事件的讨论热度: Topsy准确预测了iPhone 4S上市后的市场表现,同时还成功预测美国大选结果和奥斯卡颁奖结果.它在商业分析.市场销售.新闻等领域拥有很高价值: 苹果以2亿多美元的价格收购Topsy,未来将集中发展互联网搜索业务,借此挑战谷歌. 序 · 这家公司准确预测了iPhone 4S的上市表现 2011年10月4日,万众期待的iPhone 5并未到来,苹果推出的只是小幅升级版的i