美国总统大选民调又估错,传统民调失效也不等同大数据准确

美国总统大选已尘埃落定,一天之前所有报纸民调都说希拉里笃定当选,但结果却如大家所知。有趣的是,在大选前预言说中的却是人工智能,由印度开发的 MogIA AI 就成功预言特朗普当选。这证明了传统民调已经完全失效了,但大数据和人工智能是否又一定准确?

人人都想问:为何公投结果和民调预测完全不同?
其实早前的英国 6 月脱欧公投已经有这样的情况了。当时铺天盖地都是留欧的声势最强,传统机构民调、市场预测,就连博彩网站也是留欧的赔率较低,而在公布结果前由调查机构 YouGov 做的票站民调也是留欧占多。结果因为出乎预期,于是股市跌、汇价跌,人人都想问为何公投结果和民调预测完全不同。

当时很多人分析原因,有人认为脱欧派被标签为“年长、愚蠢、低学历”,没人愿意对民调承认自己的真实想法,也有人认为脱欧派大多不是网友,因此难以被发现,亦有人指脱欧派都是穷人居多,就算下注脱欧也改变不了赔率。

但不管原因为何,公投结果改变不了,英国政府动荡,卡麦隆下台,梅伊政府亦正研究如何启动脱欧程序。对梅伊政府而言,预测失准带来的损失非常大。正所谓“千金难买早知道”,成功预测未来结果就能及早准确,决定做或不做什么事。如果卡麦隆准确预先知道公投结果,又岂会愿意启动公投?

传统民调哪儿出错了?追不上时代!
爆冷成功脱欧,就有人预测会不会在美国大选也出现戏剧性结果,当时人人都是说“个别事件”,但结果是再一次爆冷,这一刻实在不能不问,传统民调哪儿出错了?事实上民调从来不儿戏,是社会统计学的专业范畴,透过公正客观的方式收集大量样本,再按比例投射到整个群体,是相对客观、精确地反映社会舆论的方式。

传统民调会用随机方式以电话访问民众,在访问前排除一些因素后再向被访者发问一组问题。不过今时今日愈来愈少人用室内电话,也愈来愈少人愿意花时间受访,回应率愈来愈低之余,加上愈来愈多人不乐意公开真实的想法(即使是匿名民调),自然更难像以前般控制样本的纯朴性。

2012 年奥巴马竞选连任时,民调就估计是对手罗姆尼胜出,但结果是奥巴马遥遥领先,近年全球大选都同样有民调失准的情况。先撇开别有用心想造假,又或缺乏资源“为做而做”的民调不论,现实是民调手法落后已追不上现在实际社会发展。因此不少人都提倡民调中心应发展其他新技术,以让民调能更符合现实发展,并提升准确性。

小众观点倾向沉默,但原来票数足以改变结果
最多人讨论的当然是社交媒体的大数据调查。在商业世界早已应用社交媒体大数据来协助掌握消费者的口味,例如香港的电视台就已经利用上述技术来了解新剧集、新节目的网上口碑,甚至隔日就能在黄金时间的娱乐新闻节目回应;而消费商品更会监视消费者对新商品的即时反应,甚至用于调整商品的市场对策。

不过,脱欧公投时何尝不是网上一片“留欧”之声?社交媒体大数据显然仍有一些难以跨越的界限。传播理论有所谓“沉默螺旋”:愈多人同意的内容,愈是比较放心公开说,反而抱持愈是小众观点的人就愈倾向沉默。由于社交媒体是公开的,自然愈有这种倾向,于是支持脱欧、支持特朗普的声音就隐藏了起来。

而且舆情能否跟选票真实挂勾是没有因果关系的,在网上大骂政府的人不见得是选友,更不见得会在大选日投票,如果直接把网上舆情和选情预测挂上等号,几乎一定出事。就以 2010 年香港的“五区补选”为例,当时网上就讨论得相当激烈,但实际其实只是一少部分人热闹而己,投票率仅为 17.1%,是回归以来最低。

另一个会被谈论的就是 Google Trend。比起众多杂乱的社交平台,几乎在中国以外的全球市场统一天下的 Google 是单一平台,拥有大量的搜索数据,做统计分析其实相对客观和误差较少。而前面提过的人工智能 MogIA AI 也同样是收集 Google、Facebook、Twitter 和 YouTube 的大量数据来做分析。

Google Trend 做的是呈现网友的搜索趋势,例如特朗普会和哪些字一齐被搜索、在什么时候开始多人搜索特朗普、哪些地区的网友搜索最多特朗普的信息,这些都能在 Google Trend 上得到答案。搜索趋势是很客观的,它能呈现一些社会议题被讨论的多寡,配合其他数据交叉分析能得到有价值的结果,而且也没有“沉默螺旋”的问题。

但问题是,谈论得多就是否等如能够胜出大选?中间有没有逻辑关系?其实这个谁也没有答案。2014 年世界杯比赛,当时中国百度就推出了类似的趋势网站,并利用中国网友的搜索趋势来预测赛果。但问题就来了,如果比赛实际影响因素是球员表现、天气和场地状态,那搜索趋势又代表什么?

不懂“读心”,网友意志未必真实呈现
不过大选跟球赛的最大不同,当然是大选是呈现选民的集体意志,网友的搜索趋势当然会对投票抉择有影响,而正面信息和反面信息的搜索趋势绝对值得参考,但要说 Google Trend 或其他基于这些数据来分析的选情预测的准确性够高,目前仍需要时间去验证。

事实上,就连每天都写科技消息的笔者,也对人工智能预言特朗普当选的结果有所保留。毕竟这其实是一个“赌大小”的游戏,选出独立候选人的机会比围骰还要低,如果不是特朗普就是希拉里的话,猜中的机率也不过是一半一半,实际就跟向八爪鱼保罗请教世界杯赛果一样。

据 Business Insider 的报导,印度公司 Genic.ai 所开发的 MogIA,自 2004 年就开始就预测美国总统大选结果,而其结果就 3 次皆中,如果再计这次特朗普的话就更是四届全中。为了进一步排除人为的偏见和误差,MogIA 会利用机器学习来建立演算法,经过 12 年的学习就更加完善。

但即使如此,人工智能也未能解决一些核心问题,例如特朗普得票最多的就是乡村地区,而最热爱科技的却是城市人。而且就连 Genic.ai 也承认,MogIA 对人类的“反讽”语言依然未尽了解,未必能够辨别出否定的言论,而热烈的互动率也绝不代表受欢迎。

传统学术非无能为力,往绩其实更佳
摇摆州份之所以难预测正在于人心的反覆,沉默选民的意向能否被正确收集和分析,目前仍要看他们有否积极在网络上表现,人工智能并非真的能“读心”,要证明大数据和人工智能可取代传统民调,还是需要时间做更多实证,不过随着社交媒体的使用者愈多,准确性能提高应该是必然的。

不过传统学术是否真的无能为力?似乎也不是。美国纽约州立大学石溪分校政治学教授 Helmut Norpoth,分析了自 1912 年起的历届大选并归纳出两个预测模型:初选模型和摇摆效益模型,而且就凭它成功预测了由 2000 年起的五届总统大选,而他更预测特朗普的胜率达 97%。

而美国政治史学家 Allan Lichtman 也透过归纳历届大选而在 1981 年提出“入主白宫的 13 个关键”,并成功预测其后三十多年的八届总统大选。这 13 道是非题其实是反映施政成效,得分愈低就会选输,而Allan Lichtman 就因此也同样断言特朗普将会胜出。

因此预测选情还是需要结合传统和新科技,传统的预测模型仍然经得起考验,配合大数据和人工智能将有更多的交叉求证的工具做预测,未来将会是多重工具做分析的时代。

本文转自d1net(转载)

时间: 2024-08-01 19:09:56

美国总统大选民调又估错,传统民调失效也不等同大数据准确的相关文章

这个中国血统的黑客掌握了世界上最多的秘密,还改变了美国总统大选

本文讲的是这个中国血统的黑客掌握了世界上最多的秘密,还改变了美国总统大选, 全球气候变暖,曾经是全人类的共识. 研究者认为,人类自工业革命开始,肆无忌惮地排放二氧化碳导致了全球性的气温变化. 人类将会为自己的罪行付出惨痛的代价. 然而,这个理论很荒谬,20世纪中叶的人们还担心着全球气候变冷,冰川期让农业系统崩溃. 也有多位科学家明确反对全球变暖理论,认为这不过是地球几十亿年来再正常不过的波动. 2009年11月,仿佛是全球变暖理论支持者和背后势力的末日. 黑客们窃取了多位顶级气候学家的电子邮件,

美国总统大选,社交平台如何各显神通?

编者按:今天是美国大选的日子,目前希拉里和特朗普选票为209:256,特朗普暂时领先,大选的时候除了繁忙的选民和凑热闹的看客以外,更离不开社交媒体的参与.比起以往,今年国外三大主流社交APP(Facebook.Twitter.Snapchat)都在更加卖力地宣扬自己家的平台才是新闻发源及分享传播的主要阵地. 在漫长的选举季,越来越多的社交媒体最终演变成了八卦生成器,而目的则是对近期标题的分享.讨论以及埋怨. 正如当地时间8日进行的美国总统大选,民众更愿意在智能手机上获得大选结果,Facebook

搜索引擎如何影响08年美国总统大选?

现在,我们又一次处在了大选年的悬崖边.2008年美国总统大选最为http://www.aliyun.com/zixun/aggregation/7974.html">有趣的是其于2007年早些时候就开始了,而真正的大选活动,即民意测验和投票将在2008年晚些时候进行,而侯选人之间的辩论.拉票.布局以及宣传攻势很早以前的开始了. 在过去的10多的里,互联网日益成为一个政治的世界.数年前,Howard Dean总统大选失利,证明分散的草根阶层正在成为一种强大的力量,而他们仅通过大量的网站和技术

庞大触角加精准定向,Facebook如何主导2016美国总统大选

导语:美国<华尔街日报>网络版近日撰文称,社交网络的庞大触角和精准定向工具为政治竞选带来了福音,甚至可能对美国总统大选结果产生影响. 以下为文章全文: 花旗集团预计,Facebook今年吸引的政治广告开支有望超过谷歌,从而扭转历史趋势.由于搜索广告至今仍然具备极大的影响力,可以帮助政治人物吸引捐赠者和志愿者,因此这一成就不可谓不大. 这不仅反映了Facebook的广阔触角,也表明该公司为广告主提供了极其精准的广告投放工具.对于那些意在吸引更多支持者参加投票或促使选民改变想法的广告而言,这种&q

人类才分对错,AI只看成败,MogIA如何预测美国总统大选?

美国总统选举结果揭晓,共和党总统候选人唐纳德·川普战胜民主党候选人.前国务卿希拉里·克林顿赢得总统选举,即将成为美国第四十五任总统. 在此之前,一套由迈阿密创新人士Sanjiv Rai开发的.名为MogIA的人工智能系统成功预测出川普将成为美国总统.作为一套初次亮相于2004年的系统,也曾经对以往三次总统选举进行过成功预测. 根据Rai的介绍,其算法已经从以往几轮选举当中"学习经验",因此预测结果更为准确.MogIA一名来自<森林王子>中的莫格利(Mowgli).正如原著中

美国总统大选网上博客先开战

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 北京时间4月23日消息,据国外媒体报道,2008年美国总统大选网上辩论会发起人将于本周一宣布,政治博客网站Huffington Post.雅虎和网络政论杂志<Slate>将共同主持网上辩论会,时间将在今年9月劳工节之后,届时共和党和民主党总统候选人将 参加这些网上辩论会. 辩论会发起人还表示,在举行网上辩论会期间,选民们可随时总统

黑客入侵到底能否影响美国总统大选结果?

近日,奥巴马政府公开指责俄罗斯政府,称其是今年总统竞选一系列黑客事件的主使. 由于确认网络攻击者身份的难度,以及外交方面的影响(哪怕是确认了),美国政府很少公开指责其它国家实施间谍活动和网络攻击.近两年唯一的一次就是2014年12月份,指责朝鲜是入侵索尼影业的幕后指使.但本月7日,美国国土安全部(DHS)和情报体系(USIC)明确指认俄罗斯政府是这些黑客活动的幕后黑手. 据安全牛报道,过去的18个月来,网络攻击者入侵了民主党国家委员会(DNC)的网络和计算机,放出电子邮件和文档资料,攻击竞选系统

女版“斯诺登”被捕,涉嫌泄露黑客攻击美国总统大选机密

据外媒消息,继斯诺登后,近日,又一名美国国家安全局承包商的雇员涉嫌窃取机密文件.这名雇员是25岁的雷埃利蒂·利·温纳,自今年2月起受雇于"汇集"国际集团,现已被美国司法部起诉.指控称,今年5月,该雇员曾将窃取的机密文件邮寄给一家新闻媒体.但是,官方并未透露,是哪家新闻媒体. 不过,根据相关报道,"截击"(The Intercept)网站公开了一份据称发布于5月5日的美国国安局报告的部分细节,事关黑客攻击美国总统大选的一些信息.有人推测,这就是雷埃利蒂·利·温纳涉嫌泄

美国总统大选靠边站 网民更关注杰克逊病逝

图1:各大社交网站共享杰克逊病逝消息对比图2:谷歌25日搜索走势 北京时间6月27日早间消息,据国外媒体报道,摇滚巨星迈克尔·杰克逊(Michael Jackson)病逝的消息引发了互联网流量大爆发,网民对该消息的关注度甚至胜过美国总统大选. 昨日有报道称,杰克逊病逝的消息占到了微型博客Twitter流量的30%.如今看来,这一预计可能有些保守,该消息同样让Facebook.谷歌和雅虎的访问流量飙升. 有报道称,共享该消息最多的并不是Twitter,而是Facebook.其实这并不足为奇,毕竟F