前段时间,美国大选吸引了来自全球的目光,最终特朗普赢得大选,成功入主白宫。然而鲜为人知的是,在现在的美国大选当中,大数据技术在其中扮演了非常重要的角色,很多候选人都根据大数据分析技术来制定自己的精选计划和精选策略。
根据美国媒体此前报道称,早在美国大选刚刚开始的时候,众多候选人的多方面数据就已经被统计和分析,并且在美国的多家媒体网站上公布出来。
这些数据当中,比较受关注的是候选人自己在推特上所发布的文章,尤其是对于候选人这些文章的文章质量以及文章的幸福感指数等等,都成为了大数据分析的关注焦点。在这一点上,特朗普的平均幸福指数比希拉里要略微高一些,具体数值是5.79比5.70。
很多专家表示,在大数据分析之后,上述的候选人推特文章幸福指数虽然并不能够对大选的最终结果起到直接决定意义,但是也能够在间接方面为特朗普的最终获胜起到了润滑和推动作用。
在美国大选当中,大数据技术来通过对海量的候选人数据收集和分析,分别给每一个候选人贴上了“标签”,正是这些标签决定了幸福指数等相关数据的分值高低。在希拉里与特朗普的“标签”对比中,通过对词语的颜色根据感情状态区分开来,越趋近于蓝色代表越快乐,越接近紫色则代表越悲伤,而这些词语的大小由加权平均tf-idf值决定。如此一来,根据不同候选人的大数据进行分析得出的一些结果,确实能够给大众选民们提供一些投票的建议。
在候选人的“标签”方面,希拉里所具备的词汇基本上以经验、才能、女性、世界、调查、谎言等为主;而特朗普的标签词汇则基本都是些前进、胜利、羞辱、攻击、危险等一类词汇。
在通过数据分析将数据进行收集和分析之后,针对不同候选人所得出的词汇,美国的一些大数据技术网站还会将这些词汇进行转移,并制作成参照分布的示意图,同时会把不同候选人的参照分布进行相似度对比。通过对比,希拉里的词汇转移图与参照分布比较相似,达到了5.76比5.77,负面词汇包括电子邮件调查及“监狱”,“犯罪”,“囚犯”,“丑闻”等。
“票据”是以负面形式呈现的词汇(被理解为支付票据),但是在希拉里这里则是指比尔·希拉里。正面词汇主要有“她”,“女性”,“感谢”,“健康”,而负面词汇“憎恨”,“悲伤”,“失败者”,“诈骗”,“种族主义”较少被提及。
而拥有最高幸福指数的特朗普,其正面词汇有伟大、爱、美国、更好等等。显而易见,这些词汇都与他的竞选口号等内容相关。他的负面词汇包括憎恨、种族主义、失败者、禁止等等,这也从另一方面反应了他的反对者对他所持的观点和看法。
数据团队起到关键作用
传言希拉里有一支堪比硅谷公司的大数据团队,50名专业的程序员和开发者,大部分都是曾经供职于Facebook、Google、Twitter等大型的科技公司的高层人士。在他们的帮助下,如果想要想利用更多技术手段来帮助希拉里赢取更多选票和资金,简直是轻而易举的事情。
比如,民主党对于竞选页面进行细微的调整,就可以让捐赠人储存信用卡信息。这种手段常用于电商公司将窗口用户变为付费用户的手段上,但现在在政治上同样适用,很多民众在不知不觉中便已经成为了希拉里“忠实”的支持者。
除此之外,这些大数据团队还能够处理一些突发的技术问题。比如,2015年,联邦竞选委员会报告竞选筹资截止日当天,外部邮箱系统突然崩溃。虽然当时场面一片混乱,但是希拉里的竞选团队竟在4个多小时内搭建了一个临时邮箱系统Balloon,使得危及顺利解决。
这样看来,特朗普似乎只有Twitter这样一个武器,实则不然,特朗普背后的数据团队对于他商人出身的身份进行了量身打造,为这样一位本该有着金钱光环的人打造了一副政客的钢筋铁甲,使得他的辩论能力突飞猛进。
编辑的话
大数据时代的到来,已经让我们看到了不单单是在个人生活方面,甚至是在非常重要的美国大选当中也都在利用大数据分析技术,可见随着每日数据量的暴涨,数据的价值慢慢被发现和挖掘出来,对于企业用户来说同样也是如此,我们也可以注意到现在已经有越来越多的企业用户也在利用大数据技术参与到企业的业务推进、战略制定以及日常管理等诸多方面,相信大数据时代带给我们的将会是诸多方面全新的改变。
本文转自d1net(转载)