大数据与奥巴马的总统连任

      在幕后支持巴拉克·奥巴马获取胜利的数据处理团队注意到,乔治·克鲁尼在西岸对40-49岁的女性粉丝有莫大吸引力,这个群体无疑是为了在好莱坞与克鲁尼以及奥巴马共进晚餐而最愿意掏钱的一支人群。(译注:5月10日,乔治·克鲁尼为奥巴马举办筹资聚会,当晚筹得竞选连任资金1500万美元。)

  所以,就像他们对待所有其他收集、存储、分析的数据一样(这些数据是他们为了奥巴马的再次竞选而在过去两年收集的),奥巴马竞选连任的最高班底决定试试以上这个观察是否正确。他们从东岸的名人里选择到了一个对这个群体有相似吸引力的人,以图复制“克鲁尼竞标”中产生的千万美金效应。“我们有丰常多的选择,但我们选择了女星莎拉·杰西卡·帕克。”一名高级竞选顾问解释说。所以接下来与奥巴马晚餐的竞标诞生了:一个与他在帕克的纽约西村私宅吃上一顿的机会。(译注:席位的公开售价是每位8万美元。)

  对公众而言,他们不可能知道,“帕克竞标”的想法来自于竞选团队对支持者的数据挖掘:他们喜欢竞赛、小型宴会和名人。

  首席科学家

  从一开始,竞选活动经理Jim  Messina已经打算要搞一次完全不同的、以度量驱动的竞选活动,该竞选的目的是政治,但是政治直觉可能并不是手段,数据是。“我们要用数据去衡量这场竞选活动中的每一件事情。”他说,在接受这份工作后,他雇用了一个五倍规模于2008年竞选时的分析部门,芝加哥竞选总部还任命Rayid  Ghani为“首席科学家”。此人是埃森哲技术实验室的分析性研究带头人,他是知识发现和数据发掘这一应用科学领域的领军人物,其技术常用于公司处理海量数据发掘客户所好,比如将超市促销的效率最大化。

  2011年,Ghani在一次谈话中透露,在政治活动中运用数据分析这一工具。他说难点在于如何充分利用在竞选中可获得的选民行动、行为、支持偏向方面的大量数据。现在选民名册与在公开市场上可得的用户资料紧密相连,选民的姓名和住址则与很多资料可以相互参照,从杂志订阅、房屋所有权证明,到狩猎执照、信用积分(都有姓名和住址登记)。

  除了这些资料,还有拉票活动、电话银行的来电所提供的信息,以及其他任何与竞选活动相联系并自主提供的私人信息。加尼和他的团队将试图挖掘这一连串数据并预计出选民的选举模式,这将使奥巴马竞选团队的花费更加精确和有效率。

       秘密进行

  不过,这个几十人数据分析团队具体做了些什么,被严格保密。“他们是我们的核编码。”当被问及都做了哪些工作时,竞选发言人Ben  LaBolt如此说道。

  在办公室里,该团队会给各个数据挖掘实验进行神秘代码命名,比如独角鲸、追梦人。该团队甚至在远离其他竞选工作人员的地方工作,在总部巨大办公室的北边尽头,专设了一个没有窗户的房间。“科学家”们会为在白宫罗斯福厅的总统及他的高级幕僚发送常规工作报告,而更多的公开细节是不会透露的,竞选团队保护着他们自认为相对于罗姆尼团队有制度优势的地方:即数据。

  11月4日,一个高级竞选顾问同意匿名向《时代》杂志讲讲他们的前沿工作,也同时要让我们保证,除非竞选结束,否则不能披露信息。他们披露了他们如何利用海量数据分析挖掘,帮助奥巴马筹集到10亿美金,如何重新制订了电视广告投放,如何做出“摇摆州”选民的详细模型(该模型可用于提升利用电话、上门投递邮件、社会化媒体等手段的效率)

  如何筹集10亿美金

  奥巴马团队在2008年对高科技的运用赢得了无数赞美,但其成功也表明了一个巨大缺陷:数据库太多了。那时,通过奥巴马网站打电话的志愿者用的名单是一份赋闲在家者名单,这名单与在竞选办公室打电话人所用的名单是不一样的。而动员投票名单也永远不会与资金筹集名单重合。就像911之前的FBI和CIA:这两支团队绝不会共享数据。“我们早期意识到,民主党的问题就在于数据库太多了,”一个工作人员说,“数据库之间不彼此碰头。”所以在头18个月里,竞选团队就创建了一个单一的巨大系统,可以将从民调专家、筹款人、选战一线员工、消费者数据库、以及“摇摆州”民主党主要选民档案的社会化媒体联系人与手机联系人那里得到的所有数据都聚合到一块。

  这个组合起来的巨大数据并不仅仅让竞选团队能够发现选民并获取他们的注意,还能让数据处理团队去做一些测试,看哪些类型的人有可能被某种特定的事情所打动或说服。比如,在办公室里的电话名单上,不只是列出对方的名字与号码,还用他们可能被说服的内容、以及竞选团队最重要的优先诉求来排序。决定排序的因素中有四分之三是基本信息,比如年龄、姓别、种族、邻居以及投票记录。选民的消费者数据帮助完成这个图谱。“我们可以预测哪些人会在网上捐钱,也可做出模型来看哪些人会用邮件捐。我们可以为志愿者建模。”一个用数据来创建预测文档的高级顾问说,“最后,建模对我们来说变得是一种更重要的方式,相较于2008年而言,它让我们工作得更有效率。”

  比如在早期,竞选团队就发现,在个人注意力最容易被重新吸纳回来的人群里,2008年曾经退订了竞选邮件的那部分人是首要目标。策略师为特定地域的人群制作相应的测试。看一个本地志愿者拨打的电话效果,如何优于一个从非摇摆州(比如加州)志愿者打来的电话。就像Jim  Messina说的,在整个竞选活里,没有数字做支撑的假设绝少存在。

  新的大数据库能让竞选团队筹集到比他们曾预料到的更多的资金。到8月份,奥巴马阵营里的每个人都认为他们达不到10亿美金的筹集目标。“我们曾经有过很大争议,我们甚至不能接受9亿的目标。”一个对该过程接触密切的高级官员说。但是,另一个人说,“结果到了夏天的时候,互联网效应爆炸了。”

  网上筹集到的资金极大一部分通过一个复杂的、以度量驱动的电邮营销活动而来。在此时,数据收集与分析变得异常重要。很多给支持者的邮件只是测试,它们采用了不同的标题、发送者与讯息内容。在春天时,米歇尔·奥巴马的邮件表现得最好,有时,竞选总指挥Messina表现得比副总统拜登好。在很多时候,表现最佳的募集人能够得到十倍于其他募集人的资金。

  芝加哥总部发现,参与了“快速捐献”计划(该计划允许在网上或者通过短信重复捐钱,而无须重新输入信用卡信息)的人,捐出的资金是其他的捐献者四倍。于是该计划开始被推广,以各种方式加以激励。在10月底时,该计划成为竞选团队对支持者传递信息的重要组成部分,第一次捐助的人如果参加该计划的话可以得到一个免费的保险杆贴纸。

  预测结果

  随后,那些意在打开钱包的戏法接着又用于去拉动选票。分析团队用了四组民调数据,建立了一个关键州的详细图谱。据说,在过去的一个月内,分析团队做了俄亥俄州29000人的民调,这是一个巨大的样本,占了该州全部选民的0.5%,这可以让团队深入分析特定人口、地区组织在任何给定时间段里的趋势。这是一个巨大的优势:当第一次辩论后民意开始滑落的时候,他们可以去看哪些选民改换了立场,而哪些没有。

  正是这个数据库,帮助竞选团队在10月份激流涌动的时候明确意识到:大部分俄亥俄州人不是奥巴马的支持者,更像是罗姆尼因为9月份的失误而丢掉的支持者。“我们比其他人镇定多了。”一个官员说。民调数据与选民联系人数据每晚都在所有可能想象的场景下被电脑处理、再处理。“我们每天晚上都在运行66000次选举。”一个高级官员说,他描述了计算机如何模拟竞选,以推算出奥巴马在每个“摇摆州”的胜算。“每天早上,我们都会得出数据处理结果,告诉我们赢得这些州的机会在哪,从而我们去进行资源分配。”

  线上,动员投票的工作首次尝试大规模使用Facebook,以达到上门访问者的效果。在竞选的最后几周里,下载了App的人们,会受到一些带有他们在摇摆州朋友的图片的信息。该讯息告诉他们,只要点击一个按钮,程序则会自动向目标选民发出鼓励,推动他们采取恰当的行动,比如登记参选、早点参选或奔赴投票站。竞选团队发现,通过Facebook上朋友接受到如此信息的人有五分之一会响应,很大程度上因为这个讯息是来自他们认识的人。

  数据也帮助了竞选广告的购买投放。与其依赖于外部媒体顾问来决定广告应该在哪里出现,Messina觉得不如将他的购买决策建立在内部大数据库上。“我们可以通过一些真的很复杂的模型,精准定位选民。比如说,迈阿密戴德35岁以下的女性选民,如何定位?”一个官员说。结果是,竞选团队买了一些非传统类剧集(如《混乱之子》、《行尸走肉》、《23号公寓的坏女孩》)之间的广告时间,而回避了跟地方新闻挨着的广告时间。奥巴马团队2012年的广告购买比2008年高了多少呢?芝加哥方面有一个数字:“电视广告效率提高了14%……这确保我们是通过广告在与我们可劝服的选民对话。”那位官员说。

  数据同样让团队把候选人送到通常在竞选晚期不会出现的地方。8月份时,奥巴马决定到社会化新闻网站Reddit去回答问题。许多总统的高级助手们甚至不知道这个网站是干嘛的。“为什么我们要把巴拉克·奥巴马放在Reddit上?”一个官员问道,“因为一大堆我们的动员目标在Reddit上。”

  数据驱动的决策对奥巴马这位第44位总统的续任起到了巨大作用,也是研究2012选举中的一个关键元素。它是一个信号表明华盛顿那些基于直觉与经验决策的竞选人士的优势在急剧下降,取而代之的是数量分析专家与电脑程序员的工作,他们可以在大数据中获取洞察。正如一位官员所说,“决策者们坐在一间密室里,一边抽雪茄,一边说:"我们总是会在《60分钟》节目上投广告。"的时代已经结束。在政治领域,大数据的时代已经到来。”


原文发布时间为:2013-08-5


时间: 2024-08-04 07:05:06

大数据与奥巴马的总统连任的相关文章

大数据助力奥巴马,打响精准营销战

在本质上,政治选举和产品营销没有区别,前者和后者一样,通过各种营销手段把候选人最终"卖给"选民.因此,随着社会化网络和大数据分析与营销的进一步融合,美国总统大选已经演变成了一场基于大数据分析的精准营销大对决(2012年奥巴马竞选团队的数据科学家数量比上次竞选增长了五倍).在"数据科学家如何帮助奥巴马TKO罗姆尼"一文中,我们揭示了奥巴马竞选团队的获胜密码--社会化分析+个性化精准营销,但其中的战术细节.使用的新工具.新方法等"微创新"依然鲜为人知

大数据记录一切 是天使还是魔鬼?

提起大数据,很多人都感觉略知一二:但大数据到底是什么,又很少有人能解释清楚.今年两会期间,包括小米科技创始人雷军.联想集团董事长杨元庆.科大讯飞(002230,股吧)董事长刘庆峰在内的多位代表.委员都提出了与大数据相关的建议和提案,他们一方面希望从国家层面推动大数据的发展,另一方面也对它在信息安全方面可能存在的隐患提出了警示. 大数据记录了所有一切 一份调查显示,2013年我国产生的数据总量超过0.8ZB,相当于2009年全球的数据总量:而到2020年,一个普通中国家庭每年产生的数据量,将相当于

中怡康左延鹊:大数据真正价值仍待挖掘

3月24日消息,日前,中怡康品牌中心总经理左延鹊做客赛迪网直播间,针对目前消费者所关心http://www.aliyun.com/zixun/aggregation/14294.html">的大数据现状及发展前景提出了自己的观点和看法. 其表示,企业手里的海量用户信息的真正价值仍没有被挖掘出来,厂家需加强对于数据的精细化管理,合理的布局自身的发展战略. 中怡康品牌中心总经理 左延鹊 大数据是海量数据的集合,这些海量数据规模巨大,难以用现有数据管理工具或传统数据处理程序进行处理.随着其无可比

大数据的人类面孔

所谓"大数据人类面孔"(The Human Face of Big Data,HFoBD),请不要望文生义,误解为与视频或图像中的人脸识别有密切的关联--虽然,"大数据人类面孔"项目的发起者里克·斯莫兰(Rick Smolan)是一位著名的摄影家. 该项目是一个全球性的尝试,旨在向人类介绍大数据对我们所有人在生活.学习.治理.工作和玩乐方式上的革命性作用.该项目将通过简单.人性化的故事和图像,展示大数据已经对我们的世界带来的改变,并预示它将在未来影响到我们的一些方式

“大数据时代”的思维变革

<大数据时代>作者舍恩伯格认为,驾驭海量数据会给社会和商业带来巨大的益处 [主持人]2013年开年,一本名为<大数据时代>的书掀起了一阵阅读风.在国内外业界看来,这本书开创了全球大数据研究的先河.该书作者.著名数据科学家舍恩伯格,在书中前瞻性地指出,大数据带来的信息风暴正在深刻的改变人们的生活.商业形态以及思维方式.今年3月,我们的记者在北京对<大数据时代>的作者进行了专访. 让我们一起来听听舍恩伯格眼中的大数据时代. [解说]出生于奥地利的维克托·迈尔·舍恩伯格,被誉

姜奇平:大数据时代,中国仍可能落后挨打

随着大数据时代的到来,因为开发利用数据的能力差异,各国有可能形成新的数据鸿沟.中国要警惕因为大数据方面的落后,重新拉大与发达国家的距离.我认为要正视以下四种数据鸿沟: 首先是观念上的数据鸿沟.中国在涉及先进生产力.http://www.aliyun.com/zixun/aggregation/9993.html">科技创新的重大潮流方面,总是被动地跟在美国后面.这已不是第一次了,从计算机.互联网.云计算--一直到物联网,回回如此.为什么中国没能引领一回世界潮流?根本原因是中国在现代化观念上

奥巴马连任背后:政界大数据时代即将到来

北京时间11月8日消息,据国外媒体报道,美国时代杂志特约撰稿人迈克尔-施尔乐(Michael Scherer)日前撰文对奥巴马竞选团队在本届大选中所使用的全新数据分析战略做出了一番剖析.施尔乐认为,竞选团队幕后的数据分析团队在此次奥巴马连任的过程中发挥了至关重要的作用,其重要性甚至远远超越了人们的想象.而在此次大选尘埃落定后,政界的大数据时代或许即将到来. 以下是文章主要内容: "克鲁尼效应" 今年春天晚些时候,奥巴马竞选团队幕后的数据分析团队注意到乔治-克鲁尼(George Cloo

美国总统大选民调又估错,传统民调失效也不等同大数据准确

美国总统大选已尘埃落定,一天之前所有报纸民调都说希拉里笃定当选,但结果却如大家所知.有趣的是,在大选前预言说中的却是人工智能,由印度开发的 MogIA AI 就成功预言特朗普当选.这证明了传统民调已经完全失效了,但大数据和人工智能是否又一定准确? 人人都想问:为何公投结果和民调预测完全不同?其实早前的英国 6 月脱欧公投已经有这样的情况了.当时铺天盖地都是留欧的声势最强,传统机构民调.市场预测,就连博彩网站也是留欧的赔率较低,而在公布结果前由调查机构 YouGov 做的票站民调也是留欧占多.结果

获“大数据"挺奥巴马"推” 揭《纸牌屋》爆红真相

伴随< 纸牌屋>一起火起来的,还有一个词,叫"大数据".对于IT人群,这个大数据的概念并不陌生,它指的是借由互联网庞大信息所涉及的海量资料,如何在合理时间内达到撷取并整理总成为帮助企业经营决策更积极目的的资讯.有一种说法是,<纸牌屋>便是Netflix根据大数据发现,大卫·芬奇+凯文·史派西+英剧<纸牌屋>,这3个关键词的受众叠加后,完全可以拍摄一部叫好又叫座的产品,这不, 奥巴马都是自己在Twitter上为 电视剧卖力叫好.事实上,真的如此吗? [