揭秘奥巴马成功竞选背后:数据挖掘团队成支柱

导语:美国《时代》杂志周四撰文,揭秘数据挖掘在奥马巴竞选中起到的重要作用。奥巴马竞选阵营的数据挖掘团队为竞选活动搜集、存储和分析了
大量数据,给予竞选团队的高级助手,帮助其成功“策划”多场活动,为奥巴马竞选筹集到10亿美元资金。

今年春天晚些时候,奥巴马竞选阵营的数据挖掘团队注意到,影星乔治·克鲁尼(George Clooney)对美国西海岸40岁至49岁的女性具有非常大的吸引力。她们无疑是最有可能为了在好莱坞与克鲁尼和奥巴马共进晚餐而不惜自掏腰包的一个群体。

在过去两年内,他们为奥巴马的连任竞选活动搜集、存储和分析了大量数据,同以往处理这些数据的做法一样,奥巴马在竞选团队的高级助手决定再次听取数据挖掘团队的意见。他们希望在东海岸找到一位对这个女性群体具有相同号召力的名人,从而复制“克鲁尼效应”的成功经验。克鲁尼在自家豪宅举办的筹款宴会上,为奥巴马筹集到数百万美元的竞选资金。

奥巴马竞选成功后,在Twitter上发的第一张照片。社交网络与数据分析,对奥巴马成功连任功不可没。

奥巴马竞选团队的一位高级顾问说:“我们面临无数的选择,但最终定了莎拉·杰西卡·帕克(Sarah Jessica Parker,美国知名影星)。”于是,一个与奥巴马共进晚餐的“竞争”便诞生了,那就是争夺在杰西卡·帕克的纽约West Village豪宅美餐的机会。

对于普通民众而言,他们根本不知道这次活动的想法源于奥巴马数字挖掘团队对帕克粉丝研究的重大发现:这些粉丝喜欢竞赛、小型宴会和名人。但从总统大选一开始,奥巴马竞选团队主管吉姆·梅斯纳(Jim Messina)便希望打造一个以数据驱动、完全不同于以前的竞选活动:政治是目标,但天分可能不再是实现政治抱负的手段。

梅斯纳在成为竞选主管后说:“我们会在此次竞选活动中测量每一件事情。”他打造了一个规模五倍于2008年竞选时的数据分析部门,让拉伊德·加尼(Rayid Ghani)出任芝加哥竞选团队总部的“首席科学家”,此人在数据挖掘领域的经验非常丰富。

这个由几十人组成的数据挖掘团队的具体工作被严格保密。奥巴马竞选团队发言人本拉·波尔特(Ben LaBolt)在问到数据挖掘团队的职责时说:“他们是我们的核代码。”

在办公室里,该团队会给各个数据挖掘实验进行神秘代码命名,比如“独角鲸”、“追梦人”等。他们在远离竞选团队剩余工作人员的地方办公。这些“科学家”为身在白宫罗斯福厅的总统及其高级助手制作日常简报,而有关这个团队的更多细节是不会对外透露的,因为奥巴马竞选阵营牢牢固守着他们自认为比罗姆尼竞选阵营有优势的地方:即数据。

11月4日,奥巴马竞选团队多位高级顾问答应以匿名形式向《时代》杂志谈一谈他们的工作。他们的确披露了一些鲜为人知的故事,例如,如何通过分析海量数据帮助奥巴马筹集到10亿美元资金,如何改变了电视广告投放策略,以及如何制作出摇摆州选民的详细模型等等。

如何筹资10亿美元

在2008年的竞选中,奥巴马团队对技术的应用赢得了不少赞扬,但其成功的背后却掩盖了一个巨大的弱点:过多的数据库。当时,通过奥巴马网站打 电话的志愿者使用的名单与在竞选办公室打电话人所用的名单是不一样的,而动员投票名单也从不会与资金筹集名单重合。这就好像911之前的FBI(美国联邦 调查局)和CIA(中央情报局):这两大机构从不会共享数据。其中一位官员说:“我们很早就意识到,民主党策略的问题是数据库太多,彼此之间从不沟通。” 因此,在前18个月,竞选团队就创建了一个单一的庞大系统,可以将来自民意调查者、捐资者、现场工作人员、消费者数据库、社交媒体,以及“摇摆州”主要的 民主党投票人的信息整合在一起。

这个整合后的巨大数据库不仅能告诉竞选团队如何发现选民并获得他们的注意,还允许数据处理团队进行一些测试,从而来预测哪些类型的人有可能被某 种特定的事情所说服。例如,在竞选办公室里的电话名单上,不仅仅列出了姓名和电话号码,还按照他们被说服的可能性和重要性对姓名进行排序。在排序的决定性 因素中,约75%是基本信息,如年龄、姓别、种族、邻居和投票记录等。一位高级顾问称:“我们可以预测哪些人会通过网络捐款,哪些人会汇款。我们还可以为 志愿者建模,建模可以对让我们的工作效率更高。”

例如,竞选团队早期就发现,在个人注意力最容易被重新吸引回来的人群中,在2008年大选中曾退订了竞选电子邮件的那部分人是首要目标。为此, 战略家们为特定人群制订了相应的测试。例如,测试一个本地志愿者打来的电话的效果如何优于一个从非摇摆州(如加州)志愿者打来的电话。正如竞选总指挥吉 姆·梅西纳(Jim Messina)所说,在整个竞选活中,没有数字做支撑的假设很少存在。

这个庞大的数据库还能让竞选团队筹集到比他们预期的更多的资金。截至8月份,奥巴马团队里的每个人都认为他们达不到10亿美金的筹集目标。其中一位高级官员称:“我们曾经反对过,因为连9亿美元的目标都不能接受。”但另一位官员称:“结果到了夏天,互联网效应爆发了。”

在通过网络筹集到的资金中,很大一部分是通过电子邮件营销而来。因此,数据收集与分析至关重要。发送给支持者的邮件中很多只是测试,它们采用了 不同的主题、发送人与内容。到了春天,米歇尔·奥巴马(Michelle Obama)的电子邮件表现得最好。有时,梅西纳表现得比副总统拜登 (Joe Biden)要好。很多时候,募集资金最多的人能比欠佳者多出10倍。

芝加哥总部还发现,签署了“快速捐献”计划的人所捐献的资金是其他捐献者的4倍。因此,该计划后来被大力推广,并进行激励。到10月底,该计划已经成为竞选团队向支持者传递信息的重要部分,首次捐献者可以得到一个免费的保险杆贴纸。

结果的预测

这种协助筹款的技术随后又被用于预测投票结果。奥巴马的数据分析团队建立了4条投票数据流,以了解关键州选民的详细情况。一名官员表示,过去1个月中,仅在俄亥俄州,数据分析团队就获得了约2.9万人的投票倾向数据。这是一个包含1%选民的巨大样本,使他们可以准确了解每一类人群和每一个地区选民在任何时刻的态度。这带来了巨大的优势。当第一次电视辩论结束后,选民的投票倾向发生改变。而数据分析团队可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。

在10月份选情扑朔迷离的情况下,这一数据库确保了奥巴马竞选活动的稳定。通过数据,奥巴马竞选团队发现,大部分摇摆不定的俄亥俄州选民原本并非奥巴马的拥趸,而是罗姆尼的支持者。在9月份罗姆尼出现失误之后,这些选民的态度出现动摇。一名官员表示:“我们比其他人更冷静。”每天晚间,投票倾向和选民数据被反复处理,以考虑多种不同情况。另一名高级官员则表示:“我们每晚模拟6.6万次大选,并于每天上午获得结果,了解在这些州胜出的可能性,从而针对性地分配资源。”

奥巴马竞选团队还首次利用Facebook进行大规模的投票动员,这模仿了现场组织者挨家挨户敲门的方式。在竞选活动的最后几周,下载某一款应用的用户收到了多条消息,其中包含他们在“摇摆州”好友的照片。他们被告知,可以通过点击按钮,呼吁这些目标选民采取行动,例如进行投票注册、更早地投票,以及参与到投票中。奥巴马竞选团队发现,大约1/5收到Facebook请求的选民做出了响应,这在很大程度上是因为请求来自他们熟悉的人。

数据还帮助奥巴马竞选团队进行广告购买决策。在选择广告投放渠道时,他们没有依靠外部媒体顾问,而是基于内部数据。一名官员表示:“我们可以通过复杂的建模来找到目标选民。例如,如果迈阿密戴德郡的35岁以下女性是我们的目标,那么这里有如何覆盖她们的方式。”因此,奥巴马竞选团队在一些非传统节目中购买了广告,例如4月23日的电视剧《混乱之子》、《行尸走肉》和《23号公寓的坏女孩》。以往,竞选广告通常出现在本地新闻节目中。那么,在广告投放方面,奥巴马竞选团队2012年的表现比2008年好多少?芝加哥有这样的数据:“在电视平台上,我们的购买效率提升了14%,确保与能够被说服的选民保持交流。”

根据数据分析,奥巴马竞选团队在大选的最后阶段也采取了不同以往的方式。今年8月,奥巴马决定在社交新闻网站Reddit上回答问题,当时多名总统高级助理并不清楚此事。一名官员表示:“我们为何将奥巴马放在Reddit上?因为我们发现很大一部分目标选民在Reddit上。”

这种由数据驱动的决策方式在奥巴马成功连任的过程中发挥了重要作用,也将成为外界研究2012年美国大选的一个重要元素。这再次表明,依赖预感和经验的华盛顿特区竞选专家地位正在迅速下降,被善于利用大批量数据的数量分析专家和计算机程序员所取代。正如一名官员所说,“人们坐在密室抽着雪茄,简单地说‘我们总是会买《60分钟》广告”的时代已经结束。在政治界,大数据时代已经到来。(李明 清风 维金)

时间: 2024-10-23 10:16:44

揭秘奥巴马成功竞选背后:数据挖掘团队成支柱的相关文章

揭秘Facebook成功的背后:开放式数据中心

接近10亿注册用户.每分钟数十亿交易的Facebook,早已意料到数据中心的重要性.为此,它们在去年就开始推动名为The Open Compute Project的数据中心计划. Facebook的第一个数据中心位于俄勒冈州中北部的Prineville镇哥伦比亚河以南和华盛顿边界约80公里的区域,在经历了2年半时间建造后该数据中心于今年5月正式启用.该数据中心专为Facebook定制而构建,并使用了该公司的开放式计算项目架构, 作为开放式计算项目的组成部分,Facebook公布了用来兴建的主板.

奥巴马的竞选团队近期推出一个以选民为主要对象的手机应用程序

美国总统贝拉克·奥巴马的竞选团队近期推出一个以选民为主要对象的手机应用程序,打算借助数字技术"东风",赢得选战. 这一程序有助于竞选团队确认支持选民,推广奥巴马竞选主张,却因涉嫌触及选民隐私而引发争议. 目的 借机拉票寻支持 应用程序名为"美国奥巴马",是一个集信息.推广.筹款和活动组织等方面的全方位竞选工具.应用程序7月31日向以美国苹果公司手机iPhone为载体的客户端发布,定于本月9日向"安卓"操作系统客户端发布. 免费下载客户端后,用户可

揭秘2017双11背后的网络-双11的网络产品和技术概览

引言 揭秘2017双11背后的网络-一张图读懂2017双11中的网络产品和技术 揭秘2017双11背后的网络-双11的网络产品和技术概览 揭秘2017双11背后的网络-直面双11洪峰的负载均衡SLB 揭秘2017双11背后的网络-全球最大混合云架构 注:如果对网络产品还不太了解的,推荐阅读 一张图看懂阿里云网络产品[一]网络产品概览 下面分别对双11中的主要网络产品-专有网络VPC,负载均衡SLB,NAT网关,高速通道以及混合云架构进行介绍 VPC-安全的网络容器 专有网络VPC(Virtual

专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化&商铺千人千面

12月6日-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云联合主办,以"2016双11技术创新"为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)将在线举办.(https://yq.aliyun.com/promotion/139)12月7日晚20:00,来自阿里巴巴的资深技术专家魏虎将在在线论坛上发表<数据赋能商家背后的AI技术>的演讲. 系列文章陆续发布: 专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用 专访阿里

【云和恩墨大讲堂电子期刊】挑战者:Google成功的背后

致亲爱的读者: 在商业竞争中,进攻常常也是最好的防守.Google从小到大一直贯彻这个原则.Google在规模很小的时候,受到很多比自己大的公司的围攻,死守是没有出路的.因此它把自己放在一个挑战者的位置,不断挑战对手,也挑战自己.在商业竞争中,Google常常是两眼盯着前方向前冲,而不左顾右盼它的对手. 这段话摘自<浪潮之巅>,也是我认为对于Google成功的背后最好的阐释.Google公司从一开始就以挑战者的身份出现在人们的视野中,它不仅在技术和商业上挑战比自己更大更强的公司,而且在理念上挑

远控木马上演白利用偷天神技:揭秘假破解工具背后的盗刷暗流

本文讲的是远控木马上演白利用偷天神技:揭秘假破解工具背后的盗刷暗流,如今,不少人为了省钱,会尝试各种免费的方法获取网盘或视频播放器的会员权限,网上也流传着不少"网盘不限速神器"或者"播放器VIP破解工具".不过,这些"神器"既不靠谱更不安全,因为它们已经被木马盯上了.  近日,360安全中心监测到一批伪装成"迅雷9.1尊贵破解版"."百度网盘不限速"工具的远控木马正大肆传播.为了掩人耳目,木马不仅会添加桌面

网络文学代写产业链调查:团队成主力 举证难

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 围绕着"代写"这个核心话题,知名作家韩寒与打假斗士方舟子的论战已有数天,目前双方各执一词,事件开始升级.韩寒否认作品系代笔所为,因此向法院提出诉讼,状告方舟子侵害个人名誉.事件虽然尚无结论,但是有关出版圈内代写的问题已经引起公众的关注. 相比较于传统文学创作,网络文学因其创作环境宽松.监管不严.新人走红快等特点,代写问题更

返回datatable-从webservice获取成功的xml如何转成对象

问题描述 从webservice获取成功的xml如何转成对象 如,webservice定义return System.Data.DataTable对象, 在浏览器端获取到xmlhttp对象,//xmlhttp = new ActiveXObject("Microsoft.XMLHTTP") 接收到 xmlhttp.responseText 为 ----------------- <?xml version="1.0" encoding="utf-8&

揭秘产品成功背后的“隐性”因素

杜宇一款产品来说,产品设计的过程有着硬性的指标的.但是实际上一款产品能否成功,除了这些实际的可见的因素以外,还有很多"隐性"因素在里面,这些虽然因素"无色无味",但是她们有些时候对于产品的成功与否却起到至关重要的作用,下面我们就来一起盘点一下这些隐形的因素. 1.最佳实践和沟通 经历过一些产品的开发,有成功有失败.决定一款产品开发成功与否,除了技术.资源.管理.人员.等一些很硬的指标外.有两个软指标非常关键但是往往会被忽略掉,那就是最佳实践和沟通. 大到产品开发流程