【经济学人特别报告之广告业与技术】通过数据来了解你

在被搬上好莱坞荧屏的系列小说---《分歧者》中,有这样的描述:在后启示录时代的芝加哥,人类依据其各自的能力和价值,被划分为五大派系。而且,所有年满16岁的青少年需要进行一项决定其派系归属的测试。在网络广告的世界中,或许没有这么精细的区分,但是,收集大量的网络用户信息并进行销售已发展成为一项规模不小的生意。对于产值高达1200亿美元的网络广告经济而言,数据信息无疑是极其重要的。

奥马尔·塔瓦科尔( Omar Tawakol),是以跟踪客户网络行为并将获取的相关信息卖给其他公司为业务的数据代理公司Bluekai的老板,其表示:“这是一场信息战争。所有工作的核心就是尽可能多的收集客户信息,并通过销售该类信息获得更多的收益。”互联网的存在大大减轻了信息收集工作的工作量,因为无论用户浏览何种网站,其都会留下浏览痕迹。脸书(Facebook)及推特(Twitter)收集了大量本网站注册用户以及浏览其网页的用户的信息,包括年龄、好友群以及他们的兴趣。其中的不少信息,在用户毫无意识的情况下就完成了收集。富国证券公司(WellsFargo Securities)的网络分析师彼得·斯塔普勒(Peter Stabler)就表示:“比如说,添加在其他网站的脸书‘赞’或者是推特‘发推文’按钮,其含有特定编码,借助该编码,即便用户并未点击该两个按钮,这两家社交媒体公司亦可跟踪用户的动态。”

广告行业主要通过两种方式获取用户数据信息。“第一方”信息由与用户产生直接关系的公司获得。广告商及出版商可通过要求用户进行网上注册而获取用户信息。这可以帮助企业通过各种操作终端进一步加深对消费者的认知,了解他们浏览了本公司网站上何种信息和购买了何种物品。

“第三方”信息则是由互联网上成千上万的专业公司收集获得。“像这样人们并不熟知的专业公司,其数量正急速增长”,身为该类专业公司一员的移动广告公司欧朋(Opera)的老板---迈得·席尔瓦(Mahi de Silva)如此说道。为了收集足够的信息从而发布适当的广告内容,许多公司网站为具备监测浏览网页用户并为用户建立数据文件能力的专业公司提供网络空间,供其使用。例如,Bluekai公司在全球收集了多达1亿份的潜在消费者档案,每一档案的资料信息平均有50条之多。

用户在浏览不同网页时,第三方公司常常通过使用信息记录程序(cookies)、网站信标标签等网络技术及其他网络工具,以达到正确识别用户的目的。广泛应用于台式电脑的cookies(网络或互联网使用者发给中央服务器信息的计算机文件)是用于同客户服务端进行信息交换的代码片段。根据TRUSTe公司提供的数据,访问量前100名的网站,受到超过1300家专业公司的监测,其中,有些公司会将该类信息与非本行业者分享,供其使用,俗称“借道”。

因而,上述技术及工具使得公司能够收集足够的客户信息,诸如他们浏览了什么网页,购买了什么物品、所在社区的邮编等一系列信息。通过这些信息,公司能够推断出用户的收入、他们家的房屋面积以及他们的房子到底是租来的还是自己所有的。通常来讲,网络用户在浏览特定网页时,会被网站赋予特定的标签,但是,各家公司获取用户信息的手段可远不仅如此。广告技术公司RadiumOne即是如此,当网络用户点击其朋友发来的网络链接时,RadiumOne公司就会在用户通常不知情的情况下,在用户端生成cookies。移动设备上的信息收集则会更加精准。帮助出版商进行实时广告空间销售的PubMatic公司,能够提供台式电脑用户的50-70个数据点,而关于手机用户,该数字为100个数据点,包括手机设备所在的精准方位数据。手机用户90%的时间都是通过不支持cookies的手机应用(又称“apps”)浏览网页内容,因此,广告商、应用开发商及中介公司会利用用户设备ID等工具来识别用户。

各家公司重申他们并不知道用户的姓名。但是,他们通过编号来确认用户的身份,且由于他们为每个编号的用户建立了详细的数据档案,有人担忧借助这么详细的数据信息可能会直接找到具体的个人。这让广告公司处于两难的境地。他们当然想炫耀自己强大的追踪能力和数据信息提供能力,但是,又不想因为知道的太多而让用户感到恐惧和担心。握有用户姓名及其他个人信息的脸书公司表示,其向广告商出售用户信息的行为是建立在尊重用户隐私基础上进行的。

分门别类

收集并处理大量的用户信息并非易事。数据代理公司帮助广告商以及出版商管理他们的第一手用户信息,同时,也向他们出售更多的用户信息,借此实现盈利。数据代理公司按照用户的所在位置、使用设备、婚姻状态、收入状况、工作类别、消费习惯、旅行计划及其他标准将用户信息进行分类,并将该信息分类即时提供给广告位购买人,供其购买。该信息分类能够非常具体。例如,数据代理公司eXelate出售“深处危机的男人”分类,该分类下的男人被认为恋爱关系出现了问题,因为他们正在网上购买巧克力和鲜花。另外一家数据代理公司IXI则在销售名为“深陷债务:小镇单身族”的信息分类。

绝大多数消费者对专门以收集其信息维生的公司知之甚少,但是,他们确实了解一些以此为副业的公司。出版公司福布斯(Forbes)公司销售浏览其网站的读者的信息。竞选组织则将其广告分发对象名单租赁给其他公司使用,从而实现一定的盈利。婚恋网站OkCupid曾销售关于其用户的酒类消费以及用药数量等信息,但该网站表示,现在他们已不再销售该类信息了。

包括维萨卡公司、万事达卡公司以及美国运通卡公司在内的信用卡公司都向广告公司销售其持卡人的匿名数据。广告位竞标人可在万事达卡公司购买到大量的消费者分类信息,例如,哪些用户需要特定的通信服务,而哪些用户又偏爱哪家连锁酒店等信息。曾在美国运通卡公司工作的业内人士表示,该公司在这方面是具有优势的,因为它能够直接发行信用卡(而维萨卡公司及万事达卡公司只是同银行合作,并无直接发卡权力),这就使得美国运通卡公司可以在信用卡用户登录查看其账单时在用户端生成cookies并查看用户其他的网上动态。

拍卖会亦是巨大的信息来源。不少公司都会经常去广告交易所,以获取用户及出版商的信息。以买卖广告为营业并被称为“网络广告商”的广告代理公司通过网络收集大量的信息。例如,之前,媒体采购公司分享传媒(Mediashare)打算为其客户---纸巾制造商舒洁(Kleenex)选择最佳的广告宣传区域并进行宣传,然后,其参加了搜索竞价以了解当时那些地区的消费者正在搜索与流感、感冒药品有关的信息。在了解了相关信息后,其在拍卖过程中故意报出低价并成功在拍卖会中脱身。随后,分享传媒公司将关于舒洁公司的市场营销工作主要集中在了这些有人可能感冒的区域。各家公司总是尽全力去了解他们的消费者。直销商常常借助出生证明、婚姻证明及房契等公共档案信息了解消费者的信息,而目邮购公司则会将其客户信息列表出卖给竞争对手。但互联网的存在,大大扩大了数据采集的范围和规模。有些情况下,用户明确表示同意网络服务方可以追踪他们的信息,但更多时候,第三方服务方是不会征询他们的意见的,而且第三方服务方在收集完信息以后以消费者以及政府监管机构所不知晓的方式对上述信息进行利用。

各家公司总是尽可能多的去了解用户的个人信息。有一种办法就是了解用户正在使用的终端设备。而要求用户进行登录才能进行操作的脸书、谷歌及推特公司就拥有了优势,因为他们可以识别通过不同终端登录网站的用户。登录到相同的无线网络亦有类似的功能。

同时,各家公司亦积极的将线上及线下世界产生联系。以脸书为例,其已与得利捷(Datalogix)公司达成合作关系,以实现线上及线下消费的联系。作为最大的具备线下信息处理技术的数据代理有限公司之一的Acxiom公司,近期耗资3亿美元将Liveramp收至麾下,后者精于将消费者的线下消费信息与线上信息进行匹配。

这可不是什么新鲜事了。早在十五年之前,网络广告公司--后期被谷歌兼并--双击公司(DoubleClick)就收购了以收集客户线下消费信息而知名的 Abacus公司。但因为提倡保护隐私权者的异议和反对,双击公司不得已放弃了该项目并在2006年将Abacus转出。现在,不会再有这样的反对声音了。之前曾在双击公司工作、现在在广告分析公司 Integral AdScience担任总裁的斯科特·诺尔(Scott Knoll)表示:“科技已经有了明显的进步,所以,对相关信息进行匿名化处理并非难事,目前,不少公司已着手开始相关的工作,社会、管理机构对此还并不了解。”

数据公司表示,他们十分重视保护用户的个人信息,也正因如此,有时他们很难追踪用户的信息。重视个人隐私的用户会定期删除cookies。广告商亦指出,他们对用户的敏感信息并不感兴趣。一家数字广告公司的经理就说道:“我们并不关心你是否有偷税漏税或者是否对你的配偶有不忠的行为,我们并非搜寻你的个人信息,我们只是想确定一下你是不是我们的高端客户,是否有购车的意向。”

“我们能够处理的更具技术性一些,而非单纯在社会舆论允许的范围内肆意为之”

有时候,广告商并不愿意使用手中的信息,因为他们并不想看起来像是在监视消费者。数字广告公司DigitasLBi的托尼·韦斯曼( Tony Weisman)表示:“我们能够处理的更具技术性一些,而非单纯在社会舆论允许的范围内肆意为之。”对于针对购买了特定物品的消费者的目标确认工作,许多广告商通常会等一段时间再进行,因为他们不想泄露他们所知道的信息。数字音乐公司Pandora的首席市场官西蒙·弗莱明·伍德(Simon Fleming-Wood)表示:“我们在寻找收集用户信息行为的界限,但同时,我们的使用方式会尽量保守。”

看管好你的浏览器

作为网络广告基础的信息数据收集系统引起了大家的几个疑问。其中就包括消费者的隐私。广告公司宣称他们不会将敏感的个人信息或健康信息用于广告目的,但在《广告时代》杂志社负责数据产业报道的凯特·凯耶(KateKaye),在就一则新闻故事进行了关于性传播疾病的调研之后不久,就收到了向艾滋病患者提供帮助的针对性广告。

另一个担忧就是如何预防数据信息的泄露。很多公司在授权第三方连接其数据库时都十分谨慎,以避免出现安全问题或者将信息泄露给其他竞争对手。六月份,路透社的网站受到了叙利亚电子军的攻击,后者正是通过该网站上的一个名为Taboola的第三方在线广告实施的攻击行为。同时,人们亦对一款可以将信息公司收集的大量经过加密匿名的信息进行解密处理的流氓程序所可能导致的信息泄露灾难表示担忧。IntegralAd Science公司的诺尔先生不禁疑问:“到底由谁负责监督管理?所谓的权力制衡到底还存在吗?”

普林斯顿大学计算机科学专业教授埃德·菲尔顿(EdFelten)指出,随着cookies及终端设备所包含的信息越来越多,识别用户身份将变得更加简单。菲尔顿先生及其他教授已证明,如果拥有足够的信息,已匿名加密的信息是可以破解的。一份研究发现,只需两个数据点即可识别超过一半的用户身份。斯坦福桥大学计算机科学研究员乔纳森·梅耶尔(JonathanMayer)就表示:“在计算机科学领域,如果有人提出个人可识别信息无法识别,那真的是天大的笑话。”

另外,不同国家对于何种数据构成个人信息的标准亦有不同。在德国,未经当事人同意,不得向特定民族或持有特定政治立场的用户进行任何形式的营销,但在美国就不存在这种情况。进一步来讲,在欧洲地区,一封电子邮件或者一个IP地址都会被视为个人信息,在美国则不会。当地的数据收集及数字营销很大程度上都有效躲避了职能部门的监控,但在金融业除外。

世界各国的职能管理部门都逐渐意识到,当前的科学技术已把他们甩出好远,他们正努力尝试进行追赶。在欧洲,一项正在编纂且极有可能在2016年正式公布生效的新隐私条例,将会引入严格(有人说是令人窒息的)制约数据收集行为的规则,该规则将适用于欧盟区的全部国家。许多网站已发出通告,告知用户第三方公司的cookies正在追踪他们的网上数据信息。在中国,习近平主席要求总理对该国的数据安全及个人隐私问题开展调查研究工作。

在美国,一项旨在限制用户信息网上追踪行为的政府提案无疾而终。相反,根据数字广告行业自律系统之规定,用户可以在上网的时候选择拒绝接受目标广告(但没表明可以拒绝接受网上追踪)。在由签署自律计划的公司所发出的广告中,会含有一个“广告选择”图标,用户可以点击该图标从而拒绝上述行为。但根据TRUSTe公司克里斯·巴贝尔(Chris Babel)的信息,在观察到该图标存在的用户中,只有0.00015%的用户选择点击进行拒绝。同时,那些删除cookies的用户会被自动重新纳入追踪范围之内,且这一程序将会无限循环。

美国广告业的许多经理认为,监管的加强是大势所趋,特别是对于第三方及数据代理公司,更是如此。英国欧华律师事务所(DLAPiper)全球数据安全业务的负责人之一,吉姆·哈尔伯特(Jim Halpert)表示:“其实监管工作并非针对广告行为本身,而是很多公司在当事人完全不知情的情况下就将关于他们的大量个人信息进行销售。”对于个人信息的使用方式及销售流向的监管几乎为零。哈尔伯特先生指出:每年对第三方数据收集公司进行审计工作应有助于确保个人信息得到正当使用。目前,对于该不当竞争行为表示担忧的只是学者、科技怪人及少数具有正义精神的消费者,尚未引起整个社会的注意,但之所以出现这种情况,应该是因为绝大部分人甚至还没意识到自己已被追踪了。

原文发布时间为:2014-10-10

时间: 2024-09-13 16:50:19

【经济学人特别报告之广告业与技术】通过数据来了解你的相关文章

闪存技术对数据中心产生了哪些影响?

全闪存数据中心是个未来概念,同样还有不少方法实现数据中心内服务器或基于阵列的闪存存储.在数据中心当中使用闪存技术能够完全改变现有的虚拟化方式. 为数据中心添加闪存设备的最大挑战在于如何确保其他基础架构与之保持同步,而基础架构如何进行调整在很大程度上依赖于将要安装的闪存类型.现在有三种类型可供选择:带有缓存功能的服务器闪存.共享闪存阵列和超融合闪存. 现代数据中心的闪存存储设备范围广泛,包括完全闪存或基于闪存缓存的磁盘阵列.服务器闪存以及作为超级融合系统部分,还有各种各样的衍生技术. 全闪存存储如

分析3000份技术面试数据:这几大指标比你毕业于哪所学校更要紧

导读 到底在一次技术面试中,什么因素最为重要? 本文作者 Aline Lerner从interviewing.io(关于面试的输入输出流)中导出了3000份技术面试数据进行分析,并发现了对面试影响最大的几大因素.并且,他还得到了一个鸡血满满的结论:在求职技术面试中,毕业后做什么比毕业于哪所学校更要紧. 相关背景:interviewing.io是一个平台,人们可以在上面匿名练习技术性面试,并在这个过程中找到工作 - 在练习中做得好的话,您能(匿名!)得到像Uber.Twitch.Lyft或其他大公

SDN技术在数据中心的应用前景

SDN是近年来继云计算后,学术界和产业界最关注的热点,被国际研究机构Gartner列为未来五年内IT领域十大关键技术之一.2012年,谷歌宣布已在数据中心内部骨干网络上成功使用SDN技术,标志着SDN进入到商用化阶段.据国际著名咨询机构IDC估计,2013年SDN的收入将达到3.6亿美元,到2016年这一数值将上升至37亿美元.谷歌的成功经验,也使得数据中心成为业界各方推广SDN技术的首选场景. 一.数据中心的发展趋势及需求 近年来,伴随着互联网的高速发展,越来越多的应用及数据被集中到云数据中心

普元发布政务大数据解决方案 用技术提升数据质量

今年9月初,国务院通过<关于促进大数据发展的行动纲要>,将大数据上升为国家战略.在纲要中提到,要大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合.可见在大数据时代下,政府对于数据的整合.打破信息壁垒同样存在着需求. 11月25日,国内领先的软件基础平台与解决方案提供商普元信息技术股份有限公司,在京召开了普元政务大数据解决方案发布会.普元信息CTO焦烈焱认为,政府是一个非常好的大数据场所,通过电子应用的建设,从而达到提高政府的监管水平.为整个社会的公共服务提供支撑.以及拉动产业三

黑科技:Mellanox Multi-Host技术打通数据中心任督二脉

世界领先的高性能计算.数据中心端到端互连方案提供商Mellanox(纳斯达克交易所代码:MLNX)今日宣布,已经有多家OEM厂商开始采用Mellanox极具创新意义的Multi-Host(多通路)技术.该技术可以帮助OEM厂商构建高可扩展的异构计算.存储平台,并能够在直连多重计算.存储组件的同时,提供超高的投资回报.OEM的测试报告显示,Mellanox的Multi-Host技术能够将数据中心的性能提升150%,同时减少30%的成本. "曙光的'M-Pro'系列刀片服务器全面采用了拥有Mulit

加密技术 加强数据私密性确保云计算安全

本文讲的是加密技术 加强数据私密性确保云计算安全,[IT168 资讯]一名IBM研究员解决了一项棘手的数学问题,该问题自从几十年前公钥加密发明以来一直困扰着科学家们.该项创新为"隐私同态(privacy homomorphism)"或"全同态加密(fully homomorphic encryption)"领域的重要技术突破,使得加密信息,即刻意被打乱的数据仍能够被深入和无限的分析,而不会影响其保密性. IBM研究员Craig Gentry设计了这一解决方案.他使用

加密技术加强数据私密性确保云计算安全

本文讲的是加密技术加强数据私密性确保云计算安全,[IT168 资讯]一名IBM研究员解决了一项棘手的数学问题,该问题自从几十年前公钥加密发明以来一直困扰着科学家们.该项创新为"隐私同态(privacy homomorphism)"或"全同态加密(fully homomorphic encryption)"领域的重要技术突破,使得加密信息,即刻意被打乱的数据仍能够被深入和无限的分析,而不会影响其保密性. IBM研究员Craig Gentry设计了这一解决方案.他使用被

虚拟现实技术助力数据中心规划建设

如今,虚拟现实技术日益流行.而对于数据中心的规划和建设来说,则是一个很方便的工具.英国托管提供商AegisData公司表示,该技术可以帮助建筑师和数据中心运营商要构建数据中心之前进行可视化建设. 2016年已经被一些人视为虚拟现实技术应用的一个转折点,OculusRift和HTCVive耳机都推出了其商业版本,OculusRift是一款为电子游戏设计的头戴式显示器.它将虚拟现实接入游戏中,使得玩家们能够身临其境,对游戏的沉浸感大幅提升.而索尼为公司虚拟现实头盔PlayStationVR即将推出.

数据仓库技术在数据服务平台中的应用

引言 随着我国金融业的飞速发展,银行如何通过对客户数据的归类存储.对各种要素的自动判别分析,从业己存在的.大量的数据中挖掘出银行经营管理人员.业务分析人员所需要的信息,以支持决策分析是一个迫切需要解决的问题.由于当前绝大多数企业内数据的真正状况是分散而非集成的,数据不一致问题.外部数据和非结构化数据问题都难以解决. 数据仓库正是随着关系数据库.并行处理和分布式技术的飞速发展而提出的解决使用数据的一种新技术.新概念,它是目前已知的最为广泛采用的解决方案.它不是对传统数据库的替代,而是在传统数据库的