大数据下的个人隐私

珍妮·维特西(Janet Vertesi)是普林斯顿大学的社会学副教授。她一直有这样一个念头:自己怀孕了这件事,是否能不让大数据察觉到? 之所以有这样的想法,是因为她就是专门研究用户和信息技术之间的关系的。她相信怀孕的妇女,从商业角度上来说是一座具有极大潜力,可供开发的”金矿“。量化一下,针对孕妇所挖掘出来的各种营销数据的价值,比普通人要高出 15 倍。所以大数据对与孕妇有关的信息,会抓取的非常敏锐和及时。现在,她就想挑战一下大数据的监测能力!结果是她失败了。其结论是:躲开大数据的洞察,极为不方便,成本代价极为高昂。维特西不推荐任何人这么做。科技公司都曾经纷纷表示:如果用户们很不爽现在的隐私保护策略,那么你就绕开好了。其实显然不是这么回事儿。最近维特西接受了我们的采访,谈了她的实验,实验背后的意义,以及为何躲开大数据会让你显得像是一个鬼鬼祟祟的罪犯。

问:你是怎么想到做这样一个古怪的实验的?你通过什么办法来向大数据隐瞒你怀有身孕的事儿?

答:我去年曾经看过纽约时代周刊上的一篇文章,说的是塔吉特公司通过大数据分析,比如种种消费习惯方面的信息收集,提前预测某位女生她会怀孕!(注:塔吉特百货公司,总部在美国明尼苏达州的明尼阿波利斯,是美国仅次于沃尔玛的第二大零售百货集团)这样一件事对我的震动很大。我知道这互联网上有着各种各样的挖掘隐私的工具,各种各样的跟踪定位,但是我没想到这些零零碎碎的信息所形成的大数据,能够如此紧密的贴合应用到零售业。我想知道它对于每一个个体来说,究竟影响有多大。我知道这是信息化社会的趋势,没办法阻挡。做这样一个实验,仅仅想搞明白我该如何绕开种种大数据的监测。我是否能做到这一切?

问:在这项实验开始,你在社交性媒体中陷的深吗?你是那种给 Instagram 上的点赞狂魔?还是仅仅出于礼节,在 Facebook 上祝某人生日快乐一下呢?

答:打从 Facebook 首次开放测试的时候,我就开始在那上面混了,算算已经有将近十年的时间。两年前,Google 变更了用户隐私保护政策,因为此事,我拒绝使用 Google 的所有产品,曾经有段时间我是坚定的 Google 黑。对于很多人而言,如 Facebook 、Instagram 和 Twitter 提供的服务,大可以说我不爽了闪远便是。但如果是一个寻找工作的人,LinkedIn 是你拓展自己职业生涯的平台。而对于我来说,Facebook 上同事们的社交互动,是我研究的社会学领域中重要组成部分。所以,离开这些社交网络几乎不可能。

问:关于让怀孕的事,躲过大数据的实验,你是怎么做的?

答:首先,我的丈夫和我决定,在任何社交媒体上严加管束我们的嘴巴。我们同样还会要求朋友和家人也不能说。这可不是你一个人的事儿,有些时候你的朋友说了什么,以及他们是否@了你或者标签提到了你,都有可能泄露怀孕这个事实。所以我就给身边的每个人解释了我所做的实验,并且表示,关于怀孕的事儿我们是很开心,但请不要将它放到网上,尤其是不要放到 Facebook 上,因为这个社交平台上充斥着各种收集数据,侵犯个人隐私的事。我们在网上购买一切与婴儿有关的物品,全部是通过 Tor (The online Router) 来实现。(注:Tor 是第二代洋葱路由的一种实现,用户通过 Tor ,可以在因特网上进行匿名交流。最初该项目由美国海军研究实验室赞助)很多人问我是否下载了 ad blocker 插件(屏蔽互联网广告的一款工具),我没下。因为下了这个插件,我就不知道这个互联网到底了解我有多少了。我在上网时,处理与怀孕根本不沾边的其他事情,都用普通的浏览器,但是一旦涉及到怀孕的事,我就用不留痕迹的浏览器。能用现金购买的东西,我们就用现金解决。某些网上购物是通过 Amazon 来完成。我们注册了一个新号,这个号下面注册的地址也不是我们的住址,而是位于曼哈顿的一个寄存柜。我们用现金支付时,Amazon 的礼品卡全部都放在那里。我们所做的种种努力,就是要在线上和线下划出明确的界限。

问:用 Tor 来购买婴儿用品,听上去还真是可爱。因为一般我听到 Tor 的用途,都是跟毒贩有关,又或者是人们在用比特币做一些非法交易。对此你怎么看?

答:Tor 这个工具真心了不起,它让我想起来了互联网刚开始的时代。在那个久远的日子里,没有层出不穷的,刺探你隐私的工具和网站,它们不会知道你是谁,正在做着什么。就隐私保护而言,Tor 这个工具真的很重要。它给我安全感。一提起 Tor 就让人想到互联网的阴暗面,这听上去挺有意思,但事实上并不是那么回事。

问:在大数据面前隐瞒怀孕很难吗?

答:这太难了!我从来没想到会这么困难。而且这么做,会非常不现实,以及给你生活带来太多的不便。首先第一点,你的生活成本上去了。用现金来支付,没办法享受各种让人眼红的优惠。第二点,社交平台上,你也会心绪不宁。因为你只要存在于社交平台,就有关注度和存在感。你担心哪一天有人在你的留言板上写一条:“你怀孕了真好,祝福!”这样的话。一写,你的整个隐私保密工作就彻底破产了。有了这样的顾虑,我在社交平台上战战兢兢,不敢多说一句话。第三点,是这种隐秘的生活方式最终会给自己招来更大的麻烦。有哪个普通人会成天用 Tor 来上网?任何交易都用现金结算?这种非正常状态的生活,很快就会被执法部门注意到。幸运的是,目前为止还没有警察敲我家的门。这种极端隐蔽的生活方式真的会招来各种各样的麻烦,所以我不建议各位效仿我,我这么做只是一次实验。

问:你的家人朋友对这次实验是什么反应?

答:他们没人觉得很奇怪,但是在过程中,他们对我所提出的要求,显然理解的不是很到位。比如我说不要把我的怀孕消息放到 Facebook 上,但是亲友们仍然会在网上言谈中透露我的信息。显然,他们并不认为平日里网上的闲谈可以称得上“放到 Facebook 上”。之后你就会发现,你的一举一动,甚至哪怕你不动,而只要你的关系网搭建在平台上,你都是随时随地的被跟踪,被分析,然后系统将结果提供给广告商。你怎么敢保证聊天内容不会被录下来呢?

问:你说你两年前退出了 Google 产品,能给我们具体说说怎么回事儿吗?

答:Google 会阅读你的电子邮件,读取你的聊天信息,它知道你正在搜寻什么。无论你睡着,还是醒着,它都在看着你。从商业角度上考虑,服务器不断的记录你的行为。Google 最近更新了客户隐私保护政策,明白无误的表示它将阅读你的邮件和聊天内容,以便于更好的给你推送有指向性的广告。我当然知道自己没办法改变它。这已然成为了社交生活的一部分。我只能选择放弃 Google 的任何产品来表达自己的不满,算是一种抗议吧。

问:你平日里是怎么保护自己的隐私的?

答:我喜欢 DuckDuckGo。这是非常棒的搜索引擎。你用的越久,你就会发现越来越多的功能。其实隐私保护的根本法则,就是你要将自己的行为分散到各种各样的服务器上,而这些服务器上的数据是不会汇总起来的。所以我同时用 Bing maps ,Apple Maps 以及 OpenStreetMap. 我知道它们都跟踪用户、记录用户信息,但是它们之间相互不待见,不会共享用户信息,所以当你使用越多元化的服务器的时候,隐私保护工作就做的越好。

其实观察这样一个现象你会觉得非常有趣。Google 和 Facebook 阅读你的聊天内容和邮件内容,NSA 也被媒体曝光一些侵犯个人隐私的事。但人们面对这两件事的态度却迥然不同。探寻其原因很有意思。人们对 Google 有好感,是因为 Google 不断变换的 doodle 标志,是午间各种可供消遣的小游戏,以及所谓的"不作恶“的信条。而人们痛恨 NSA ,是因为这是一个侵犯个人隐私的政府组织。同样都是侵犯隐私,只不过因为一个是公司一个是政府,就引出截然不同的态度,这正常吗?其实我不认为这些互联网公司是恶魔。事实上,我有好些朋友在 Google ,Facebook 工作。但不得不承认,他们在宣传上,无论是对内部还是对外,都做的非常棒。比如 Google 的“不作恶”的口号,比如一种你必须随时随地与其他人分享生命中的精彩的道理。这些表述都很能蛊惑人心。是啊,谁愿意做一个孤立的,拒绝分享的人呢?但是,这些站在制高点上的理念真的适合于每个人吗?身为研究互联网技术的社会学教授,我在不断的分析技术层面之下的哲学思想。

问:你真的认为我们所有的信息往来,都逃脱不了大数据的监测?我们绝大多数人是不是还都没有意识到这个问题?

答:我之所以笃信这些信息科技公司会这么做,完全是因为这些架设的服务器是为商业服务的,它的职责就是记住你的所有行为。公司就是凭借这些数据来赚钱的,凭借分析你是谁,你是怎样的人来赚钱。这就是服务器的工作。大部分人只在乎能享受到怎样的服务。你所见到的都只是用户之间的交流,却忘记了交流之下的底层设计!

问:能否有人一辈子躲避大数据?正如你在实验中那样做的一样?

答:我的经历告诉我,这是可能的。但绝不轻松。你需要牺牲很多东西,而且还需要一些技术手段。所以回到之前的话题,我不认为每个人躲避大数据是明智之举。事实上,我认为这个问题并不像是把“开关”打开或者关上一样简单,它不是非黑即白的问题。我做这个实验只是想看看我陷入到互联网究竟有多深。现实点儿来说,我不建议大家这么刻意躲避大数据。我最想跟大家说的是,请各位用审慎的目光去看自己所享受到的互联网服务和产品。这些每天与之打交道的产品到底给你带来怎样的益处?是可有可无的消遣?还是你生活中必不可少的工具?你需要为自己负责,为了享受这些服务,你需要考虑为做出适当的隐私方面的牺牲,多大程度是你能接受的?这些都是你必须考虑的问题。

问:你对未来的展望是什么?会不会咱们完全陷入一个被大公司、大政府所控制的世界,就跟《饥饿游戏》里描述的那样?

答:我认为没那么悲观。我想现在已经到了一个转折点。已经有足够多的人对隐私保护产生重视。这会催生新的技术,对致力于用户隐私保护的互联网新模式的投资。我们需要认真的考虑其他的盈利模型。赚钱难道只能单纯的依靠用户隐私数据收集这一个方式吗?我确信我们可以在互联网这个平台,释放出更多的可能。这是我的最大期望。

来源:Thinkprogress.org

(责任编辑:meng)

时间: 2024-10-24 22:30:41

大数据下的个人隐私的相关文章

大数据下,谁来保护裸奔的个人隐私

有关大数据的段子近来在朋友圈中飞传.段子颇离奇搞笑,但内容大同小异.说有人电话订餐,报上会员卡号,便惊讶地听到其住址和公司.家庭.个人电话等信息.还被告知其胆固醇高,不宜吃海鲜比萨,母亲刚动过心脏手术,也不宜多吃比萨.原来,快餐店联着大数据系统.最吃惊的是,客服对其信用卡已刷爆,当天提款限额已超,此刻的位置信息等了如指掌,令顾客当场晕倒-- 故事虽是段子手的演绎,但反映出大数据时代,个人所有隐私都可能在网上裸奔的尴尬现状.以往,公众大多只关注诸如买房.保险.理财等个人信息易被泄露,但据报道,其实

大数据商业化让个人隐私无处遁形

好莱坞艳照门还在发酵 陈氏艳照门还让人记忆犹新,或许还记忆在一些电脑硬盘里,不论你有没有他都引发过互联网隐私与安全的大讨论. 一波才进入平息阶段,在大洋彼岸的另一波却来势更为凶猛,而此次则是借着移动互联网的大势来袭.这就是轰动一时的好莱坞"艳照门"事件,当世界上最出名的一些女性的私密照片在网上曝光以后,媒体.专家.屌丝都在寻找一个答案,到底是谁泄露了这些"珍贵"的照片. 当最后的结果指向于移动互联网的一个典型产品苹果的iCloud时,我们不免思考在移动互联网时代下,

Informatica孙大山:大数据下的生意经

ZDNet至顶网软件频道消息:目前,很多企业在完成数据收集后,就把这些数据闲置甚至丢弃了,这是非常可惜的,因为数据对于每个企业来说都是非常宝贵的资源.Informatica中国区资深技术顾问孙大山在做客ZDNet直播访谈时表示,"大数据遍布企业的方方面面,它不仅可以帮助企业规划自身资源,对企业内部做到更全面的内视:大数据也可以帮助企业更好地了解用户,通过数据分析推出一些以客户为导向的产品或以客户为针对性的服务." 企业在做大数据项目时需要注意一点,那就是大数据并不是一朝一夕就能完成的工

深扒大数据:关于用户隐私以及企业价值

文章讲的是深扒大数据:关于用户隐私以及企业价值, [IT168评论]如今,业界和学术界一直在讨论一个词,那就是大数据.不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上.然而,大数据挖掘.大数据分析.大数据营销等等事情仅仅只是个开始,对大多数公司来说,大数据仍有很强的神秘色彩.于是,在我们还没有完全搞明白如何运用大数据进行挖掘时,各种过于神化大数据的舆论就已经不绝于耳了.当然,也有很多人直接批判大数据或大数据营销给我们造成的隐私威胁.也有很多人根本没有搞清楚什么是大数据,到底有什么价值.

大数据时代,个人隐私丢哪儿了

3月22日,互联网漏洞报告平台乌云网发布了一则消息:携程将用于处理用户支付的服务接口开启了调试功能,使所有向银行验证持卡所有者接口传输的数据包均直接保存在本地服务器,有可能被任何黑客读取.根据这项报告,漏洞泄露的信息包含用户姓名.身份证号码.银行卡号和类别.卡CVV码.6位卡Bin(用于支付的6位数字).如果有人获得了他人的上述信息,就能轻松完成信用卡支付. 消息一出,在携程网上有过信用卡消费经历的持卡人纷纷表达了自己的担忧,甚至有人主动到银行换卡.在这个大数据时代,个人隐私的相关话题成为热点.

支付宝数据被盗 大数据下这种侵权会否成为常态

中介交易 SEO诊断 淘宝客 云主机 技术大厅 近日曝光了支付宝的李某团队销售支付宝数据达到了20G,其中有超过1000万条数据销售给了凡客,这给互联网上的数据安全又再次敲响了警钟,虽然这次支付宝数据被窃是支付宝自检下发现的,他们的廉政公署还是发挥了作用,没有产生更加严重的后果,再加上支付宝本身有一定的数据加密能力,被盗窃的数据还没有涉及到用户隐私的核心部分,比如身份证.银行卡号等信息,所以其危害性要相对较小. 但是毕竟涉及到用户的数据被盗,关键还是有这么多的买家来购买,这就说明了这个数据市场规

“大数据时代”的美国隐私权保护制度

2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球"大数据"白皮书–<大数据:把握机遇,守护价值>(BigData: Seize Opportunities,Preserving Values)(以下简称<白皮书>),对美国大数据应用与管理的现状.政策框架和改进建议进行了集中阐述.从<白皮书>所代表的价值判断来看,美国政府更为看重大数据为经济社会发展所带来的创新动力,对于可能与隐

【阿里云产品公测】大数据下精确快速搜索OpenSearch

相信做过一两个项目的人都会遇到上级要求做一个类似百度或者谷歌的站内搜索功能.传统的sql查询只能使用like 或者FIND_IN_SET来实现.后者性能稍微好点但是必须要逗号分隔才可以实现匹配.甚至多条件的话还可能用到OR这是极影响系统性能的.        最近公司项目需要.主要是系统查询缓慢.并且查询精度不敢恭维.一开始想到的是Lucene 毕竟是一个开放源代码的全文检索引擎工具包 并且官方还在持续更新中.当时闲暇时间大概搞了将近一个星期的时间.索引的增删查改以及中文分词IKAnalyzer

甲骨文Thomas:大数据下的共存与集成

本文讲的是甲骨文Thomas:大数据下的共存与集成,随着电影碟中谍4在中国的热映,汤姆克鲁兹这个不老的神话又出现在电影荧幕,而就在2月末一个晴朗的下午,数据库届也迎来了"阿汤哥",一位在全世界范围内拥有着众多粉丝的Oracle技术大师Thomas Kyte. Thomas Kyte(以下简称Tom)是AskTom网站背后的老大,目前是Oracle公司核心技术集团的副总裁,从Oracle 7.0.9版本开始就一直任职于Oracle公司,通过自身20多年的经验,一直致力于和Oracle数据