Facebook大数据:兴奋与恐惧同行?

Facebook, 这个在世界范围内拥有1200亿用户的流行的社交网络,由于其拥有的巨量数据,已经成为一个大数据天堂。

 

我们这些Facebook的用户们愉快的喂养着这个大数据的野兽,每天发送100亿的Facebook消息、点击45亿次“赞”、上传3.5亿新照片。整体而言,Facebook上有170亿地点标记,以及2500亿的照片,这个数量是惊人的!

 

所有这些信息都意味着,Facebook知道我们长什么样子,我们的朋友有哪些,我们关于大部分事物的观点如何,我们的生日是几号,我们是否在恋爱中,我们在哪,我们喜欢什么不喜欢什么,等等等等!这对很多商业公司来说是非常巨大而有力的信息!

 

作为一个帮助公司获取大数据的专业工作者,笔者敬畏Facebook正在创造的大数据金矿。笔者相信,即使我们现在停止使用Facebook,这家公司也拥有足够未来几年使用的数据来研究我们(他的用户)。历史上没有哪家公司如同它一般拥有关于如此详尽的个人信息!同时笔者也相信,除了Google可能与之抗衡之外,这个星球上不会有另外一家公司能够拥有接近Facebook水平的大数据!

 

当然,Facebook已经很敏锐的意识到了这一点,并且他们的整个商业模式也是基于如何更加有效的利用他们的大数据。我们越多使用Facebook,他们也就会越了解我们,而他们拥有的数据信息也就将会更有价值。Facebook现在正在大力投资收集、存储以及分析用户提供的数据,但是他们对数据的渴求并没有止步于此!

 

Facebook超越了简单的用户数据分析和数据挖掘。“今日美国”揭示了Facebook如何通过网络跟踪用户。通过使用“追踪cookies”,Facebook可以收集你所访问的任何网站的信息。这意味着,当你登录到Facebook并且浏览其他网页时(即使这个网站与您在Facebook的活动完全分开),Facebook依然知道您在浏览什么网站。

 

Facebook还投资了图像处理和“人脸识别”功能,这将使得Facebook可以“跟踪”你,因为它可以通过你分享的照片知道你和你的朋友们的长相!同理,它就可以通过搜索整个网络来找到你和你的朋友们!

 

人脸识别技术允许Facebook对你上传的照片使用“标签建议”,但是,它能做的远远不止如此,是超乎想象的。试想一下Facebook将如何使用电脑算法来跟踪你的身形!他们可以分析你分享的最近在海滩的照片来发现你是否变胖了。然后,他们就可以将这个信息卖给减肥俱乐部,而这些减肥俱乐部就可以在你的Facebook页面投放广告!可怕么?!

 

不仅仅如此!最近的一项研究表明,通过分析一个人在Facebook点“赞”的数据就可以预测一系列高敏感的个人特性。这份由剑桥大学和微软研究院进行的研究显示了如何使用Facebook是的“赞”来精确预测你的性取向,生活满意度,宗教信仰,情绪稳定性,是否饮酒或吸毒,情感状况,年龄,性别,种族和政治观点等等。有趣的是,那些“揭示性”的“赞”往往没有或者只是很少有它所预测的属性,并且通常一个“赞”就足以产生一个精确的预测!

 

笔者对Facebook使用用户数据有一个大的忧虑:它不是通过一个真正透明的方式进行!他们一直借口到:这些对数据的使用都被用小字阐述了。但是我们又有多少人在注册一个网页的时候会去读那些小字呢?并且当Facebook更新他们的隐私政策的时候,我们又会不会去重新读一遍呢?答案是:“不”!

 

看起来大部分Facebook用户同意笔者的看法,但是其中有两个人觉得Facebook已经做的太过了:他们扫描用户的私人邮件内容!金融时报今日揭露,Facebook受到了集体诉讼。来自阿肯色州的用户马修·坎贝尔和来自俄勒冈州的迈克尔·赫利已经代表1.66亿Facebook美国用户提出对Facebook的诉讼!这项指控提出Facebook在未经用户事先同意的情况下扫描用户通过Facebook平台发送的私人电子邮件违反了电子通信隐私法。

 

这里的问题是,“私人”消息在大部分用户看来是隐私的!指控提出Facebook识别出私人信息中包含的网站链接(URL),然后搜索这个网站来配置用户信息。在指控中坎贝尔和赫利说:“让用户认为Facebook消息是隐私的为Facebook提供了特殊的赚钱机会,因为那些认为他们在一个无监督的服务器上交流的用户很可能会泄露一些当他们知道被监测时不会谈论的信息。”

 

以为Facebook发言人在Bloomberg说,这些指控是没有根据的,而Facebook讲积极为自己辩护。他们当然会这么说! Facebook现在的麻烦是如何平衡为客户以免费社交网络平台形式提供服务与股东利润之间找到平衡点,特别那些关于销售用户数据和通过大数据洞察广告投放方法的利润。

 

对于笔者来说,Facebook(以及许多其他的公司,包括Google,Yahoo)都试图以某种方式隐藏它们分析和挖掘用户数据的程度。用户需要更多的透明度!比如让用户对自己的数据是否可用进行控制! 这种透明度的提高将会有助于重建国家安全局揭露大数据分析造成的声誉受损。

 

您又有什么感想呢?当你知道Facebook知道你的一切,并且可以利用和出售这些信息的时候,你是否会觉得可怕呢?这又是否使得Facebook非常强大呢?请分享您的观点!


原文发布时间为:2014-02-23


时间: 2024-09-22 00:36:10

Facebook大数据:兴奋与恐惧同行?的相关文章

Facebook大数据释放的新机会

前几天,人们对Facebook将推出什么新产品多有猜测. 现在答案揭晓了. Facebook周二(1月15日)在门罗帕克总部召开新闻发布会,CEO马克·扎克伯格宣布推出Graph Search(图形搜索)工具. Graph Search 这是Facebook自2012年5月上市以来推出的最重要产品,它区别于普通搜索的突出特点是:这是一款与用户密切相关的搜索.它是Facebook对10亿名用户.2400亿张照片和1万亿次页面访问量作出的回应,这个工具旨在向用户提供有关人.照片.地方和兴趣(这也是与

Graph Search,Facebook大数据释放的新机会

前几天,人们对Facebook将推出什么新产品多有猜测. 现在答案揭晓了. Facebook周二(1月15日)在门罗帕克总部召开新闻发布会,CEO马克·扎克伯格宣布推出Graph Search(图形搜索)工具. Graph Search 这是Facebook自2012年5月上市以来推出的最重要产品,它区别于普通搜索的突出特点是:这是一款与用户密切相关的搜索.它是Facebook对10亿名用户.2400亿张照片和1万亿次页面访问量作出的回应,这个工具旨在向用户提供有关人.照片.地方和兴趣(这也是与

探访Facebook大数据团队

文 晴然/搜狐IT驻硅谷记者 导语:造么,你的'情感'被FB这么玩弄. 要不是几天前一篇学术报告引发的隐私风波,13亿Facebook用户中应该没几个知道,社交老大内部一直有个神神秘秘的'数据科学团队'(Data Science Team). 在2012年间,有整整70万用户在完全不知情的情况下,被Facebook进行了为期一周的情感测试.测试内容很好理解:Facebook在测试对象的页面上'人为'地设置了一些正面或是负面的情感关键词,同时控制大家在自己的News Feed中阅读到的内容,之后收

Facebook大数据:每天处理逾25亿条内容和500TB数据

当地时间今日,http://www.aliyun.com/zixun/aggregation/1560.html">Facebook在加州总部向几位记者透露了一些关于"大数据"的统计数字,诸如Facebook系统每天要处理25亿条消息.500+ TB的数据.用户点击Like按钮的次数达到27亿次.上传3亿张照片.每半个小时扫描的数据大约为105TB.另外Facebook还首次透露了新项目"Project Prism"的有关细节. Facebook基础

Presto 0.175 发布,Facebook 大数据查询引擎

Presto 0.175 发布了,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别.据称该引擎的性能是 Hive 的 10 倍以上. Presto 可以查询包括 Hive.Cassandra 甚至是一些商业的数据存储产品.单个 Presto 查询可合并来自多个数据源的数据进行统一分析. 部分更新如下: 将 mongodb.connection-per-host 配置选项重命名为 mongodb.connecti

Presto 0.179 发布,Facebook 大数据查询引擎

Presto 0.179 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别.据称该引擎的性能是 Hive 的 10 倍以上. Presto 可以查询包括 Hive.Cassandra 甚至是一些商业的数据存储产品.单个 Presto 查询可合并来自多个数据源的数据进行统一分析. 更新内容: 新增基于文件的全局安全性,可以使用 "etc / access-control.properties"

Facebook着力“大数据” 展望未来发展重心

[赛迪网讯]5月11日消息,据国外媒体报道,在回答华尔街分析师的关于Facebook 2013年第一季度利润的问题时,马克·扎克伯格总是反复提到一个主题:Facebook新的大数据能力. 在Facebook第一季度的利润报告中,有六分之三的高点与"大数据"有关,这一趋势意味着,Facebook营销的未来取决于复杂的数据分析,而不是靠输送大量广告来吸引用户眼球. Facebook在第一季度的有关大数据之举如下: -推出了Lookalike Audiences,Managed Custom

大数据是犯罪现场调查员 机器学习是警察

机器学习提供大数据分析欠缺的防护功能.大数据搞定数据泄露发生的原因,机器学习则是在泄露发生时就识别出来. 网络安全专家看到大数据兴奋得双眼放光,因为这就是数据科学界的CSI(犯罪现场调查).如果公司被黑,客户信息被泄,可以使用大数据技术从公司各系统.用户和客户身上收集大量信息,让数据分析师得以据此得出哪里出了纰漏的洞见. 但是,虽然大数据可以在事后帮助解决案子,却无益于第一时间防止案件发生.数据泄露的遗留影响依然有待解决:愤怒的客户.HIPAA和 PCI DSS之类的数据隐私标准合规问题,甚至政

大数据妙用:Facebook 绘出同性婚姻合法化支持热度图

美国时间 6 月 26 日晚,美国反同性恋婚姻的<联邦婚姻保护法>被判违宪.随后,http://www.aliyun.com/zixun/aggregation/1560.html">Facebook 的消费者内容经理 Alex Walker 和数据编辑 Robert D'Onofrio 在 Facebook 新闻直播间发文,展示 Facebook 大数据处理所得的 Facebook 用户对于该事件的反应. 美国人口 3.15 亿,Facebook 有 1.67 亿美国用户.根