Facebook的“大数据”到底有多大

据说这是一个“大数据”的时代,到底有多大呢?

Facebook最近在总部的一次会议中披露的一组数据可以给大家一个初步的印象,来一起看看每天Facebook上都得处理多少数据吧:

25亿 Facebook上分享的内容条数

27亿 “赞”的数量,

3亿 上传照片数

500+TB 新产生的数据

105TB 每半小时通过Hive扫描的数据

100+PB(1PB=1024TB) 单个HDFS(分布式文件系统)集群中的磁盘容量

FB的工程总监Parikh解释了这些数据对于Facebook的意义:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”

目前Facebook有着世界最大的分布式文件系统,单个集群中的数据存储量就超过100PB。在Facebook内部,从一开始就没有在不同的部门之间(比如广告部和用户支持部)设立障碍或者分割数据。这样一来产品开发者就可以跨部门获得数据,实时知晓最近的改动是否增加了用户浏览时间或者促成了更多的广告点击。

作为普通用户,大家也许会对如此海量的数据心存不安,担心自己的数据被随意浏览。对此Facebook表示有各种防范措施来防止此类事情的发生,比如所有的数据读取记录都会被存档,哪些人看过哪些数据都是记录在案的;如果有员工越线,会被直接开除。Parikh着重强调:“在这件事上我们的政策是零容忍。”

时间: 2024-11-10 00:03:56

Facebook的“大数据”到底有多大的相关文章

大数据到底是不是“算命”?技术大牛们这样说

TBO(旅游商业观察):"如果你只有一堆人的电话号码,这可能没多大意义.但像携程的数据,比如所有人提前预订.搜索.浏览.点评的信息等,这就是有价值的.但更深层的核心是,你能不能在某个产品上使用到这些数据,而且确实有帮助."众荟数据智能事业部总经理焦宇对TBO(旅游商业观察)说. 美团云大数据平台负责人对此表示认同,"首先要弄清楚拥有的数据是否有价值,是否有人愿意为其买单.另外则是源数据的丰富度,是否能够为数据价值的发挥带来补充和完善". 显然,数据收集的目的并不单单

人工智能时代 云和大数据到底有多重要?

60年前的某个夏天,麦卡锡.明斯基等年轻的科学家们举办了一次聚会,共同研究用机器模拟智能的问题,也是在那时,"人工智能(AI)"的理念正式被提出.如今,人工智能已经应用于语音识别.图像处理器.计算机视觉.机器人等多个领域,甚至击败了围棋九段李世石,这种进步是难以置信的.而这一系列成绩的背后,是海量数据的积累与学习,在没有云的时代,是无法想象的. 人工智能时代 云和大数据到底有多重要?(图片来自The Huffington Post) 人工智能涉及的领域非常广泛,工业.航天.商业都有应用

2016年大数据到底还算不算个 “东西” (附2016 大数据版图)

原文编者注:原文是 FirstMark Capital 的 Matt Turck 的文章.本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但是大数据分析与应用才刚刚开始兴起,在与 AI.人工智能等新兴技术的结合下,大数据的机会也许要比大家想象的还要大. 在喜新厌旧的技术初创企业界,已有 3年 历史 "大数据" 听起来似乎已经过气了.虽然 Hadoop 在 2006年 已经出来,但 "大数据" 这个概念大概是在 2011 到 2014年

大数据到底怎么学:数据科学概论与大数据学习误区

"数据科学家走在通往无所不知的路上,走到尽头才发现,自己一无所知."-Will Cukierski,Head of Competitions & Data Scientist at Kaggle 最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题.由于大数据技术涉及内容太庞杂,大数据应用领域广泛,而且各领域和方向采用的关键技术差异性也会较大,难以三言两语说清楚,本文从数据科学和大数据关键技术体系角度,来说

大数据到底能干嘛?小数据你造吗?

互联网思维.大数据无疑是现在互联网圈里最火,也是最能招人眼球的2个词语,但是,什么是互联网思维,什么是大数据,各家也有各家的看法,怎样能更好的利用大数据更是人们热议的话题,哪大数据到底是什么呢?有幸听到了中国著名的网络数据分析的专家,宋星老师 的演讲说道了大数据的未来! 一.大数据的形成 互联网精神是什么,是开放.创新!互联网精神促使了互联网的快速发展壮大,随之而来的就是互联网信息数据的大爆炸,使得信息离散程度扩大!未来大数据的发展方向:去技术化,就是通过技术手段让使用大数据的人感觉不到大数据的

大数据到底怎么影响我们的生活

信息大爆炸的今天,不讨论大数据这个话题似乎就是跟不上时代.从医药到教育,再到其他各个领域,大数据充斥着现代社会的每个角落.而我们最关心的还是大数据最终将以什么样的形式,怎么样影响甚至改变我们的生活.来听听四位专家告诉你大数据到底有多少可能. 丹·瓦格纳 Dan Wagner Civis Analytics 的创始人兼首席执行官 你曾经说过,希望用大数据解决全球最大的问题.你最想解决的问题是什么? 我们主要关注两个领域:教育和健康.在教育领域,我们专注于利用个人层面的数据,帮助客户发现那些申请和注

对话美国科学家,大数据到底怎么影响我们的生活?

大信息大爆炸的今天,不讨论大数据这个话题似乎就是跟不上时代.从医药到教育,再到其他各个领域,大数据充斥着现代社会的每个角落.而我们最关心的还是大数据最终将以什么样的形式,怎么样影响甚至改变我们的生活.来听听四位专家告诉你大数据到底有多少可能. 丹·瓦格纳 Dan Wagner Civis Analytics 的创始人兼首席执行官 你曾经说过,希望用大数据解决全球最大的问题.你最想解决的问题是什么? Dan Wagner:我们主要关注两个领域:教育和健康.在教育领域,我们专注于利用个人层面的数据,

“张冠”不能给“李戴 ” 大数据到底是谁的?

当你在家看着精彩的世界杯,手边缺德国原装啤酒的时候,1号店为你免费送货上门,这是你想要的服务,急消费者所及,供消费者所需.但是否考虑过你的需求是从何分析的?一旦你的数据被转售给其他企业你又是作何感想? 中美创新链接--大数据专题研讨会圆桌讨论 伴随着大数据的兴起,又有谁考虑过背后的归属权问题?这是上周参加由中美创新协会主办的中美创新链接--大数据专题研讨会中的一个圆桌讨论环节. 大数据是谁的数据? 正如华院数据创始人宣晓华所言,消费者可以接受的是,企业运用自己的个人数据来改善对我的服务,但是一旦

大数据到底是什么?

如果用非IT类媒体的报道次数或关注度,来去衡量一个IT词汇的热度,我相信"大数据"绝对可以算得上是当前最热的IT词汇,云计算肯定不是它的对手. 大数据之所以这么火热,是因为它与普通大众的生活之间,相较其他IT术语似乎有着更为重大,或者说更具传奇色彩更为深厚的关系.从定向营销,到助力美国总统大选,大数据迅速披上了神奇的外衣.而也正是因为它对于人类生活的这种显性的影响力,让它成为了每个生活于信息世界中的人,或多或少都要关注的方向. 仅以企业与客户者之间的关系而言,企业主希望借助大数据来分析