Facebook如何处理大数据

Facebook总是喜欢探索那些没有其他公司涉及过的领域,这可能是因为很少有类似于">Facebook这样的IT公司,可以每天同时为超过9.5亿的注册用户提供有针对性的服务,特别是,他还如此年轻。事实上,没有多少企业可以根据客户的资料了解客户需求,同时制定出有针对性的广告及产品方案,并将这些广告甚至数十种新产品有针对性的卖给客户。

这或许要归功于Facebook的大数据处理能力。Facebook拥有一个清晰的DIY IT方法,他们拥有自己设计的服务器和网络,并设计构建了自己的数据中心,其中大部分应用程序由他们的程序员亲自编写。同时,几乎所有中间软件也是由公司的员工自己创建,所有的IT动作及信息都将在一个庞大的系统中被收集起来。

例如,Facebook的人力资源数据,会计办公室的数据,马克?扎克伯格正在发送电子邮件这一动作,甚至是你在你的笔记本电脑检查你的电脑状态这一动作,这些都会成为数据被记录下来。

“我们所做的一切,归结起来只是一件事,就是大数据处理。”Facebook技术开发副总裁Jay Parikh最近在公司总部接受新闻记者采访时说。

“大数据处理这一问题这涉及到我们每个阶层的员工,关于服务器、存储、网络和数据中心,以及所有的软件,操作和应用工具等,所有这些我们必须提供给用户的服务,都需要有数据的支持,已达到较高的服务质量。”

“大数据就是利用你的洞察力,发现数据背后的潜在价值,并利用它来为你的企业创造利益。” Parikh说,“这个道理非常简单,如果你不能很好的利用在业务中收集和保存的数据信息,那么你拥有的就仅仅是一堆数据而已,我们越来越感兴趣并正在做的,是研究怎样利用收集来的数据做一些更价值的事情。”

Facebook并不完全知道他们收集来的一些数据能做些什么,比如用户列表、Web统计数据、地理信息、照片、故事、消息以及Web链接、视频资料等。“但是我们想收集像是影像资料,这个房间里的温度,谁在大厅里走动等所有信息”Parikh表示。

“我们想知道是谁访问该网站,他们的动态,以及他们在网站的哪个板块活动,所以这一切对我们来说都是有趣的” Parikh说。

(责任编辑:蒙遗善)

时间: 2024-09-19 09:10:17

Facebook如何处理大数据的相关文章

.net与windows服务器是如何处理大数据的?

问题描述 .net与windows服务器是如何处理大数据的? 如题,好多大公司或大的网站平台都换上linux+php了,试问下,有人知道微软的系统以及他们所推崇的 .net是如何支撑大数据和大量用户同时在线的吗? 解决方案 这个问题问得一点也不高明,十分业余和外行.支撑高吞吐量和大规模业务的是高可伸缩性的架构,以及足够多的计算机,足够好的网络,和操作系统没有关系. 换句话说,linux上的程序怎么做,windows也怎么做. 解决方案二: .net 和windows有一个很好的例子StackOv

从Facebook看大数据存储怎么选

最近有位朋友向我咨询技术问题,他们的客户提出一个大数据系统的服务器硬件需求,其中元数据有xxTB左右.并给出了以下初步建议: 节点类型1(元数据节点) Xeon E5 14核CPU x2 256GB DDR4内存 600GB SAS 15K硬盘x5 RAID卡 节点类型2(数据节点) Xeon E5 14核CPU x2 128GB DDR4内存 4TB 7.2K近线硬盘x4 RAID卡 软件并非我擅长的方面,不过大数据概念炒了好几年,从各方面还是多少了解到一些Hadoop/HDFS硬件架构方面的

Facebook的“大数据”到底有多大

据说这是一个"大数据"的时代,到底有多大呢? Facebook最近在总部的一次会议中披露的一组数据可以给大家一个初步的印象,来一起看看每天Facebook上都得处理多少数据吧: 25亿 Facebook上分享的内容条数 27亿 "赞"的数量, 3亿 上传照片数 500+TB 新产生的数据 105TB 每半小时通过Hive扫描的数据 100+PB(1PB=1024TB) 单个HDFS(分布式文件系统)集群中的磁盘容量 FB的工程总监Parikh解释了这些数据对于Fac

腾讯看齐facebook主张大数据和大营销的大社交战略

[硅谷网7月30日讯]"社交媒体的广告现在还是一个没有挖掘的宝藏,这是非常值得我们思考的."在今年3月17日 举行的2012"中国和世界:宏观经济和结构调整"经济峰会上,腾讯董事会主席兼CEO马化腾做了上述的发言. 2个月后的5月18日,腾讯宣布架构重组,将现有业务重新划分成企业发展事业群(CDG).互动娱乐事业群(IEG).移动互联网事业群(MIG).网络媒体事业群(OMG).社交网络事业群(SNG),技术工程事业群(TEG),并成立腾讯电商控股公司(ECC)专注

Facebook谈大数据:光有Hadoop还不够

http://www.aliyun.com/zixun/aggregation/1560.html">Facebook分析主管Ken Rudin表示,Hadoop编程框架可能是"大数据"运动的代名词,但对于公司从大规模存储的非结构化信息中得到商业洞见的需求,Hadoop不是唯一的工具. "有很多普遍的大数据信念需要被质疑,"Rudin说,"问题是,Hadoop是一种技术,但大数据不是关于技术的,大数据是关于业务需求的." &quo

Facebook着力“大数据” 展望未来发展重心

[赛迪网讯]5月11日消息,据国外媒体报道,在回答华尔街分析师的关于Facebook 2013年第一季度利润的问题时,马克·扎克伯格总是反复提到一个主题:Facebook新的大数据能力. 在Facebook第一季度的利润报告中,有六分之三的高点与"大数据"有关,这一趋势意味着,Facebook营销的未来取决于复杂的数据分析,而不是靠输送大量广告来吸引用户眼球. Facebook在第一季度的有关大数据之举如下: -推出了Lookalike Audiences,Managed Custom

中国科学院院士怀进鹏:大数据及大数据的科学与技术问题

第五届中国云计算大会于2013年6月5-7日在北京国家会议中心拉开帷幕.本次大会以国际视野,洞悉全球云计算发展趋势,并从应用出发,探讨云计算与大数据.云计算与移动互联网.云安全及云计算行业应用等焦点话题.大会还特别设立了云计算服务展示区域,交流国际云计算最新研究成果,展示国内云计算试点城市发展成就,分享云计算发展经验,促进全球云计算创新合作. 中国电子学会云计算专家委员会候任主任委员.中国科学院院士 怀进鹏 在第五届云计算大会第二天的演讲上,中国电子学会云计算专家委员会候任主任委员.中国科学院院

科普文:从大数据到Hadoop,Spark,Storm

大数据,官方定义是指那些数据量特别大.数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理.大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V. 大数据中的数据量非常巨大,达到了PB级别.而且这庞大的数据之中,不仅仅包括结构化数据(如数字.符号等数据),还包括非结构化数据(如文本.图像.声音.视频等数据).这使得大数据的存储,管理和处理很难利用传统的关系型数据库去

大数据商机无限 掘金四行业个股

大数据平台是从各种类型的.漫无边际的数据中,快速获得有价值信息的处理方法或框架.大数据中的"大"不是大数据的唯一指标,而是更强调数据的类型多样.处理的速度和获取价值的能力.分析人士表示,大数据对传统行业的重构有望成为中国经济新一轮快速发展的关键推动力,对于A股上市公司而言,IT业.移动互联网.交运和电力安全设备生产商等四类板块受益明显. 网络是大数据重要信源 数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约