Facebook：一种创新数据中心网络拓扑结构

Facebook位于衣阿华州阿尔图纳的数据中心的空中鸟瞰图

Facebook的数据中心每天要收到多达数十亿次的用户请求;随着这家公司不断添加成员，推出新的功能特性，请求数量在不断增加。这一切对Facebook来说基本上是好事，可是对Facebook的网络工作人员来说却是个挑战。比如说，五个月前还能满足要求的数据中心拓扑结构现在已不堪重负了。

所以除了构建大型数据中心(比如位于衣阿华州阿尔图纳的这个数据中心)外，Facebook的工程师们还在不断优化数据中心的网络设计。话虽如此，用调整和改动来形容工程师们提出并在阿尔图纳数据中心落实的的设想想法可能并不恰当，更像是他们重新编写了网络设计指南。

旧的Facebook网络

在阿尔图纳数据中心兴建之前，Facebook的工程师们将数据中心的服务器机架排列成集群，类似图A中所示的架构。在实际环境中，Facebook不是只有三个机架，而是会有数百个机架。另外该图还显示了每个机架的架顶式(TOR)交换机，架顶式交换机在服务器和上游聚合交换机之间充当中介。

图A：架顶式(TOR)――网络连接架构

这种架构很管用，但是却给Facebook的工程师们出了几道难题。Facebook的网络工程师Alexey Andreyev解释：“首先，集群的大小受到集群交换机端口密度的限制。想建造最庞大的集群，我们就需要最庞大的网络设备，而那种设备只有一批数量有限的厂商才有售。另外，一个设备中需要这么多的端口与提供带宽最高的基础设施这种愿望相悖。更为困难的是，如何在集群大小、机架带宽和集群外面的带宽之间保持长期的最佳平衡。”

Fabric：新的网络拓扑结构

工程师们将每天那些数十亿次请求视作一种激励，决定摈弃复杂的、很耗带宽的自上而下的网络层次体系，改而换成一种新的设计，名为Fabric。图B中的幻灯片描述了新的服务器机架集群，名为pod。单单一个pod包括48个机架和架顶式交换机，架顶式交换机相互连成四只fabric交换机。“每只架顶式交换目前有4条40G上行链路，为用10G连接的服务器机架提供了总共160G的带宽容量。”

图B

这种设计方法具有下列优点：

•易于部署拥有48个节点的pod

•可扩展性得到了简化，而且没有限制

•每个pod都一模一样，都使用同样的连接

下一步是连接所有fabric交换机――图C中的幻灯片描述了这项任务是如何完成的。Andreyev表示，这个比较简单(难以想象它曾经是什么样子)。

图C

Andreyev解释，Facebook的工程师们在增添主干交换机时恪守48个节点这一原则。“为了实施覆盖整个大楼的连接，我们建立了主干交换机组成的四个独立‘平面’，每个平面里面最多可以扩展到48个独立设备。每个pod的每只fabric交换机都连接到本地平面里面的每只主干交换机。”

Andreyev接下来提到的数字大得惊人。“pod和平面共同组成了一个模块化网络拓扑结构，它能够容纳数十万台用10G连接的服务器，可扩展到数千万亿位的等分带宽，为我们的数据中心大楼提供非超额订购的机架到机架性能。”

网络运营

从架顶式交换机到网络的边缘，Fabric网络设计统一使用“第3层”技术，支持IPv4和IPv6，并且使用等成本多路径(ECMP)路由。Andreyev补充说：“为了防止偶尔出现的‘长流’(elephant traffic)大量占用带宽，导致端到端路径性能下降，我们让网络具有多种速度――所有交换机之间使用40G链路，同时通过架顶式交换机上的10G端口来连接服务器。我们还有服务器端机制，以便万一出现问题，可以绕过故障处。”

物理布局

Andreyev写道，图D中所示的新大楼布局与Facebook之前的设计区别不是很大。一个区别是，将Fabric新的主干交换机和边缘交换机放置在数据大厅X和数据大厅Y之间的第一层，并让通向外界的网络连接(最小入口点，即MPOE)跨越主干交换机和边缘交换机时代。

图D

克服挑战

Facebook的工程师似乎已克服了面临的挑战。硬件的局限性不再是个问题。不但减少了不同部件的数量，还降低了复杂性。Andreyev表示，技术团队奉行了“KISS(力求简单)”原则。他在文章的结尾处补充道：“我们新的fabric不是这种方法的一个例外。尽管这种拓扑结构规模庞大、样子复杂，但它其实是个高度模块化的系统，有许多重复部件。它很容易自动化和部署，而且运营起来比数量更少的一批定制集群还要来得简单。”

作者：布加迪编译

来源：51CTO

时间： 2025-01-27 16:33:43

Facebook：一种创新数据中心网络拓扑结构的相关文章

Facebook的下一代数据中心网络

498)this.width=498;' onmousewheel = 'javascript:return big(this)' height="709" alt="" src="http://s6.51cto.com/wyfs02/M00/53/88/wKioL1RqtW6zrTnyAACcKVu8WDo093.jpg" width="620" style="width: 505px; height: 299px

Facebook十亿美元打造全球数据中心网络

目前,http://www.aliyun.com/zixun/aggregation/1560.html">Facebook已经在基础设施投资10亿美元以上,而这些网络正在为全球各地8.45亿用户提供服务.该公司在2011年共花费了6.06亿美元,用于服务器.存储.网络设备和数据中心的建设,而预计今年将再花费5亿美元,这是Facebook在周三的首次公开发行股票时提交文件中的透露. 该公司表示,服务器和存储的庞大舰队必须无缝地协同工作,为用户提供每一个Facebook页面. 载入用户的主页

云数据中心网络架构是怎么融合的

如果仅从字面上,数据中心融合网络架构还是不那么容易理解的,融合本身就是一个热词,很多场合都在使用,从三网融合.技术融合到存储融合,到处都在融合,那么,所谓的融合网络又是什么? 抛开对融合网络架构定义的追究,我们不妨看看数据中心发展,特别是云计算应用给数据中心网络带来的问题. 如今超大数据中心比比皆是,从Google到Facebook,数据中心规模之大令人瞠目.在国内,百度数据中心也有至少几万台服务器.几千台交换机,而数据中心管理人员只有几十人,管理如此规模设备,对网络部署自动化的要求比较高.

小扎曝Facebook北极数据中心图片最先进数据中心都建在哪？

◆ ◆ ◆ 导读 Facebook CEO马克·扎克伯格昨日很难得的放出了Facebook位于北极数据中心Luleå的图片. 该数据中心位于北瑞典的森林,这里低温和靠近河流的天然优势能够有效为数据中心的运转节能提效.Luleå数据中心的规模相当于6个足球场,中心通过巨型风扇引入户外的自然冷风为成千台设备降温. 扎克伯格在自己的Facebook主页还提到:"你在Facebook上与朋友互动的时候可能不会联想到Luleå的存在,但是它的确是使用复杂的科技基础设施来保证全球联系的典型例子.我希望将来可

为云准备新数据中心网络释放代码数据

本文讲的是为云准备新数据中心网络释放代码数据,IT标准化和商品化的后果之一是谷歌的数据中心是计算机对世界的看法.在所有计资源中,包括CPU,内存,存储都是可替代的.无论独立的位置,还是配件它们是可以互换的.未来,PC将失去失去主导地位,仅仅成为IT服务的一部分. ▲数据中心网络架构图访问失败已经是商业数据中心的最糟糕表现,引起这个问题的原因源于现在的网络结构状态上更容易搭配.MapReduce的著名代码也正因为如此而存储到各个节点. 网络环境的变更和假设条件的改变,将驱动软件基础架构驱动

Facebook开源技术CTO John Kenevey：Facebook开源数据中心

第六届中国云计算大会于2014年5月20-23日在北京国家会议中心拉开帷幕.本次大会立足实践,以国际化的视野,帮助与会者了解全球云计算技术的发展趋势:从应用出发,探讨交通.医疗.教育.金融.制造.数字娱乐等行业领域的实践经验:并通过技术专场.产品发布和培训课程等方式,深度剖析云计算大数据的核心技术. Facebook公司开源技术CTO John Kenevey 在第六届中国云计算大会主体会议,最后一个演讲来自Facebook公司开源技术CTO John Kenevey,他为大家分享的主题是"Fa

MIT研究人员称他们解决了数据中心网络延迟问题

一组MIT研究人员研发出一套新的数据中心网络框架,声称能解决数据中心网络延迟问题.被称为Fastpass的系统是一种中心化的零队列数据中心网络,能对包传输的时间和网络路径进行细颗粒度的控制,它使用一个中心化的仲裁器从整体上对网络进行分析,根据分析作出路由决定. 在Facebook数据中心的试验显示,一个Fastpass仲裁器仅仅是一8个核心就能管理每秒2.2Tb的数据传输.

Facebook公开数据中心令谷歌蒙羞

facebook 导语:美国科技博客BusinessInsider撰稿人马特·罗索夫(Matt Rosoff)今天撰文称,Facebook公开数据中心设计的目的是让谷歌最核心的资产成为普通商品,借此打击谷歌,甚至令其蒙羞. 以下为文章全文: 当一家公司以"开放"自夸时,要搞清它的真实目的,最好的方法就是找到一家与它从事相同业务且封闭的竞争对手. 尽管笃信者一直在辩解,但"开放"的确是包含着一定的商业目的:这是一种从竞争对手主导的市场中挖掘价值的好办法. 先来回顾两个

数据中心网络变革因云而起

云计算基础设施的关键技术包括服务器.网络.存储和数据中心的其他相关技术.近几年服务器.存储等部分都取得了很多的改进,比如服务器计算到虚拟计算,虚拟存储的演进等.反观数据中心网络的发展,却略显力不从心.但这样的力不从心正在得到本质上的改善.云抽象化的可以看做一个庞大的网络系统,在云内包含上千甚至是上万台服务器,而虚拟化技术的普遍应用使得实际网络节点的数量更加的巨大, 所以用于连接云数据中心内部和云数据中心间网络成为实现计算和存储能力的关键环节.因为企业在迈进云计算的过程中,选择服务器虚拟化以提升效

猜你喜欢

破解阿里云论坛的快照时间迷局或涉足所有phpwind论坛

早前笔者在站长之家的SEO综合查询项里查询自己网站的数据的时候,顺道把阿里云论坛的网址也进行了查询,当时发现百度给阿里云论坛的快照是2011年5月24日,当时就觉得情况不对,但也在想或许是百度短时间的 ...

妙用VBScript自制IE工具栏按钮

vbscript|按钮 IE工具栏上的各种按钮可不是Microsoft的专利,普通用户一样能够对其进行自定义,添加想设置的按钮,至于添加的方法,很多资料上都介绍过.具体的实现方式不外乎两种,一是使用冗 ...

走进Linq-Linq to SQL源代码赏析之Provider的初始化

话说Linq to SQL理论上应该支持多种数据库的,而且应该支持多种数据库, 到最后却落的这个局面,是为了商业考虑还是本来技术就不成熟?不得而知.不过不管怎么说Linq to SQL的体系结构确实 ...

算法题：HDU 3336 Count the string(经典，KMP+DP)

链接: http://acm.hdu.edu.cn/showproblem.php?pid=3336 题目大意: 给一个字符串,求出这个字符串的所有前缀出现的次数之和. 分析与总结 : 运用到了dp的 ...

ubuntu怎么选择最快的更新源?

ubuntu怎么选择最快的更新源? 1.打开设置>>软件和更新,如下图 2.下载自:下拉菜单,选择其他站点 3.你可以选择最佳服务器,也可以指定你满意的服务器.选择之后要求输入密码 4 ...

PS制作山水国画

只要对Photoshop进行认真系统地学习,熟悉其各个工具的作用,通过组合运用,发挥想像力,也可以将传统美术的创作意图表现出来. 这里我们提供了一种用Photshop画国画的实例,供大家参考. 1.完 ...

360安全卫士全部工具里的工具点击无反应

最近有很多用户反应说打开360安全卫士中的全部工具,但是里边的各种小工具打不开,其实西西在这里要告诉各位哦,你可能是使用过伪装成木马的小马激活工具,不过别担心,下面小编就来教教大家怎么解决360安 ...

Lightroom超详细人像皮肤柔化教程

分析原图用这个小案例来讲解[调整画笔]常用的方法.[调整画笔]只需要在图片中的某一个局部的区域进行调整,我们可以用[调整画笔]把这些区域选择出来,然后通过调整各项参数做一个针对性的调整.这张图片 ...

C#命名空间与java包的区别分析

C#命名空间与java包的区别分析这篇文章主要介绍了C#命名空间与java包的区别,较为详细的分析了C#命名空间与java包的相同点与不同点,非常具有实用价值,需要的朋友可以参考 ...

javascript实现博客园页面右下角返回顶部按钮

这篇文章主要介绍了使用javascript实现博客园页面右下角返回顶部按钮的思路及源码,非常不错,这里推荐给小伙伴们博客园中很多博友的博客中在Page右下角都有个图标,不论屏幕怎么拉伸,都 ...

怎么运用Win7中的上帝模式

Windows 7系统中隐藏了一个秘密的"God Mode",字面上译为"上帝模式".用户咨询如何进行设置GodMode模式.如下图所示: 解决方案首先你 ...

Wi-Fi和云计算将消灭机顶盒市场

思科最近传出将出售Linksys,而Google也正在兜售摩托罗拉的机顶盒业务,这些都预示着面向消费者的机顶盒市场正酝酿巨变. 未来几年,消费者的家庭娱乐系统将发生巨大变化,电视下面的盒子数量会减少, ...

怎么样称得上是Linux下优秀的命令行计算器

怎么样称得上是Linux下优秀的命令行计算器每个现代的Linux桌面发行版都预装着一个带有图形界面的计算器程序.不过如果你的工作区中全是命令行窗口,那么你一定会在其中的一个命令行窗口中处理一些数字相 ...

学习centos之快速搭建LNMP环境

以前在centos下安装软件都是喜欢源码安装,不过昨天因为一个事情需要一个centos 下的LNMP环境.反倒不会搞了,今天特意记录下,以备后续使用. 一.安装nginx 我们先来安装nginx,如下 ...

游戏被下架,重新上线怎么做?

近日,有媒体报道出国内某家CP的产品被苹果从App Store上下架,其原因或因涉嫌刷榜.联想到近日苹果对于刷榜.积分墙等行为的打击.不由得令小编有些唏嘘. 不过,小编并不想站在道德高地去指责任何人. ...

Gmail遭遇故障用户信息可能全部丢失

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅新浪科技讯北京时间12月29日消 ...

BT亚太总监Neal Gerber：动态网络服务让企业达成服务成本与用户体验的平衡

由天地互连.下一代互联网国家工程中心主办的"2017全球SDNFV技术大会" (2017.chinasdn.org)于 2017年8月2-3日,在北京国宾酒店火热开幕.在3日上午的 ...

javascript-关于JS checkedbox 选择的问题

问题描述关于JS checkedbox 选择的问题 $(function (){ $(""tr"").click(function () { if($(thi ...

Linux性能优化1.1　常用建议

摘要性能追踪建议没有远见和规划,这样解决性能问题是痛苦的.产生问题的原因一次又一次从指尖溜走,不仅浪费时间并且让你备感受挫.但是,如果按照正确的步骤,就可以把令人沮丧的性能追踪转变为有趣的侦探故事 ...

招聘iOS开发，老板必问的5个问题 - 所以常规招聘开发老板都不出面

招聘iOS开发,老板必问的5个问题 iOS开发和许多其他软件亚文化一样,起源于少数开发者,但从2008年苹果对外发布SDK,供第三方应用开发者开发iPhone.iPad等iOS应用开始,iOS应用开发 ...

mvc-除了刷新页面，怎么在View刷新ViewBag 和ViewData 的值。

问题描述除了刷新页面,怎么在View刷新ViewBag 和ViewData 的值. MVC的Controller的ViewBag 和ViewData 可以传到View使用.但是怎么刷新他们的值呢解 ...

融合蓝牙与IoT 拓展Wi-Fi商业价值

互联网时代,传统的购物模式正在发生改变,越来越多的消费者更倾向于通过网络完成购物,这给传统商业的运行方式带来了新的挑战.商家不得不寻找各种途径来增加线下消费的客流量.随着Wi-Fi逐渐普及,顾客也习惯 ...

深入浅出剖析C语言函数指针与回调函数(二)

上一篇博文的地址: http://blog.csdn.net/morixinguan/article/details/65494239 这节,我们来看看函数指针与回调函数在Linux内核中的应用. 从 ...

零售银行如何玩转大数据

本文主要涵盖以下内容: 为现有顾客提供私人订制产品欺诈情况的早期侦测以及欺诈风险的转移针对产品取消与客户流失的预测 ATM机和银行网点中现金分配的最优解决方案昂贵银行渠道使用的最小化评估债务产 ...

为app提供api，架构该怎么设计，需要考虑高并发，访问量比较大。

问题描述有个项目需要重构:原来一个java后端服务的项目,用的是简单的servlet和JDBC 为 android app 提供的api,并发访问通过单例.线程池和多线程.缓存做的.现在相对这个项目 ...

Shell脚本实现查杀子进程、僵尸进程_linux shell

核心服务器上跑了一堆的脚本.程序,难免有时候会出现僵尸进程,死不死活不活的在那里占用资源,最初只是写了个根据关键字查杀进程的linux shell脚本,后来发现很多时候进程死在那里的时候其实是内部调用 ...

图片-HTML 基本问题求解答呀

问题描述 HTML 基本问题求解答呀今天自己弄这个HTML (小白大神勿怪)弄个网页想实现就是点击图片后在右边显示这张图片的大图效果如下但是发现两张图都点过之后就变成上下排列啦前一张图不 ...

visual studio 2013-vs2013安装错误可有解决之道？

问题描述 vs2013安装错误可有解决之道? 如图指定的信任提供程序不认识或不支持使用者的指定格式 win8.1 x86 +vs 2013 ultimate 解决方案是不是系统环境有问题了

一个我无法解决的问题! 请各位高手指点(救急)

问题描述我要实现在datagridview中我要有用户名用户密码用户类型(COmbox类型的)这些数据都是数据库中的不用我要在datagridview中直接添加新的记录按保存后写入数据库刚开始的初始 ...

90后齐俊元：独自写了22万行代码，每周工作100小时

8月16日,"腾讯产品家沙龙:90后企业家专场"在杭州举行,本文是Teambition CEO齐俊元的分享内容. 项目协作工具Teambition,帮助中小创业团队.研发机构.教育 ...

热搜