Facebook下一代数据存储只宕机5分钟

自2010年将SMS、chat、email及Facebook Messages整合到1个收件箱后,我们就开始使用HBase。自此之后,社交巨头Facebook就一直扩展这个基于HDFS的分布式键值存储系统以满足自己的业务需求。基于其高写入和低随机读取延时,那个时候HBase被选择作为Messages平台的潜在持久数据存储系统。此外,HBase还具备一些其他优点,比如纵向扩展、强一致性以及自动故障转移带来的高可用。从那时起,Facebook就开始重度使用HBase,比如Messages这样的在线事务处理以及一些经常用到在线分析的地方,当下HBase已用于内部监视系统、Nearby Friends功能、索引查询、流数据分析以及为内部数据仓库抓取数据。

HBase可靠性

在Facebook通常会出现这样一个情况,选择一个潜在满足需求的技术堆栈,然后不停的去优化。对于Facebook来说,可靠性尤为重要,而当下我们使用HBase需求面临的挑战是单主机失败、机架级故障以及密集存储之间的细微差别。解决这些方法的途径之一就是使用主从设置,在两个集群之间做异步更新。然而,这样做的话,我们需要面对集群级别的故障转移,如此主从故障转移将会花费数分钟的时间,而异步操作毫无疑问会带来数据丢失,HydraBase帮我们解决了这一问题。

HBase基础

在了解HydraBase之前,首先解释一些HBase的基础概念。在HBase中,数据是物理共享的,也就是所说的regions。regions通过region服务器管理,每个region服务器会负责一个或以上的region。当数据被添加到HBase,它首先会被写到一个write-ahead log(WAL),即HLog。一旦写入,这个数据会被存储到一个内存MemStore中。一旦数据超过了某个阈值,它们就被持久化到磁盘。随着MemStore持久化到磁盘的HFiles数量增多,HBase会将几个小的文件合到一些大的文件中,来减少读的开销,这就是所谓的压缩。

当某个region服务器发生故障,这个服务器负责的所有region都会转移到另一个服务器,执行故障转移。鉴于HBase故障转移中的实现方式,这将需要做WAL的分割和复制,这将大大的延长故障转移的时间。

HydraBase相关

上文所说正是HydraBase与之最大的区别,取代region都只被单一的region服务器控制,在HydraBase中,每个region可以被一群region服务器控制。当某个region服务器发生故障,备用的region服务器会立刻接手服务它所控制的region,这些备用的region服务器可能横跨不同的机架甚至是数据中心,通过不同的故障域来提供高可用。控制每个region的服务器会形成一个quorum,每个quorum都有1个负责region服务器来处理来自客户端的读和写请求。HydraBase使用RAFT一致协议来保证跨quorum的一致性,每个quorum都使用2F+1,HydraBase可以承受F级故障。region server通过同步写入WAL来保障一致性,但是只有一部分的region server需要完全的写入来保证一致性。

quorum中的成员只存在active或witness两个模式,active模式成员会写入到HDFS,期间会执行数据持久化和压缩。witness成员只会参与复制WAL,但是在负责region服务器失败时可以立刻使用。

HydraBase部署模型

HydraBase部署

在这个情况下,HydraBase的部署跨越了3个数据中心,quorum的大小为5。通过这样的设置,负责region server可以转移到该区域的任何一个成员。如果只是图1中的Active Leader失败,同一个数据中心的Witness Follower将取而代之,客户端的请求将给它发送。如果丢失的是整个数据中心,见第二张图,第二个数据中心的Active Follower会取而代之,鉴于数据中心2的region server仍然可以给HDFS中写数据,因此即使是数据中心1不可见,数据仍然可以访问。

图1

图2

HydraBase的另一个好处是有效的解耦逻辑和物理备份,此外,因为不需要分割日志,故障转移将会很快速的执行,HydraBase能将Facebook全年的宕机时间缩减到不到5分钟。Facebook目前正在测试HydraBase,并计划在生产集群中逐步开始部署。

原文发布时间为:2014年06月10日

本文作者:Facebook

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-10-25 12:24:01

Facebook下一代数据存储只宕机5分钟的相关文章

Cloudera收购了专门研究下一代数据存储环境加密技术技术的初创企业 Gazzang

Hadoop供应商Cloudera刚刚收购了专门研究下一代数据存储环境加密技术技术的初创企业Gazzang,但交易细节并未透露.这是Cloudera的第一笔重大收购. Gazzang成立于2010年,总部位于奥斯丁.Gazzang提供了块级的加密技术,其产品包括Hadoop环境下的一款数据加密产品及访问权限管理产品.后者可以控制对键值.令牌等数据访问授权协议的访问. 对于志在成为企业数据中枢的Cloudera来说,有了Gazzang的安全技术支持,无疑可以提高其客户对环境安全的信心. 除了支持H

谷歌北京时间8月17日晨宕机5分钟:损失严重

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 宕机的代价是多大?或许无人知晓确切的答案.不过,谷歌今天宕机了,看来损失不小,仅仅持续5分钟,却让谷歌损失近55万美元. 美国太平洋时间8月16日下午3点50分到3点55分(北京时间8月17日6点50分到6点55分),谷歌遭遇了宕机.目前,美国博客网站VentureBeat的员工已经证实了谷歌的宕机.此次宕机影响了谷歌的所有服务,包括谷歌网站的主页.YouTube.

谷歌宕机5分钟致全球网络流量暴跌40%

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 CNET科技资讯网 8月17日国际报道 周五,包括搜索在内的大多数Google服务宕机数分钟. 市场研究公司GoSquared称,Google服务宕机对全球互联网产生了广泛影响,在一段5分钟长的时间内造成全球互联网流量下降40%, "英国夏令时8月16日23:52至23:57期间,Google.com宕机,GoSquared实时跟踪

WordPress宕机110分钟1020万博客受影响

北京时间2月19日上午消息,据国外媒体报道,博客平台服务WordPress美国当地时间周四宕机110分钟,1020万使用WordPress服务的网站受到影响,受影响的页面浏览量则达到550万. 宕机事故发生后,WordPress和WordPress.com的开发商Automattic在Twitter上发布消息确认了这一事件.第一条确认消息于美国太平洋时间2月18日14:00(北京时间2月19日6:00)发出. 1小时后,Automattic创始人马特·穆伦维格(Matt Mullenweg)再次

【硅谷连线】博客Medium融资2500万美元 Facebook开发数据存储系

中云网每天连线硅谷,呈现最新鲜资讯!这里的"硅谷"指的是国外具有典型性和创新性企业代表. 1. IBM年关大清仓:欲10亿美元转让软件网络业务 <http://tech.qq.com/a/20140129/007126.htm> 全力聚焦云计算.大数据的IBM,正在将非核心业务清仓出售,在将低端服务器业务转让给联想集团之后,IBM目前决定再次对外转让基于软件的网络业务,业务估值为10亿美元左右. 美国科技新闻网站Recode引述知情人士,作出上述报道. 据报道,联想斥资23

谷歌一家宕机五分钟 全球互联网流量雪崩40%

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 人类社会的运转,似乎已经离不开强大的谷歌(微博),谷歌对于全球互联网的运营,影响有多重要?美国时间6月16日下午,谷歌发生了五分钟的宕机事故,第三方专业公司的统计显示,在这个"黑色五分钟"内,全球互联网的访问流量,雪崩了40%. 谷歌这次宕机,发生在下午3点50分到3点55分之间.该公司表示,故障涉及了网络搜索.YouTu

防止数据中心宕机的集成系统测试(IST)

不久前,洛杉矶地下室爆炸导致其附近的Equinix公司和INTERNAP公司数据中心的电力中断.而谷歌公司在德国的数据中心最近遭受雷击.世纪互联公司新泽西州的一个数据中心冷冻水管道日前发生故障,影响了纽约证券交易所的数据显示. 所有这些事件都发生在最近几周,这些事故呈现出导致数据中心宕机和基础设施故障的类型. 当电源中断或冷却水停止流动时,集成系统测试(IST)可以验证应急电源.机械和监测系统运行的设计和建造,以及应用程序的集群,甚至整个数据中心会回应用户的期望, "集成系统测试的唯一机会,你将

Facebook如何用NoSQL实现高吞吐低延迟的数据存储?

Facebook从成立之初作为一个小型区域型社交网站,到如今演变成为全球最大的社交网站,架构经历过几次重大的迭代.其中,Facebook的存储也从小变大,从单一变得更具有多样性,从而应对各种拓展性问题. 本文将首先从Facebook的升级转变开始,谈到数据存储能力提升对于公司Scalability的巨大影响,然后介绍Facebook在Canssandra和HBase之间的选择,从而引申出NoSQL将要解决的问题领域,最后集中介绍了NoSQL Pattern的基本组成.希望看完本文之后,大家可以对

Facebook网站周五短暂宕机 或为技术原因

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 新浪科技讯 北京时间8月2日早间消息,Facebook周五发生短暂的宕机事故,导致部分用户无法访问.Facebook表示,目前正在调查这一事故的原因,目前看来这一事故是由于技术问题. Facebook在一份公告中表示:"今天上午早些时候,一些用户在短时间内无法访问Facebook.我们很快展开了调查,目前正在为所有人恢复服务.我们对