数据中心四大灾备技术解析

灾备技术是指在一个数据中心发生故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,达到互为备份的效果,好的灾备技术可以实现用户的“故障无感知”。灾备是一项综合系统工程,涉及到备份、复制、镜像等多种不同技术,系统建设复杂程度高。因此,一般只有在大型企业和金融行业应用较多。我国在2007年时颁布了首个关于灾备的国家标准《信息系统灾难恢复规范》(GB/T 20988-2007),是我们在灾备建设时重要的参考性文件。现在的数据中心承载的业务越来越重要,引入有效的灾备技术,能减少数据中心发生故障时带来的损失。数据中心整体灾备技术可以分为四种:冷备、暖备、热备和双活。

冷备

冷备技术是中小型数据中心或者承载业务不重要的局点经常使用的灾备技术。冷备技术的用站点通常是空站点,一般用于紧急情况;或者仅仅是布线、通电后的设备。在整个数据中心故障时无法提供服务时,数据中心会临时找到空闲设备或者租用外界企业的数据中心临时恢复,当自己数据中心恢复时,再将业务切回。这种方式数据中心业务恢复的时间难以保证,有时临时搭建的平台也可能因为不稳定而再次出现中断。当然这种方式不必准备大量的空闲设备,维护成本可以忽略不计。冷备技术从启用到真正可以开始工作需要较高的成本和时间,通常需要几天甚至一周或者更长的时间。冷备技术算不上是一种真正意义上的灾备技术,因为冷备基本上就是数据中心从未考虑数据中心出现故障的情况,一旦出现故障,则是“姑娘上轿才扎耳朵眼”的做法,对于故障毫无预知和提前投入。当然冷备技术的缺点是显而易见的,其已经越来越无法适应数据中心高要求的发展,逐渐成为一种淘汰的技术方式。

暖备

暖备技术是在主备数据中心的基础上实现的,前提是拥有两个一主一备的数据中心。备用数据中心为暖备部署,应用业务由主用数据中心响应,当主用数据中心出现故障造成该业务不可用时,需要在规定的RTO(Recover Time Objective,即灾难发生后,信息系统从停顿到恢复正常的时间要求)时间以内,实现数据中心的整体切换。在具体实现上,主备数据中心的两套业务系统网络配置完全一样,备用数据中心路由平时不对外发布。当实现主备数据中心切换时,需要断开主用数据中心路由链路,并连接备用数据中心路由链路,保证同一时间只有一个数据中心在线。暖备技术还是手工方式,从知道主用数据中心故障到备用数据中心工作需要有人24小时值守才能完成,工作效果较低。

热备

相比暖备,热备最重要的特点是实现了整体自动切换,其它和暖备实现基本一致,实现热备的数据中心仅比暖备的数据中心要多部署一项软件,软件可以自动感知数据中心故障并且保证应用业务实现自动切换。业务由主用数据中心响应,当出现数据中心故障造成该业务不可用时,需要在规定的RTO时间内,自动将该业务切换至备用数据中心。在具体实现上,在主备数据中心均部署GTM(广域流量管理器),GTM之间同步信息,GTM各自探测本中心的应用业务,根据GTM的服务器状态判断应用业务的可用性。当GTM或数据中心链路出现DOWN时,将该业务自动切换至灾备数据中心。热备数据中心通过GTM技术实现自动主备数据中心切换。

双活

通过双活技术可以实现主备数据中心均对外提供服务,正常工作时两个数据中心的业务可根据权重做负载分担,没有主备之分,分别响应一部分用户,权重可以是按地域划分,或数据中心服务能力或对外带宽。当其中一个数据中心出现故障时,另一数据中心将承担所有业务。具体实现上,多活技术部署了很多种检测故障的方式,比如:ICMP Monitor、TCP Monitor、HTTP Monitor,FTP Monitor。还可以实时检测服务器的运行状态、服务器负载均衡的情况,即使在没有故障的时候也可以根据应用业务量在多活数据中心之间调整。多活的最大特点是不会造成数据中心的资源存在浪费,数据中心都承载应用业务运行。不至于出现像热备、暖备主用数据中心几乎满载运行,而备用数据中心却很空闲的情况。除了双活技术还有多活技术,多活就是业务在多个数据中心上同时运行,当有一个或多个数据中心故障时,其它数据中心将自动接管所有应用业务。显然多活比双活可靠性更高,但投入成本也会高,实现技术也更为复杂。现在在金融行业、互联网行业的数据中心都乐于采用多活技术,虽然投入大,但稳定性是这些数据中心优先考虑的事。

下面的表1列出了四种灾备技术的特点比对。


冷备


暖备


热备


双活/多活


RTO


恢复时间长,不可预知


恢复时间较短


恢复时间较短


恢复时间短


硬件成本


几乎可以忽略


一般


一般


一般


软件成本


几乎可以忽略


几乎可以忽略


较低


较高


实现复杂度


简单


简单


较易


复杂


运行稳定性



较低


较高



自动化


人工


人工


软件自动


软件自动


运维成本




较高


较高

表1:四种灾备技术特点比对表

无论采用哪种灾备技术,应该根据自身数据中心应用业务的重要性、建设经费、人员技能水平等综合考虑采用哪种灾备技术。不见得一定要采用双活/多活灾备技术,虽然这种技术可靠性最高,但实现复杂,进行扩容、业务变更等都需要大量专业的技术知识,所以除了建设成本高,后期投入的维护成本也很高,这将给数据中心带来沉重的运营包袱。应该深入研究这四种灾备技术,结合自身的实际情况,综合选择。灾备技术在数据中心中越来越重要,已经逐渐成为数据中心必备的重要技术之一。

作者:何妍 

来源:51CTO

时间: 2024-09-14 16:39:16

数据中心四大灾备技术解析的相关文章

从天津爆炸事故思考数据中心容灾建设

天津,还是天津.最近几天,天津受到了来自全国各地的太多关注.在所有关于这座城市的众声喧哗中,不乏真实的声音--当然,真相中也掺杂着谣言,例如"某数据中心严重受损"等博眼球的不实报道.拒绝妖魔化,是我们应有的态度.冷静思考,我们可以看见,天津在中国的数据中心版图依旧举足轻重,不会因为一次灾难而轻易改变.   天津数据中心的情况如何? 据不完全统计,天津的数据中心主要有国家超级计算天津中心.腾讯天津数据中心.世纪互联.万国数据.华胜天成等等.其中,腾讯数据中心的规模较大,有20万台服务器.

北京信息灾备技术产业联盟与国家电子计算机质量监督检验中心战略合作 共同打造健康可持续发展的灾备产业

   2017年1月7日,北京信息灾备技术产业联盟(以下简称"联盟")与国家电子计算机质量监督检验中心本着平等互利原则,经友好协商,就联盟专家资源共享.科研.产业推广等领域的合作关系达成共识.双方结成战略合作伙伴,一致同意就<灾备解决方案测评基准(银行业版)>标准编制与推广.灾备解决方案测评关键技术研究与应用.灾备解决方案测评环境共享等领域开展长期合作. 2016年,由灾备技术国家工程实验室牵头成立的"北京信息灾备技术产业联盟"在北京成立,联盟旨在推进灾

数据中心未来发展的技术趋势

数据中心的技术在不断演进,尤其是近些年来,随着处理的数据量巨增.业务的多样化需求,使得数据中心到了不得不做出改变的时候.然而技术的发展总要有个演进的过程,不是一下子什么就都有了.以太网络带宽,从1M发展到如今的100G,也是一点点,1M到10M,再到100M,再到1G.10G.40G,直到现在的100G,技术需要已经逐步成熟的过程,技术的发展也需要一点点脚踏实地地去研究,技术难题要一点点去攻克.那么当今的数据中心,有哪些引领潮流的技术,有哪些技术未来将大有可为,从各种的渠道获取到的一些信息中,或

万国数据发布日本灾备体系概述及启示白皮书

2014年3月13日,万国数据发布了<日本灾备体系概述及启示>白皮书,从日本政府灾备.企业灾备与社会灾备组织等方面对日本灾备体系进行了概述,并指出,中国IT灾备体系建设可以借鉴日本灾备体系在提高地方抗灾能力.完善政府应急管理机制等方面的优秀经验. 万国数据CEO黄伟表示:"作为国内灾备服务的领军者和高可用IT管理服务的倡导者,万国数据一直致力于加强灾备理论建设,为用户乃至全行业提供灾备建设指导.在立足于国内灾备市场研究的同时,万国数据在近几年扩展了国际化视野,并希望汲取国外灾备行业的

阿里云发布混合云数据存储和灾备方案

12月7日,2017苏州·云栖大会上,阿里云发布全新的混合云数据存储和灾备方案,此次发布的内容包括最新推出的混合云容灾服务HDR和混合云备份服务HBR,以及全面升级的混合云存储阵列CSA2000和CSA3000. 混合云容灾服务HDR支持客户数据中心物理机和虚拟机到阿里云上虚机的整机容灾,客户无需花费大量资金建造和维护异地数据中心,就能轻松实现异地容灾.如果客户数据中心出现灾难性故障,阿里云上的虚机和应用可以快速启动,帮助客户实现业务连续性,降低业务中断的损失. 与传统的客户自建异地容灾中心的方

浅析数据中心低延迟网络设备技术

网络延迟指一个数据包从用户的计算机发送到网站服务器,然后再立即从网站服务器返回用户计算机的来回时间.在这个过程中包括:计算机网卡.网络设备.链路.服务器组成部分,每个部分转发数据流量都要消耗时间,所有部分消耗的时间加起来就是延迟.延迟越低,自然网络性能越好,响应速度快.比如过年抢火车票,有人家里装了100M的带宽或者使用了4G手机,就容易抢到,因为骨干网上速度都差不多,但最后到个人用户那里就因网而异,响应速度快就要比别人先抢到.所以在游戏.证券期货交易.计算中心和很多科技公司等这些地方对网络延时

2016年云数据中心和相关设备技术发展及分析

近日,中国信通院发布<云计算白皮书(2016年)>,其中对云数据中心和相关设备技术发展及分析如下: (一)云计算发展对数据中心和设备提出新要求 作为信息社会的重要基础设施,随着云计算.大数据等相关业务需求的持续增加,数据中心产业发展迅速,2009至2015年,中国IDC市场规模增长了5倍以上,年均增长率超过30%,2015年中国IDC市场规模已达500亿元人民币.数据中心产业也进入了大规模的规划建设阶段,2013年至2015年,全国规划在建数据中心250个左右,其中超大型.大型数据中心100个

数据中心需要什么样的技术人才

随着信息技术的进步,人们的工作和生活与一系列各种各样的数据联系在一起.而作为数据处理的中心场所,数据中心的重要性越来越高.云计算.大数据.虚拟化等各种技术在数据中心领域遍地开花,造就一片欣欣向荣的景象.数据中心早已不是传统IT技术,维护一个机房就完成的工作,数据中心需要通过自身的技术变革,为所承载的业务带来更多益处.不少的企业甚至喊出了向数据中心要利润,向数据中心要市场的口号,可见数据中心在未来企业发展中所处的重要地位.数据中心要发展,终究离不开人才,尤其是懂得新兴技术的复合型人才,数据中心对人

数据中心的那些未来技术

数据中心是科技高度集中的场所,未来几乎所有的先进技术均与数据中心有关.这些新技术将数据中心带入了快速奔跑的时代,很多新鲜概念有时也让人看得眼花缭乱,稍不留神就会落伍.数据中心不再是一个堆积冷冰设备的机房,而是拥有无限想象的数据城堡,总是能给你带来惊喜.今天就来说一说那些与数据中心有关的前沿技术,说这些是前沿技术,是因为目前在数据中心还没有看到它们的踪影,但或许明天的数据中心里就有它们的一席之地,我们先在这里尝尝鲜. 首先要讲的是量子计算机.量子计算机是指利用量子相干叠加原理,理论上具有超快的并行