认识数据中心两个关键指标RTO和RPO

用来描述和评价数据中心有很多专有参数和指标,通过这些数据可以反映出数据中心的各种运行状态,其中有两个关键指标必须有所了解: RTO和RPO。RTO和RPO是数据中心灾难恢复方面的重要参考指标。现在的数据中心对业务的连续性有苛刻要求,但是故障不可避免,一旦发生了故障就需要启动备份机制,确保业务的连续性,所以现在数据中心都有较为完善的容灾机制,RTO和RPO可以很好地反映出数据中心容灾性能如何。这两个参数是数据中心在运维过程中,一定要重点关注的指标。这个指标的好与差,是基于数据中心现有的各种综合运行情况评估得出的真实结果,反映当前数据中心在灾难恢复方面的修复能力。下面让我们来详细认识一下这两个参数的真面目。

RTO

RTO(Recovery Time Objective,复原时间目标)是数据中心可容许服务中断的时间长度。比如说服务发生后半天内便需要恢复,RTO数值就是十二小时。RTO具体时间长短只是从故障发生后,从数据中心系统宕机导致应用停顿之刻开始,到数据中心系统恢复至可以支持各部门运作之时,此两点之间的时间段。RTO是反映数据中心业务恢复的及时性指标,表示业务从中断到恢复正常所需的时间,RTO数值越小,代表容灾系统的数据恢复能力越强,数据中心可以部署很多容灾系统,来获取最小的RTO,但这意味着投入大量资金。提升RTO的常用技术有:磁带恢复、人工迁移、应用系统远程切换,这几种技术的RTO的表现如表1所示:

部署不同的容灾技术将获得不同的RTO值,从业务连续性角度考虑,肯定希望RTO数值越小越好,尤其是很多互联网数据中心,中断几分钟都会损失数百万的成交量,这些数据中心往往不惜一切代价要确保数据中心不中断运行。应用系统的自动切换涉及到数据中心网络、服务器、存储等多方面的技术,不管数据中心任何一个位置出现了故障,这些部分都会启动软件系统进行切换,可以是设备之间的切换,也可能是集群之间的切换,还可能是异地数据中心切换,通过应用系统自动切换将业务转移到其它正常的系统中,然后再对故障设备进行排查。将故障原因找到并排除后,再将业务切回到原有系统中,应用系统切换做得好,这个过程不会引起业务的二次中断,让业务无感知切换。

RPO

RPO(Recovery Point Objective,复原点目标)是指数据中心能容忍的最大数据丢失量,是指当业务恢复后,恢复得来的数据所对应时间点,RPO取决于数据中心数据恢复到怎样的更新程度,这种更新程度可以是上一周的备份数据,也可以是昨天的数据,这和数据备份的频率有关,为了改进RPO,必然要增加数据备份的频率才行。RPO是反映数据中心恢复数据完整性的指标。在同步数据复制方式下,RPO等于数据传输时延的时间,在异步数据复制方式下,RPO基本为异步传输数据排队的时间。提升RPO的常用技术有:磁带备份、定期数据复制、异步数据复制、同步数据复制等,这几种技术的RPO的表现如表2所示:

RPO指标考验着数据中心数据复制能力,这并不意味单纯增加数据复制的频率即可,因为应用的高峰时段无法进行备份操作,而且备份数据本身所花费的时间也会过长,数据复制频率增加到一定程度反而会降低RPO时长。现在出现镜像技术和快照技术可以有效地改进RPO,往往可以将RPO缩小到秒级。

RTO和RPO指标并不是孤立的,而是从不同角度来反映数据中心的容灾能力。我们用下面的图1说明下RTO和RPO两个指标在数据中心故障处理过程中的关系:

从图1不难看出,RPO指标来自于故障发生前,而RTO指标来自故障发生后,两者的数值越小,就能有效缩短业务正常到业务过渡期的时间间隔,单一地提升RTO或RPO指标也可以缩减业务故障到过渡期的时间,具体从哪个指标上来改善,就要结合数据中心的实际情况分析,提升那个指标代价最小,效果更明显。当然完美的方案当然是RTO和RPO都为零,这表示当故障发生后,系统立即回复,而且完全没有数据丢失,要达到这样的目标系统设计是及其复杂的,而且造价也是非常昂贵的,也不一定有这个必要。

RTO和RPO指标对于数据中心非常关键和重要,RTO主要考验数据中心发生故障时,业务切换到容灾系统或者备份系统的能力,RPO主要考验数据中心数据备份能力,尤其是当数据中心发生故障时,仍要具备一定的数据备份能力。但数据中心也不能过分地追求RTO和RPO,因为RTO和RPO越小,意味着投资将越大。而总体投入成本越高,投资回报率将越低,从经济角度考虑,最好的容灾解决方案不一定是效益最好的容灾方案,容灾方案的总体投入和投资回报也是必须要考虑的设计指标,最佳的解决方案必须是在RTO、RPO、运维及价钱多方面,都能够达到平衡。所以要理性看待RTO和RPO,一方面我们努力设计一些新的容灾技术,另一方面还要简化容灾技术的复杂度和造价,不要一再去追求RTO和RPO指标,有时数据中心有些缺陷,也是一种缺陷美。过度追求RTO和RPO指标,甚至做到两者都是零,反而让数据中心更加臃肿,运维难度大,耗费资金过多,数据中心要避免陷入单纯追求提升两个指标的怪圈,结合数据中心实际情况,因地制宜地适当提升两个指标,才是正道。

本文转自d1net(转载)

时间: 2024-07-30 22:09:24

认识数据中心两个关键指标RTO和RPO的相关文章

阿里巴巴张北数据中心两座园区投运“中国数坝”驶进快车道

数据连接你我,绿色引领未来.日前,由阿里巴巴集团.河北省张家口市张北县人民政府主办的京张"中国数坝"峰会在张北县举办.与此同时,总投资200亿元的阿里巴巴张北数据中心1号园区.2号园区两个项目正式投运. 近年来,张北以京津冀协同发展这一国家战略机遇为契机,乘势而上,充分依托自身资源.区位优势全力打造"中国数坝".随着一个个项目相继签约.启动,张北大数据产业发展已驶进快车道. "中国数坝"驶进快车道 "张北一场风,从春刮到冬.冬天白毛风,

数据中心两种常用流量模型运用mininet的实现

数据中心两种常用流量模型运用mininet的实现 编者按:在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状况.本文就以数据中心网络为目标场景,来在mininet仿真环境中尽可能地还原数据中心内部的真实流量情况.目前有两种常用的流量模型: 随机模型:主机向在网络中的另一任意主机以等概率发送数据包 概率模型:在网络中,编号为m的主机分别以概率Pt .Pa .Pc .向主机编号为(m+i).(m+j).(m+k)的主机发送数

确保数据中心性能管理的关键

了解您企业IT基础设施的性能无疑是一项相当艰巨的任务.事实上,人们往往感觉IT专业人士就像是侦探小说一样,需要侦查并探索其所在企业系统和基础设施只是为了了解最基本的性能问题.企业的IT团队对于其数据中心的性能问题往往缺乏全面的,完整的整体性把控,因此必须拼凑出不同的线索.每套基础设施堆栈的每一层均有其自己的一套线索,而由于缺乏对于整个数据中心环境的整体视图把控,IT人员必须推断各种不同的线索会引导得出什么不同的结论.而随着数据中心基础设施变得更加复杂,上述各种线索变得更加难以分析和解读,因此数据

关于新的数据中心设计的考虑指标因素

了解数据中心设计中的三大最重要的因素,有助于帮助您企业更顺利的完成数据中心设计的起草过程.而将本文作为正确确定您企业数据中心业务需求的参考借鉴指南,则有助于您企业从一开始就得以最大限度地提高整体数据中心的性能,稍后的避免重大升级. 几大基本因素推动了数据中心的设计要求和成本.在制定预算和草拟数据中心的设计蓝图之前,需要对这几大基本因素有相当正确的把握.而如果不这样做的话,很可能会导致数据中心正式投入运营后的相关问题. 在数据中心已经投入运行后才来修复错误是相当具有挑战性的,而且其成本代价昂贵,在

保护软件定义数据中心的三大关键考虑因素

软件定义的数据中心(SDDC)可以说为当下的企业组织IT提供了巨大的承诺.在SDDC内部,服务器虚拟化所带来的优势已然扩展到了存储和网络领域,进而使得企业数据中心的整个基础设施都可以在统一的平台上被抽象和集中管理.企业组织的IT团队能够充分利用前所未有的虚拟化技术.协同和自动化水平来实现基于服务的交付模式,从而实现真正的数字化转型. 借助SDDC,企业数据中心的IT基础架构可以实现私有云模式所支持的资源池.自助服务功能和弹性可扩展性等方面的功能.同时,数据中心在使IT部门能够在需要时融入公共云服

数据中心建设必须考虑哪些细节?

数据中心建设必须要考察四点 一是数据的可用性和时效性;二是数据中心规模;三是机柜的功率密度(KW/机柜);四是气象条件.网络以及水.电资源.任何数据中心系统设计方案的选择,都必须建立在对这些内容的考察之上.   不同行业对数据中心建设提出的设计要求大相径庭 如金融行业和军用系统,一切问题都要让位于可用性和时效性;而在BAT或者电信机房,其对节能和投资成本的关注度则要高出很多;在超算系统,则对机柜的高功率密度和机房运行的经济性更为关注.诸如此类,未来数据中心的设计与规划应满足多元化的技术需求,并非

数据中心性能优化指标 高性能机房数据中心

对于数据中心来说性能优化指标很重要,高性能机房数据中心的建设是我们的目标,现在数据中心对于企业来说重要性不言而喻,而数据中心的结构有许多种类,例如拥有刀片服务器架构的优点就十分明显了,而拥有超融合基础架构的好处也包含很多方面,数据中心性能优化指标与高性能机房数据中心的正确建设还是需要慎重考虑的. 对于业务正在稳步增长的企业组织而言,公司当中数据中心的重要性是非常明显的,而为了提升数据中心的性能,企业客户往往有三种方法可以实现服务器的升级或更换.而在本文中,我们针对刀片服务器架构.融合基础设施和超

选择可靠的数据中心供应商的七大关键成功因素

今天,在各个行业都有越来越多具有前瞻性的公司都在寻求可靠的数据中心服务. 随着企业组织努力寻求降低成本,集中信息技术(IT)资源,扩展其服务覆盖面以满足全球市场的需求,他们迫切需要将其服务器存储在安全.放心和良好连接的环境中. 一家可靠的数据中心供应商能够提供企业客户所需的电源和冷却,确保服务器持续的正常运行,24/7全天侯的正常连接,以确保企业客户的应用程序和数据能够随时为所需要的用户提供,并同时提供多层的安全保障,以确保关键型任务数据的安全性. 但并不是所有的数据中心在其安全性方面都是一样的

衡量数据中心好坏标准的隐性指标

评价一个数据中心有很多的参数.指标,可以用这些指标来衡量一个数据中心的好坏.比如:服务器和网络规模.PUE.RTO,RPO等等.很多数据中心很喜欢拿自己拥有的服务器数量如何的多,来表示自己的强大,相当长的一段时间内,数据中心都喜欢单纯地去追求物理设备数量的增加,认为只要是在规模越大,数据中心能力就越强,数据中心就越好.不可否认,增加设备数量,尤其是服务器数量,在纸面上的性能上确实有提升,不过真正部署业务时,要考虑的地方有很多,网络.存储.安全等方方面面都需要提升,尤其是这些多设备配置运转起来,是