AIX的存储高可用和容灾解决方案实现

基本技术介绍

AIX LVM Mirror 本地存储高可用解决方案介绍

Logical Volume Manager(LVM)是 AIX 上用于逻辑卷管理的软件。LVM 本身提供 Logical Volume (LV)数据在多个 Physical Volume (PV)之间做数据镜像的功能,以达到存储的本地高可用性。在 LVM Mirror 方案中写 I/O 与底层设备交互如下图所示。

图 1. LVM Mirror 方案架构

当服务器发出写 I/O 时,该 I/O 在 Parallel 模式下会同时并行发送到两台存储设备上。如上图中 Step 1, Step 2 和 Step 1’, Step 2’。只有当 Step 2 和 Step 2’都完成时,一个写 I/O 才会被服务器认为完成。

在该解决方案中,当底层任一存储,即 PV,出现故障时,LVM 会自动将停止该 PV 上所有的 I/O 活动,并将相应读写切换到剩下的正常 PV 上。整个切换过程在 LVM 层完成,所有 LV 在故障切换过程中状态保持在线,对应用层透明。切换时间最低在 15 秒左右,甚至更短。

同城容灾解决方案介绍

DS8000 Metro Mirror (MM)技术是一种满足 Recovery Point Object (RPO)为 0 的存储级同城容灾解决方案。该方案中,数据通过存储底层的 I/O 同步复制到容灾站点来达到相应的容灾目的。在 DS8000 MM 方案中写 I/O 与不同站点间 DS8000 存储交互如下图所示。

图 2. DS8000 MM 方案架构

当服务器发出写 I/O 时,首先该写 I/O 首先放往在生产站点主存储设备上;其次该写 I/O 由生产站点主存储发往灾备站点备存储;接着备存储发回写 I/O 完成信息;最后主存储向服务端发送写 I/O 完成信息。整个过程中,每个写 I/O 保证会在生产和容灾站点间同步完成。

在该解决方案中,当生产站点发生灾难时,会触发站点切换场景,即生产站点所有设备宕机,灾备站点服务器和存储在容灾端被启用并提供服务。由于容灾端存储的数据是通过同步复制技术产生,数据与生产保持一致,从而保证了 RPO 为 0。值得注意的时 DS8000 MM 该方案本身不提供生产站点的本地存储高可用保证。当本地存储发生故障且无法恢复时,最终需要将生产切换到容灾站点。整个过程一般为几个小时或更高。

AIX LVM Mirror 结合 DS8000 Metro Mirror 解决方案介绍

AIX LVM Mirror 结合 DS8000 Metro Mirror 解决方案是一种融合两种方案优点的存储高可用加容灾解决方案。该解决方案的基本架构图如下图所示。

图 3. AIX LVM Mirror 结合 DS8000 Metro Mirror 架构

时间: 2024-10-03 08:47:05

AIX的存储高可用和容灾解决方案实现的相关文章

PostgreSQL 金融行业高可用和容灾解决方案

背景 金融行业高度依赖共享存储来解决高可用,数据0丢失以及异地容灾的问题. 开源数据库PostgreSQL基于复制的解决方案能不能解决0丢失,高可用以及容灾的问题? 完全可以,而且更灵活,更可靠. PostgreSQL 金融场景实现 如图1 主备同步通过流复制实现,可靠性指标包含反馈维度的指标和一致性维度的指标. 反馈指标 1. L1,备库接收到REDO并写入XLOG BUFFER. 2. L2,备库接收到REDO并落盘. 3. L3,备库接收到REDO落盘后并恢复. 以上三个指标,对事务的时延

高可用数据容灾 同有科技助力河北省人民检察院数据中心升级

随着我国政府职能向数字化.服务化转型,越来越多的应用.业务.数据被集中处理,数据中心需要更完备的安全保障.河北省人民检察院在其数据中心改造项目中,选择了北京同有飞骥科技股份有限公司(以下简称"同有科技")为其量身打造的高可用数据容灾存储解决方案. 原数据中心无法满足业务发展需求 作为省级检察院,河北省检察院管理着全省11个市级院和169个县区级检察院,现有22个内设机构,分管不同的业务内容.其信息化系统包含办公系统.档案系统.统一业务软件系统.数据库系统等.随着各种大数据应用的增多,原

如何衡量数据中心的高可用及容灾水平

数据中心的好与差有很多评判的方法,很多评价机构都是将多方面的因素考虑进来,对每种因素进行评分,再根据经验对每种因素给定权重,最终得出数据中心的评价结果,按照预先定义的数据中心等级,根据评价结果给数据中心定级.不少的数据中心评价机构尽量保证数据的真实性和权威性,一定要将数据中心分个三六九等,这其中就有两项非常重要的参数,就是一个数据中心的高可用性和数据中心的容灾能力.往往这两项会在整个数据中心评价中占据相当大的权重,很多数据中心在建设时考虑最多的也是这两个方面.下面就展开来谈谈高可用性及容灾. 何

浅析单点故障以及云上高可用和容灾

引言 故障,不管它发生的概率有多低,终归还是会发生的.                                                                                     --墨菲定律 概念 单点故障 顾名思义,单个点发生的故障,扩展到云上的环境,指的就是单个节点发生的故障导致整个链路瘫痪.这里的节点可以是一台服务器,一个数据库,一台网络设备,乃至一个应用程序. 打个简单的比方,一个加工厂流水线只有甲乙丙丁四名员工,一个加工需求进来,需要甲乙丙

阿里云高可用-容灾解决方案

这两天,一篇名为<IT之家因无法忍受阿里云而迁移至XX云>的文章引起了整个云计算行业的热议.(袋鼠云CTO江枫还专门写了一篇热评:点击阅读原文.) 从目前得到的信息看,其应该是在青岛区域购买了一台云服务器ECS,基于.net和自建SQL Server,并且应用和数据库跑在同一台云服务器上. IT之家,所有应用都部署在单台ECS上,不具备高可用的特性. 即便阿里云产品本身就有容灾.高可用的特征,但是因为一些用户对阿里云产品的不了解和自身应用架构不够合理,也根本无法使其发挥该优势. 其实,IT之家

大话存储系列19——数据容灾

数据备份系统只能保证数据被安全地复制了一份,但是一旦生产系统发生故障,比如服务器磁盘损坏致使数据无法读写.主板损坏造成直接无法开机或者机房火灾等意外事件,我们必须将备份的数据尽快地恢复到生产系统中继续生产,这个动作就叫做容灾. 容灾可以分为四个级别: 数据级容灾:也就是只考虑将生产站点的数据如何同步 到远程站点即可. 与应用结合的数据级容灾:也就是可以保证对应应用程序数据一致性的数据同步,以及可感知应用层数据结构的.有选择的同步部分关键重要数据的数据容灾: 应用级容灾:也就是灾难发生时,不仅可以

基于存储虚拟化远程容灾解决方案

今天,大多数的企业已经全面使用计算机管理,所有数据都存储在计算机系统中.因此,计算机系统的持续使用性和安全可靠性,在整个企业运营过程中起着至关重要的作用.如果系统在一段时间内不能正常运行,所造成的影响将不仅仅是局部的,有可能给整个企业运营造成重大损失.目前,只有少数企业建立了容灾备份系统.为什么大多数企业尚未建立容灾体系?原因有三点: "这种事不会发生在我们公司!"对于大多数的IT主管来说,他们认为这种偶然事件只会发生在其它公司,不会发生在他们自己所管辖的公司内.因而没有这方面的考虑.

IBM七级容灾解决方案

容灾对企业的重要性已无需多言,在需要全天候运行的全球经济环境中,没有一家企业能够承受宕机,无论是计划的宕机(升级.维护和修复)还是突发的宕机(由于人为错误.处理故障.电源故障.甚至灾难事件).但许多企业都制订了在24到48小时内恢复核心应用的业务连续性计划.虽然数据丢失了24小时,但实现全面恢复需要数天或者数星期的时间.这些企业通常依赖后台和人工流程来保持业务的正常运行,直到系统恢复为止. 随着信息成为越来越重要的企业资产,许多企业都致力于最大限度地降低宕机风险和避免业务中断的潜在影响,从而影响

飞康CDP本地备份与异地容灾解决方案

飞康提供的虚拟化存储平台+CDP全面数据保护+异地容灾的解决方案,解决了首都师范大学数字校园建设中遇到的本地备份和异地容灾问题. 应用背景与需求 首都师范大学是一所综合性师范大学.为了加强学校信息化建设,集中力量建设数字化校园,早在2002年,学校就成立了数字校园建设中心,为首都师范大学2400名教职员工及超过28000名学生提供信息服务.数字校园建设中心全面覆盖了该大学的南.北两个校区,集中了学校关键性的教学.科研.管理等系统,拥有大量的关键数据,包括教学.科研.管理等文档以及音视频资料,而保