使用Tivoli System Automation自动化Q Replication故障转移

我们利用 DB2 所提供的 ">Tivoli System Automation (TSA) 功能来自动化在发生故障时对 Q Replication 的重新启动。

在使用 TSA 时,您是在一个已定义的资源组上使用命令管理复制操作,而不是显式调用 asnqcap 和 asnqapp 程序。例如,如果一个定义将 Q Capture、Q Apply 和队列管理器划分到为一个名为“ibmqrep-rg”的命名资源组中,那么您可以使用 TSA 更改资源组 (chrg) 命令使此资源组上线,从而在该站点上开始复制。可从该站点的任何成员执行此操作:

chrg –o online ibmqrep-rg

通过使该资源组离线来停止复制:

chrg –o offline ibmqrep-rg

该资源组离线后,您就可以通过锁定它让其摆脱 TSA 的控制,这使您能够在 TSA 外部停止和启动程序。有时这对测试很有用,比如在实验不同的 Q Capture 运行时参数时。

rgreq -o lock ibmqrep-rg

要解锁一个资源组并将控制权交回给 TSA,可以使用以下命令:

rgreq –o unlock ibmqrep-rg

配置 TSA 需要:

1) 定义资源和资源之间的依赖关系。例如,Q Replication 程序具有对队列管理器的依赖关系和对可用的 DB2 的依赖关系。

2) 配置 TSA 还需要使用脚本来监视复制程序是否可正常运行,以及是否启动/停止它们。

我们在“附录 5:使用 TSA 自动化 Q Replication 故障转移”中提供了资源定义和脚本。下图显示了我们用来自动化 pureScale 环境中的 Q Replication 故障转移的依赖关系:

图 9:用于自动化 Q Replication 故障转移的依赖关系

Q Replication 主要依赖 DB2。Q Replication 可从任何成员使用 DB2,所以我们定义影子资源来监视 DB2 实例。如果运行队列管理器和 Q Replication 服务器的一个节点上的 DB2 成员发生故障,这些服务器(队列管理器和 Q Replication 服务器)会在仍在运行 DB2 成员实例的另一个节点上启动。如果运行队列管理器和 Q Replication 程序的节点出现故障,它们会在另一个节点上重新启动。

时间: 2024-09-20 09:07:07

使用Tivoli System Automation自动化Q Replication故障转移的相关文章

Facebook的Hadoop应用与故障转移方案

本文讲的是Facebook的Hadoop应用与故障转移方案,在<数据大爆炸 一分钟=60秒=海量数据>一文中,我们曾提到在短短的60秒内,Facebook的用户会分享684478条信息,Like按钮被点击34772次.庞大的业务量时刻考验着Facebook的数据处理能力.我们知道,Facebook使用Hadoop来进行大数据的处理,但Facebook又是如何保障频繁.庞大的数据请求等高压环境下不发生故障的呢?我们一起来了解一下Facebook内部的Hadoop使用情况以及其NameNode故障

IBM DB2 pureScale和Q Replication监视、调节复制并排除其故障

Q Capture 和 Q Apply 程序维护着大量数据库表,以记录有关复制过程的重要信息.这包括具有性能指标的监视表.包含程序信息的轨迹表,以及包含数据冲突信息的异常表.多年来,许多数据库管理员已开发了一些利用了此信息的可访问工具:您始终可以相信,优秀的 DB2 会找到 DB2 表中容易访问和有用的信息的许多用途! IBM 工具还利用了这些监视表,以及 Q Capture 和 Q Apply 程序更新的所有其他表.此外,IBM 还提供了一个庞大的工具集来帮助管理多站点复制配置. 命令行实用程

使用IBM DB2 pureScale Feature与Q Replication实现可伸缩性和业务连续性

要沉着应对如今愈加全球化和竞争激烈的市场,离不开这样一种http://www.aliyun.com/zixun/aggregation/14345.html">数据处理架构,该架构能够随未来的战略需求增长而灵活地增长,能在发生组件故障.维护活动和灾难事件时确保业务连续性. 对某些企业而言,哪怕一小时的停工都可能导致数百万美元的收入损失,更别说对公司声誉的损害和潜在的客户流失.全球化的企业跨不同时区而运作,无时无刻不在提供业务服务.为系统维护和升级保留的离线时窗已不复存在.分布式的企业需要能

在DB2中部署Q Replication:包含哪些工作?

以下各节将介绍部署 Q Replication 所需的必要决策和操作,从规划到系统设置和生产操作.需要执行的操作包括: 1. 安装前验证和容量规划,包括为 DB2 启用复制 2. http://www.aliyun.com/zixun/aggregation/13387.html">WebSphere MQ 和 Q Replication 许可的安装和配置 3. 复制订阅的定义:也就是说,您希望复制哪些表? 4. 操作:开始和停止复制,处理中断 5. 监视.调节和故障排除,以便从解决方案获

IBM DB2中Q Replication概念和操作

我们现在会介绍并解释一些考虑因素.配置选择.概念和技术,以及使用 Q Replication 实现您的 DB2 实例的完全连续的可用性所需的部署和操作过程.本文将专门介绍 pureScale,但文中提供的所有概念和命令同样适用于其他任何 DB2 系统. 针对 pureScale 的特殊考虑因素 将 Q Replication 用于 DB2 pureScale 或其他任何 DB2 产品(包括 DB2 ESE.InfoSphere Warehouse(具有数据库分区功能的 DB2)和 DB2 for

领略IBM Cloud Simulator for Tivoli Service Automation Manager

IBM® Cloud Simulator for http://www.aliyun.com/zixun/aggregation/13966.html">Tivoli® Service Automation Manager 能够自动模拟支持客户 Tivoli Service Automation Manager 的系统,使开发人员可以创建有效原型,并领略私有云服务的管理功能.本文作者介绍了 IBM Cloud Simulator,该工具适用于 IBM SmartCloud Enterpri

MySQL 自动故障转移工具--mysqlfailover

mysqlfailover 是mysql utilities工具包中包含的一个重要的高可用命令,用于对主从复制架构进行健康检测以及实现故障自动转移.它会定期按指定的时间间隔探测各节点的健康状态,一旦在捕获到主节点不可用时,将触发故障转移相关动作,自动执行故障切换到当前最佳的从服务器上.同时整个主从架构内的其他从节点将指向新的主节点,自动完成主从拓扑结构更新. 相关知识点热身 基于mysqldump搭建gtid主从 MySQL GTID 错误处理汇总 配置MySQL GTID 主从复制 使用mys

Oracle RAC failover 测试(连接时故障转移)

    Oracle RAC 集群最突出的表现就是高可用性,这些内容主要包括load balance以及failover,通过这些技术使得单点故障不影响客户端端应用程序对数据库的正常访问,以及通过创建service实现节点间负载均衡.本文主要描述Oracle 10g rac环境下的Oracle failover测试.    下面是一些关于这方面的基础参考或相关链接:  有关负监听配置,载均衡(load balance)以及Oracle service请参考    ORACLE RAC 监听配置

MHA 自动故障转移步骤及过程剖析

    MHA是众多使用MySQL数据库企业高可用的不二选择,它简单易用,功能强大,实现了基于MySQL replication架构的自动主从故障转移,本文主要描述了MHA自动切换的步骤,对切换过程做了演示以及进行了适当的分析,供大家参考和理解MHA以及MySQL的原理.   1.MHA自动切换的步骤a.MHA manager启动时的校验阶段   根据配置文件校验复制配置以及识别当前的master   导致监控终止情形:复制配置异常,存在的异常slave,一些需要的脚本脚本异常   MHA ma