RAC FAILover详解(原创)

Oracle  RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用,连接到故障节点的用户会被自动转移到健康节点,从用户感受而言, 是感觉不到这种切换。  
Oracle 10g RAC 的Failover 可以分为3种:
1. Client-Side Connect time Failover
2. TAF
3. Service-Side TAF
注意事项: 不能在listener.ora 文件中设置GLOBAL_NAME, 因为这个参数会禁用Connect-time Failover 和 Transparent Application Failover.
Client-Side Connect Time Failover 
Client-Side Connect Time Failover的含义:如果用户端tnsname 中配置了多个地址,用户发起连接请求时,会先尝试连接地址表中的第一个地址,如果这个连接尝试失败,则继续尝试使用第二个地址,直至连接成功或者遍历了所有的地址。
这种Failover的特点:只在建立连接那一时刻起作用,也就是说,这种Failover方式只在发起连接时才会去感知节点故障,如果节点没有反应,则自动尝试地址列表中的下一个地址。一旦连接建立之后,节点出现故障都不会做处理,从客户端的表现就是会话断开了,用户程序必须重新建立连接。
启用这种Failover的方法就是在客户端的tnsnames.ora中添加FAILOVER=ON 条目,这个参数默认就是ON,所以即使不添加这个条目,客户端也会获得这种Failover能力。
TAF(Transparent Application Failover) 
这块的配置,参考:
10g & 11g Configuration of TAF(Transparent Application Failover) and Load Balancing [ID 453293.1]
现在的大部分流行的应用系统(如:weblogic, Jboss),都是启动时就建立若干到数据库的长连接,在应用程序整个生命周期内重用这些连接。 而Client-Side Connet Time Failover的工作方式使它对应用程序的可用性没有太大帮助。 
所以从Oracle 8.1.5 版本只有引入了新的Failover 机制—TAF。 所谓TAF,就是连接建立以后,应用系统运行过程中,如果某个实例发生故障,连接到这个实例上的用户会被自动迁移到其他的健康实例上。对于应用程序而言,这个迁移过程是透明的,不需要用户的介入,当然,这种透明要是有引导的,因为用户的未提交事务会回滚。 相对与Client-Side Connect Time Failover的用户程序中断,抛出连接错误,用户必须重启应用程序,TAF 这种方式在提高HA上有了很大的进步。
TAF 的配置也很简单,只需要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目需要定义。
1.METHOD: 用户定义何时创建到其实例的连接,有BASIC 和 PRECONNECT 两种可选值。 
BASIC: 是指在感知到节点故障时才创建到其他实例的连接。
PRECONNECT: 是在最初建立连接时就同时建立到所有实例的连接,当发生故障时,立刻就可以切换到其他链路上。
两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,但是建立多个冗余连接会消耗更多资源,两者就是是用时间换资源和用资源换时间的区别。
2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.
这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。
假设用户正在节点1上执行查询,整个结果集共有100条记录,现在已从节点1上返回10条记录,这时节点1宕机,用户连接被转移到节点2上,如果是session模式,则需要重新执行查询语句;如果是select方式,会从节点2上继续返回剩下的90天记录,而已经从节点1返回的10条记录不会重复返回给用户,对于用户而言,感受不到这种切换。
显然为了实现select 方式,Oracle 必须为每个session保存更多的内容,包括游标,用户上下文等,需要更多的资源也是用资源换时间的方案。
3. DELAY 和 RETRIES: 这2个参数分别代表重试间隔时间和重试次数。
示例:
RAC =
  (DESCRIPTION =
     (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521))
     (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521))
      (LOAD_BALANCE=YES)
      (
 CONNECT_DATA=
     (SERVER=DEDICATED)
 (SERVICE_NAME=RAC)
 (
    FAILOVER_MODE=
(TYPE=session)
(METHOD=basic)
(RETRIES=180)
(DELAY=5)
 )
      )
    ) 
Service-Side TAF 
Service-Side TAF的配置参考:
How To Configure Server Side Transparent Application Failover [ID 460982.1]
Service-SideTAF 可以看作是TAF的一种变种,首先Service-SideTAF也是TAF,所有TAF的特点它都有,其次这种TAF是在服务器上配置的,而不像TAF是在客户端配置的。
Client-Side TAF 是在客户端修改tnsnames.ora 文件来配置的,如果有很多客户端使用这个数据库,那么每次微笑调整都需要把所有的计算机更改一遍,既低效又容易出错。而Service-Side TAF 通过结合Service,在数据库里保存FAIL_MODE的配置,把所有的TAF配置保存在数据字典中,从而省去了客户端的配置工作,现在客户端的TNS文件就不需要任何TAF的配置选项了。
从配置参数而言,Service-Side TAF和TAF 相比多了一个Instance Role(实例角色)的概念。 所谓的实例角色,就是当有多个Instance 参与一个Service时,可以配置优先使用哪一个Instance为用户提供服务。用户共有两种可选角色。
PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。
AVAILABLE: 后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE的Instance上。
要使用Server-Side TAF必须配置Service。 Service 可以在创建数据库时创建,也可以在创建数据库之后修改,既可以使用dbca 配置向导,也可以用命令行的方式配置。
用DBCA 配置Service 
1、运行DBCA,选择ORACLE RAC Application Clusters database
2、在第二个界面选择:Services Management
3、第三个界面会出现RAC 数据库列表,用户可以在这个列表中选择要配置Service 的数据库
4、在Serice配置界面中,单击Add 创建新的Service,输入service名字。在Instance列表框定义实例角色,选择那个service1 作为 Preferred(首选实例),Service2 作为availiable(后备实例)。 TAF Policy有三个选项: None, Basic,Pre-connect。 我们选Basic。 最后点击Finish,完成Service 配置。
5、在结束Service配置后,服务会自动启动。
用srvctl 命令配置Service 
用命令行方式配置Service 对远程维护很有用。 先来看一下相关命令
创建service 
#Srvctl add service -d <database-name> -s <service-name> -r "preferred-instance-list" -a "available-instance-list" -P <TAF-policy> 
其中TAF-Policy可选:basic 和 preconnect。 例如:
srvctl add service -d RAC -s Service2 -r "RAC1,RAC2" -a "RAC3,RAC4" -P basic 
注意:srvctl add service中,只有perferred才会创建服务。 即在OCR中注册一个ora.raw.dmm.Raw1.Srv的服务。
查看配置信息 
#srvctl config service -d database-name [-s service-name] [-a] 
如果这里不指定"-s service-name",就会显示所有Service的配置,这些配置包括preferred 和available instance. 使用-a 选项,还会显示TAF 相关信息。
是否自动运行service 
数据库启动时,会自动启动所有的Service。有时为了为了维护需要,需要禁用这个特性,在维护完成后再启动这个特性。
#srvctl enable/disable service -d database-name -s service-name -i instance-name 
启动service 
#srvctl start service -d <database-name> -s <service-name> -i instance-name -o start-option -c connect-string -q 
如果不指定service-name, 则所有的service 都会被启动,可以使用逗号分隔方式,同时启动多个service。 -i 指定在那个实例上启动service。
停止service 
#srvctl stop service -d <database-name> -s <service-name> -i instance-name -c connect-string -q -f 
其中-f 选项可以强制关闭service,并中断了其所有用户的连接。
查看service 状态 
#srvctl status service -d <database-name> -s  service-name -i instance-name -f -v 
其中-f 可以显示被disable的instance 信息,而-v 可以显示详细输出
删除service 
#srvctl remove service -d database-name -s service-name -i instance-name [-f]
配置数据字典中的service信息 
Begin
Dbms_service.modify_service(
Service_name='>Service1',
Failover_method=>dbms_service.failover_method_basic,
Failover_type=>dbms_service.failover_type_select,
Failover_retries=>180,
Failover_delay=>5
);
    End;

删除数据字典里的service信息 
begin
      dbms_service.delete_service(service_name=>'dmm');
end; 
配置Service 的注意事项 
1、数据库的服务名是用service_name 参数来指定的,一个数据库可以有多个服务名,但是service_name最长是4kb,不要手工来修改这个参数
2、最多可以创建64个service,每个数据库有2个隐含的service,因此留给用户的就只有62个service。不能修改这两个隐含service的配置,并且也不能手工启动或停止这2个服务。 这两个隐含的service分别是:SYS$BACKGROUND 和 SYS$USERS.
3、当使用dbca配置Service 时,dbca 会自动更新OCR,启动Service, 当删除service时,会停止service,并更新OCR.
4、使用srvctl 这个工具时,命令只更新OCR中的配置,不会更新data dctionary和listener中的信息,因此还需要使用dbma_servie 包来更新data dictionary,手工更改listener配置文件。 故推荐使用DBCA工具来配置更改service配置

5、无论使用DBCA还是srvctl 创建service,都需要使用dbms_service包来配置TAF策略。使用srvctl删除service时需手动停止service,否则会失败。
6、如果客户端想通过Service方式连接数据库,需要在tns条目中使用service_name 方式引用数据库。 如:
RAC =
  (DESCRIPTION =
     (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521))
     (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521))
      (LOAD_BALANCE=YES)
      (
    CONNECT_DATA=
     (SERVER=DEDICATED)
 (SERVICE_NAME=RAC)
      )
           ) 
注意:
客户端tnsnames.ora 中的service_name 要写我们的service-side TAF的名称。可以通过一下方式查看:
SQL> showparameter service
NAME                                 TYPE       VALUE
----------------------------------------------- -----------------
service_names                        string      dave, dave_taf 
然后可以验证:
SQL> show parameter instance_name
NAME                                 TYPE        VALUE
------------------------------------ ----------- ------
instance_name                        string      rac1
SQL> select sid from v$mystat where rownum=1;
       SID
----------
       146
SQL> select failover_type,failover_method,failed_over from v$session where sid=146;
FAILOVER_TYPE FAILOVER_M FAILED_OVE
------------- ---------- ----------       
SELECT        BASIC      YES 
--如果客户端写的不是SERVICE-SIDE TAF的名称,而是实例的名称,那么不影响数据库的连接,但是无法实现TAF功能。

 

参考至:《大话Oracle RAC》张晓明著
              http://www.oracle.com/technetwork/cn/articles/database-performance/oracle-rac-connection-mgmt-1650424-zhs.html
本文原创,转载请注明出处、作者
如有错误,欢迎指正
邮箱:czmcj@163.com

作者:czmmiao  文章出处:http://czmmiao.iteye.com/blog/1735773

时间: 2024-10-29 14:39:34

RAC FAILover详解(原创)的相关文章

RAC LoadBalance详解(原创)

LoadBalance 就是把负载平均的分配到集群中的各个节点,从而提高整体的吞吐能力. Oracle 10g RAC 提供了两种不同的方法来分散负载: 1. 通过Connection Balancing,按照某种算法把用户分配到不同的节点.也可认为是纯技术的分散负载. 2. 通过Service,在应用层上进行分散,也可认为是面象业务的分散负载.Connection Balancing  Connection Balancing 这种负载均衡是在用户连接这个层次进行的,也就是在用户请求建立连接时

DB2创建数据库常用参数详解(原创)

本文只介绍DB2 create database语法中的常用参数 http://publib.boulder.ibm.com/infocenter/db2luw/v9/index.jsp  CREATE DATABASE语法树Read syntax diagramSkip visual syntax diagram>>-CREATE--+-DATABASE-+----------------------------------------->            '-DB-------

dd命令详解(原创)

dd指令使用  语法格式 dd   [option]  dd指令选项详解 if=file:输入文件名,缺省为标准输入 of=file:输出文件名,缺省为标准输出 ibs=bytes:一次读入 bytes 个字节(即一个块大小为 bytes 个字节) obs=bytes:一次写 bytes 个字节(即一个块大小为 bytes 个字节) bs=bytes:同时设置读写块的大小为 bytes ,可代替 ibs 和 obs cbs=bytes:一次转换 bytes 个字节,即转换缓冲区大小 skip=b

VirtualBox下配置串口以及stty命令详解(原创)

虚拟机于主机通过串口通信  我们需要先配置一下宿主机器上的virtualbox. 1. 在串口栏中勾选 []启用串口(E) 2. 端口编号选择COM1 3. 端口模式选择Host Pipe 4. 勾选 []创建通道(C) 5. Port/File Path: 填上 /tmp/serial. 也就是说我们在宿主机器的/tmp/中创建了serial的通道文件 此外,我们还要在宿主机器上设定一下串口.在此之前需要安装minicom软件 1. 运行minicom -s命令 2. CTRL+A调出配置界面

AIX的vmstat命令详解(原创)

vmstat概述  vmstat 命令报告关于内核线程.虚拟内存.磁盘.陷阱和 CPU 活动的统计信息.由 vmstat 命令生成的报告可以用于平衡系统负载活动.系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和. Interval 参数指定每个报告之间的时间量(以秒计).第一个报告包含系统启动后时间的统计信息.后续报告包含自从前一个报告起的时间间隔过程中所收集的统计信息.如果没有指定 Interval 参数,vmstat 命令生成单个报告然后退出.Count

DB2表空间管理详解(原创)

create tablespace语法树 >>-CREATE --+-----------------------+---------------------------->            +-LARGE-----------------+               +-REGULAR---------------+               | .-SYSTEM-.            |               '-+--------+--TEMPORARY-'  

AIX的SVMON命令详解(原创)

svmon概述  svmon 命令用于显示当前内存状态的信息,可通过 # lslpp bos.perf.tools 查看是否有安装.因为 svmon 命令在启用中断的用户级别运行,所以显示的信息不组成真正的内存快照. 在非常繁忙的系统中,svmon收集的数据和真实的数据有所差距,在svmon进程搜集的过程中,VMM(虚存管理器)可能已经发生改动了. 因为svmon使用的全是VMM中的数据,而VMM对内存的视图是基于内存段的,所以,理解svmon的输出,必须先理解段的概念. 段  段(segmen

RAC日志体系详解(原创)

简单介绍一下有关Oracle集群环境中日志体系结构,在遇到问题时,可以快速查找所需的日志文件,及时的定位问题.日志体系如下 Oracle集群日志的文件路径 $  tree -d $ORA_CRS_HOME/log /u01/app/oracle/product/10.2.0/crs/log |-- crs `-- czmmiao1     |-- admin     |-- client     |-- crsd     |-- cssd     |   `-- oclsmon     |--

HBA详解(原创)

HBA概述  主机总线适配器(Host Bus Adapter,HBA)是一个在服务器和存储装置 间提供输入/输出(I/O)处理和物理连接的电路板和/或集成电路适配器.因为HBA减轻了主处理器在数据存储和检索任务的负担,它能够提高服务器的性能.一个HBA和与之相连的磁盘子系统有时一起被称作一个磁盘通道. HBA的常规定义:就是连接主机I/O总线和计算机内存系统的I/O适配器.按照这个定义,像显卡就是连接视频总线和内存,网卡就是连接网络 总线和内存,SCSI-FC卡就是连接SCSI或者FC总线和内