【RAC】Oracle RAC环境的日志体系

在Oracle RAC环境中比单个系统的日志体系要复杂:见下图:

简单介绍一下有关Oracle集群环境中日志体系结构,在遇到问题时,可以快速查找所需的日志文件,及时的定位问题~

1.Oracle集群日志的文件路径

Oracle集群涉及的日志主要位于“$GRID_HOME/log”和“$ORACLE_HOME/log”目录中。

2.日志目录结构

clusterware 层的日志结构:

grid@rac1:/home/grid>tree -d $ORACLE_HOME/log

/opt/rac/11.2.0/grid/log

|-- crs

|-- diag

|   `-- clients

|       `-- user_root

|           `-- host_1874443374_76

|               |-- alert

|               |-- cdump

|               |-- incident

|               |-- incpkg

|               |-- lck

|               |-- metadata

|               |-- stage

|               |-- sweep

|               `-- trace

`-- rac1

    |-- admin

    |-- agent

    |   |-- crsd

    |   |   |-- oraagent_grid

    |   |   |-- oraagent_oracle

    |   |   `-- orarootagent_root

    |   `-- ohasd

    |       |-- oraagent_grid

    |       |-- oracssdagent_root

    |       |-- oracssdmonitor_root

    |       `-- orarootagent_root

    |-- client

    |-- crsd

    |-- cssd

    |-- ctssd

    |-- diskmon

    |-- evmd

    |-- gipcd

    |-- gnsd

    |-- gpnpd

    |-- mdnsd

    |-- ohasd

    |-- racg

    |   |-- racgeut

    |   |-- racgevtf

    |   `-- racgmain

    `-- srvm

42 directories

RMDBS 层的日志结构:

oracle@rac1:/opt/rac/oracle/diag/rdbms/rac>tree -d rac1

rac1

|-- alert

|-- cdump

|-- hm

|-- incident

|-- incpkg

|-- ir

|-- lck

|-- metadata

|-- stage

|-- sweep

`-- trace

11 directories

其中“rac1”是主机名。

3.日志目录功能说明

1)CRS日志存放在“$GRID_HOME/log//crsd”目录,系统会对该日志每10M进行归档一次;

2)CSS日志存放在“$GRID_HOME/log//cssd”目录,系统会对该日志每20M进行归档一次;

3)EVM日志存放在“$GRID_HOME/log//evmd”目录;

4)“$GRID_HOME/log/”和“$ORACLE_HOME/log/”目录中的racg目录中记录了RACG可执行文件对应的日志;

5)“$GRID_HOME/log//client”和“$ORACLE_HOME/log//client”目录记录了与srvctl、ocrdump、ocrconfig以及ocrcheck命令对应的日志信息。

4.Oracle集群的alert日志

Oracle RAC环境中的alert日志文件与Oracle单实例的alert日志一样。该文件位于“在 $ORACLE_BASE/rdbms//trace”目录下,命名规则为“alert_.log”

该警告日志记录了有关Oracle集群rdbms 层面的重要警告信息。

oracle@rac1:/opt/rac/oracle/diag/rdbms/rac/rac1/trace>more alert_rac1.log 

Starting up:

Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production

With the Partitioning, Real Application Clusters, OLAP, Data Mining

and Real Application Testing options.

Using parameter settings in client-side pfile /opt/rac/oracle/admin/rac/pfile/init.ora on machine rac1

System parameters with non-default values:

  processes                = 150

  nls_language             = "SIMPLIFIED CHINESE"

  nls_territory            = "CHINA"

  memory_target            = 1584M

  control_files            = "+DATA2/rac/controlfile/current.260.781821965"

  db_block_size            = 8192

  compatible               = "11.2.0.0.0"

  log_archive_dest_1       = "LOCATION=+DATA2"

  log_archive_format       = "yangdb_%t_%s_%r.dbf"

  db_create_file_dest      = "+DATA2"

  undo_tablespace          = "UNDOTBS1"

  instance_number          = 1

  remote_login_passwordfile= "EXCLUSIVE"

  db_domain                = ""

  dispatchers              = "(PROTOCOL=TCP) (SERVICE=racXDB)"

  remote_listener          = "scan:1521"

  audit_file_dest          = "/opt/rac/oracle/admin/rac/adump"

  audit_trail              = "DB"

  db_name                  = "rac"

  open_cursors             = 300

  diagnostic_dest          = "/opt/rac/oracle"

Cluster communication is configured to use the following interface(s) for this instance

  10.10.10.10

cluster interconnect IPC version:Oracle UDP/IP (generic)

IPC Vendor 1 proto 2

Sat Apr 28 20:50:38 2012

PMON started with pid=2, OS id=16042 

Sat Apr 28 20:50:38 2012

VKTM started with pid=3, OS id=16044 at elevated priority

VKTM running at (10)millisec precision with DBRM quantum (100)ms

Sat Apr 28 20:50:39 2012

GEN0 started with pid=4, OS id=16048 

Sat Apr 28 20:50:39 2012

DIAG started with pid=5, OS id=16050 

Sat Apr 28 20:50:39 2012

DBRM started with pid=6, OS id=16052 

5.小结

熟悉Oracle集群环境下日志文件的位置和功能有助于快速定位故障的位置,善用之。

ORA-29780: unable to connect GPnP daemon [CLSGPNP_ERR]

 

安装完成 11GR2 Grid 之后,使用asmca创建磁盘组的时候遇到如下报错:

Started getting following error

ORA-29780: unable to connect to GPnP daemon [CLSGPNP_ERR]

google 一把 和环境变量有关:(CRS/GRID 是运行正常的). 

grid@rac1 /oragrid/dbs> env | grep ORA

GRID_HOME=/opt/11.2.0/grid <====== 从老的bash_profle 中继承的!

ORACLE_SID=+ASM1

ORACLE_BASE=/opt/rac/grid

ORACLE_HOME=/opt/rac/11.2.0/grid

$GRID_HOME变量必须和$ORACLE_HOME 保持一致,否则在使用asmca创建磁盘的时候 会认不到asm 磁盘!

时间: 2024-07-28 16:49:56

【RAC】Oracle RAC环境的日志体系的相关文章

ORA-01291: missing logfile Oracle RAC 集群环境下日志文件结构

在Oracle11g RAC环境中,对集群中的日志的定期检查是必不可少的.通过查看集群日志,可以早期定位集群环境中出现的问题, 以便将问题消灭在萌芽状态. 简单介绍一下有关Oracle集群环境中日志的结构,方便快速查找所需的日志文件. 1.Oracle集群日志藏匿之处 Oracle集群涉及的日志主要位于"$ORA_CRS_HOME/log"和"$ORACLE_HOME/log"目录中. SQL> SELECT  capture_name,queue_name,

Oracle RAC 环境下的 v$log v$logfile

      通常情况下,在Oracle RAC 环境中,v$视图可查询到你所连接实例的相关信息,而gv$视图则包含所有实例的信息.然而在RAC环境中,当我们查询v$log视图时说按照常理的话,v$log视图应当看到的是你所连接到实例的日志组的信息.但v$log是个例外,也就是说v$log视图里看到的不仅仅是自身实例所包含的redo日志组,其他所有剩余实例的redo日志组也同样会出现在该视图中.无论你从任意一个节点连接查询v$log视图都将获得相同的结果.该情形同样适用于v$logfile.这到底

Oracle RAC OCR 的管理与维护

   OCR相当于Windows的注册表.对于Windows而言,所有的软件信息,用户,配置,安全等等统统都放到注册表里边.而集群呢,同样如此,所有和集群相关的资源,配置,节点,RAC数据库统统都放在这个仓库里.如果OCR被破坏则导致集群服务启动异常,需要修复OCR.因此OCR的管理与维护对于整个集群而言,是相当重要的.本文主要描述了Oracle 10g RAC下的OCR的管理与维护. 1.环境 oracle@bo2dbp:~> cat /etc/issue Welcome to SUSE Li

Oracle RAC OCR 的备份与恢复

        Oracle Clusterware把整个集群的配置信息放在共享存储上,这些信息包括了集群节点的列表.集群数据库实例到节点的映射以及CRS应用程序资源信息.也即是存放在ocr 磁盘(或者ocfs文件)上.因此对于这个配置文件的重要性是不言而喻的.任意使得ocr配置发生变化的操作在操作之间或之后都建议立即备份ocr.本文主要基于Oracle 10g RAC环境描述OCR的备份与恢复.        OCR 相关参考:        Oracle RAC OCR 与健忘症      

Vmware server 下为Oracle RAC 添加共享磁盘

    在VMware下的Oracle RAC 环境中,对于共享存储不够或者需要增加新的共享磁盘来配置ocr或votingdisk的多路镜像,我们可以通过vmware下的命令行来增加共享存储,然后将这些新磁盘逐一追加到虚拟机即可.下面给出具体描述.   1.添加虚拟磁盘 #下面我们为虚拟机增加2块共享磁盘 #一块为添加ocr镜像,一块用于补充asm磁盘不够用的情形 C:\Users\robinson.cheng>cd C:\Program Files (x86)\VMware\VMware Se

Oracle RAC 连接到指定实例

        在某些特定的情形下,有时候需要从客户端连接到RAC中指定的实例,而不是由客户端Load_balance来动态选择或者是通过服务器端的监听器根据负载情形来转发.对此我们可以通过为tnsnames.ora中特定的网络服务名添加instance_name子项,或者是单独建立一个指向所需实例的网络服务名,下面描述这两种情形.   一.测试环境 -->Oracle 版本 SQL> select * from v$version where rownum<2; BANNER ----

Oracle RAC failover 测试(连接时故障转移)

    Oracle RAC 集群最突出的表现就是高可用性,这些内容主要包括load balance以及failover,通过这些技术使得单点故障不影响客户端端应用程序对数据库的正常访问,以及通过创建service实现节点间负载均衡.本文主要描述Oracle 10g rac环境下的Oracle failover测试.    下面是一些关于这方面的基础参考或相关链接:  有关负监听配置,载均衡(load balance)以及Oracle service请参考    ORACLE RAC 监听配置

Vmware 下Oracle RAC搬家引起CRS-1006/CRS-0215/CRS-0233

   最近虚拟机下的Oracle 10g RAC搬家,搬家完毕之后,Oracle 集群resource之VIP无法正常启动,收到了CRS-0233: Resource or relatives are currently involved with another operation 错误提示.为为啥呢,原来啊,搬家了地址发生变化了,你得使用你家里的新地址阿.... 1.环境描述 Oracle 10g RAC + Suse 10 注,将RAC虚拟机搬家之后,通常情况下我们在添加虚拟机时选择复制(

Oracle RAC failover 测试(TAF方式)

    Oracle RAC 客户端故障转移(failover),当采用TAF方式时,对于已经建立连接的客户端,在连接的实例或节点出现故障时,客户端无需再次发出连接请求,仍然可以继续之前的数据库操作,此称之为透明故障转移.本文描述基于Oracle 10g rac,客户端TAF方式的故障转移并给出示例.   下面是一些关于这方面的基础参考链接:  有关负监听配置,载均衡(load balance)以及Oracle service请参考    ORACLE RAC 监听配置 (listener.or