ORA-27090 故障一例

    最近的alert日志中碰到了ORA-27090的错误信息,其错误提示为Unable to reserve kernel resources for asynchronous disk I/O。根据这个提示来看是跟异步I/O相关的内核参数问题。下面是这个问题的描述与解决。

 

1、故障错误信息
Wed Sep 10 09:58:17 CST 2014
Errors in file /u01/app/oracle/admin/orclls/bdump/orclls_p000_47020.trc:
ORA-27090: Unable to reserve kernel resources for asynchronous disk I/O
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3
Additional information: 128
Additional information: 65536
Wed Sep 10 09:58:17 CST 2014
Errors in file /u01/app/oracle/admin/orclls/bdump/orclls_p002_47024.trc:
ORA-27090: Unable to reserve kernel resources for asynchronous disk I/O
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3
Additional information: 128
Additional information: 65536  

 

2、故障分析
#调用oerr,没有获得比较有价值的信息,如下:
suse11b:oracle:orcl102 > oerr ora 27090
27090, 00000, "Unable to reserve kernel resources for asynchronous disk I/O"
// *Cause:  The system call to reserve kernel resources for asynchronous I/O
//          has failed.
// *Action: Check errno

#进一步查看trace文件,注,当前数据库版本为10.2.0.5,OS为suse 11 sp3
suse11a:oracle:orcl101 > more /u01/app/oracle/admin/orclls/bdump/orclls_p002_47024.trc
/u01/app/oracle/admin/orclls/bdump/orclls_p002_47024.trc
Oracle Database 10g Enterprise Edition Release 10.2.0.5.0 - 64bit Production
With the Partitioning, Real Application Clusters, OLAP, Data Mining
and Real Application Testing options
ORACLE_HOME = /u01/app/oracle/product/10.2/db_1
System name:    Linux
Node name:      suse11a
Release:        3.0.76-0.11-default
Version:        #1 SMP Fri Jun 14 08:21:43 UTC 2013 (ccab990)
Machine:        x86_64
Instance name: orclls
Redo thread mounted by this instance: 1
Oracle process number: 35
Unix process pid: 47024, image: oracle@suse11a (P002)

*** SERVICE NAME:() 2014-09-10 09:58:17.159
*** SESSION ID:(1072.1) 2014-09-10 09:58:17.159
*** 2014-09-10 09:58:17.159
KCRP: blocks claimed = 0, eliminated = 0
----- Recovery Hash Table Statistics ---------
Hash table buckets = 32768
Longest hash chain = 0
Average hash chain = 0/0 = 0.0
Max compares per lookup = 0
Avg compares per lookup = 0/0 = 0.0
----------------------------------------------
ORA-27090: Unable to reserve kernel resources for asynchronous disk I/O
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3
Additional information: 128
Additional information: 65536
----- Recovery Hash Table Statistics ---------
Hash table buckets = 32768
Longest hash chain = 0
Average hash chain = 0/0 = 0.0
Max compares per lookup = 0
Avg compares per lookup = 0/0 = 0.0
----------------------------------------------
#从trace文件中也没有获得比较有价值的信息

 

3、故障解决
#根据ORA-27090: MESSAGE 27090 NOT FOUND; (文档 ID 579108.1)文档,我们修改内核参数fs.aio-max-nr
#由于此数据库为RAC环境下,因此同时调整了2个节点,以下为调整后的情形。
suse11a:~ # grep max-nr /etc/sysctl.conf
#fs.aio-max-nr = 1048576
fs.aio-max-nr = 3145728

suse11b:~ # grep max-nr /etc/sysctl.conf
#aio-max-nr = 1048576
fs.aio-max-nr = 3145728

suse11a:~ # sysctl -p
suse11b:~ # sysctl -p

#配置完毕后可以通过cluvy校验
#几日后观察alert日志,未发现该类错误。

Check: Kernel parameter for "aio-max-nr"
  Node Name         Current       Configured    Required      Status        Comment    
  ----------------  ------------  ------------  ------------  ------------  ------------
  suse11a           3145728       3145728       1048576       passed         
  suse11b           3145728       3145728       1048576       passed         
Result: Kernel parameter check passed for "aio-max-nr"

 

 

时间: 2024-11-03 13:46:51

ORA-27090 故障一例的相关文章

ORA-01092 ORA-12432: LBAC error: zllegnp:OCIStmtExecute 故障一例

    最近由于数据库hang住,无奈之下直接干掉了pmon进程,再次启动的时候收到了ORA-01092: ORACLE instance terminated. Disconnection forced以及ORA-12432: LBAC error: zllegnp:OCIStmtExecute.这下好了,有的整了,是个从来没有遇见的错误.下面是对这个错误的描述与解决.   1.故障描述idle> startupORACLE instance started. Total System Glo

Windows 2000怪异故障两例

我们单位是一所医疗机构,整个医院的网络是由一台安装有WIN2000 服务器版的惠普服务器及数十台以WIN98作平台的终端微机组成.数据库系统采用微软公司的SQL 7.0版本,开发工具为SYBASE 公司的PowerBuild 6.0.在近一年的运行中,出现过两例怪异的"故障",几乎导致系统瘫痪,在此将详细过程叙述如下,以期对大家有所启示和借鉴. "故障"一:系统运行几个月后,整个管理系统的运行速度变得非常慢,无论是挂号还是划价发药都反应迟钝,导致全院无法进行正常工作

ORA-01157: cannot identify/lock data file n 故障一例

    最近在使用swingbench的时候碰到了ORA-01157故障,下面是其具体描述与解决. 1.故障现象 --查询视图dba_data_files时出现ORA-01157故障 SQL> select file_name,tablespace_name from dba_data_files where tablespace_name='SOE'; select file_name,tablespace_name from dba_data_files where tablespace_n

CRS-1006 , CRS-0215 故障一例

    安装好sles 10 sp3 + Oracle 10g RAC之后,在配置监听器时,总是提示主机bo2dbp上的监听服务已经在运行,忽略错误之后手动在bo2dbp节点上启,总是收到TNS-12545: Connect failed because target host or object does not exist错误信息.后来发现节点bo2dbp的vip总是漂移到另一节点bo2dbs上,原来这才是罪魁祸首 ??????   1.集群环境netca之后,节点bo2dbp监听无法启动 

菜鸟必读之网络故障两例_网络冲浪

最近,笔者在学校网络的维护过程中碰到了两例并不常见的网络故障,但却非常有意思,觉得有必要把它们拿出来供大家参考. 第一例故障:客户机不能即时自动从DHCP服务器上获得它的TCP/IP配置 我们学校的IP地址.DNS和网关都是通过DHCP服务器自动获得的.前段时间,学校领导觉得通过教育城域网上网速度不够快,就决定直接通过电信专线上网,这样一来我就修改了DHCP服务器的DNS设置,并且将DHCP服务器重启.之后有少数几个教师向我反映他们的电脑打不开网页了,但是QQ都能上.排除了病毒.系统的原因后,我

Oracle Restart启动数据库实例故障一例

  Oracle Restart是11gR2中推出的重要高可用(High Availability)特性.在Single Instance情况下,Clusterware形成一个可用性维护框架,Oracle组件服务都是在这个维护管理框架上进行管理.   Oracle Restart从职责上负责两方面的功能,一个是Oracle各个服务组件的自动启动.鉴于组件间复杂的依赖关系,使用Restart自动的进行启动顺序调节是比较好的一种策略.另一个功能是高可用支持,如果某一个组件意外被终止运行,比如异常中断

启动时自检无法找到硬盘故障一例

笔者有两块硬盘,旧的是IBM硬盘,新的是迈拓硬盘.一天笔者打开电脑,发现系统自检时无法通过,并且听到机箱内有"啪啪"的响声,而且硬盘灯狂亮不止.重启用软盘引导,发现已经无法识别硬盘.   因为前两天刚新装了一块迈拓硬盘,所以怀疑是这块新硬盘有问题,于是重启BIOS进入查看,发现两块硬盘都没有被识别出,连续检测几次后终于可以正确识别了.保存信息后退出重启,这回自检没有出现问题,但是进入系统桌面时,再次出现"啪啪"的响声,硬盘灯狂闪不止.虽然偶尔可以进入系统,但是在打开

VNC远程桌面解决服务器故障三例

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 笔者多年从事运维工作,运维工作平时压力不大,但每个月都有那么几天--服务器抽风!我们公司安装Windows系统的服务器很少连续运行超过三个月,定期重启几乎是必须的,否则死机.蓝屏.响应奇慢等等各种问题都来了. 把定时重启服务器命令添加到定时任务里,对减少服务器故障确有帮助,可只是掩盖了问题而非最终解决,其代价是"抽 to death

改注册表保证顺利关机—排除奇怪故障一例_注册表

笔者是一名计算机机房管理员,机房的计算机使用的是Windows XP系统联网,在实际管理中发现有时计算机不能自动关闭电源,而是停留在"现在可以安全的关闭计算机了"的画面上就不动了,可是我们的机箱都是使用的爱国者月光宝盒,属于ATX电源,从理论上来看应该是能自动关闭的,通过实践最后终于排除了故障,具体过程如下. 首先怀疑是系统中装的软件有时不能自动退出造成的,于是对这些计算机重新使用没有故障的计算机系统安装方法重新进行安装,但是仍然不能解决问题. 其次启动两台计算机,分别是一好一坏,通过