ksvcreate: Process(m000) creation failed

一测试服务器数据库(Oracle Database 10g Release
10.2.0.5.0 - 64bit Production)突然访问不了,检查发现数据库处于挂起模式(hang
mode),检查告警日志,发现有“ksvcreate: Process(m000) creation failed”,”kkjcre1p:
unable to spawn jobq slave process“之类的错误信息。具体如下所示:

Sun Jan 17 09:56:05 CST 2016
Thread 1 advanced to log sequence 1729 (LGWR switch)
  Current log# 1 seq# 1729 mem# 0: /u01/oradata/SCM2/redo01.log
Sun Jan 17 21:34:01 CST 2016
Thread 1 advanced to log sequence 1730 (LGWR switch)
  Current log# 2 seq# 1730 mem# 0: /u01/oradata/SCM2/redo02.log
Mon Jan 18 09:06:00 CST 2016
ksvcreate: Process(m000) creation failed
Mon Jan 18 09:12:50 CST 2016
WARNING: inbound connection timed out (ORA-3136)
Mon Jan 18 09:37:13 CST 2016
Thread 1 advanced to log sequence 1731 (LGWR switch)
  Current log# 3 seq# 1731 mem# 0: /u01/oradata/SCM2/redo03.log
Mon Jan 18 09:43:10 CST 2016
kkjcre1p: unable to spawn jobq slave process 
Mon Jan 18 09:43:10 CST 2016
Errors in file /u01/app/oracle/admin/SCM2/bdump/scm2_cjq0_586.trc:

当时开发人员急着测试,没时间给我研究具体原因,所以就重启了数据库实例(不能通过shutdown immeidate关闭,只能通过shutdown abort关闭)。

关于告警日志里面的错误信息,我们看出m000进程创建失败,PMON进程无法启动该进程。一般情况下,PMON无法启动进程原因有下面一些:

1、Oracle连接数超过进程数限制。(正是由于Oracle达到了进程数限制,进而PMON无法创建m000进程)

2、进程死锁。

Bug 8426816 PMON may hang cleaning up a dead process (rare)

3、Bug引起的


Database hangs With Message 'Ksvcreate: Process(M001) Creation Failed' (文档 ID 1233079.1)

事后我检查了一下v$resource_limit,发现会话连接数、进程数并没有超。那么完全可以排除这个因素,那么现在就有可能是进程死锁或bug造成的

同事在检查过程中发现Physic
memory资源严重不足,引起了Swap频繁读写。继续检查SGA参数发现sga_max_size、sga_target设置过大(这台测试服务器是
虚拟机做的克隆,生产环境的RAM为64G,SGA也设置较大,克隆过后ORACLE实例启动不了,调整了SGA_TARGET、
SGA_MAX_SIZE等参数后才启动成功,但是不知为什么sga_max_size设置了成了11264M(11G),有可能是当时要设置为1G多,
因为物理内存才3G多,但是不知是手抖了还是搞晕了,当然也不排除后面被人改掉,居然设置成了11264M大小,汗颜啊。居然运行了这么久直到最近才出现
问题,测试数据库基本不会做巡检)

然后在Troubleshooting Guide (TSG) -
Ksvcreate: Process(xxxx) Creation Failed / ORA-00445: Background Process
"xxxx" Did Not Start After n Seconds (文档 ID 1379200.1)
里面发现当OS的资源或设置不正确时,尤其是物理内存或swap不足时,将会导致不能生成新的进程。英文原文如下:

OS Configuration Checks

This error may be observed due to
lack of OS resources or incorrect configuration, typically memory or
swap may be insufficient to spawn a new process. Please check the list
below to verify the OS settings and configuration

当然关于这点我和同事有些争议。不过我认为是这些导致数据库出现这些问题的。修改SGA相关参数应该能解决这个问题,不过还需观察一段时间。

 

另外,关于kswapd0进程,在博客调整linux内核尽量用内存,而不用swap里面有较详细介绍,摘抄部分内容如下所示:

Linux uses kswapd for virtual
memory management such that pages that havebeen recently accessed are
kept in memory and less active pages are paged outto disk.

(what is a page?)…Linux uses manages memory in units called pages.

So,the kswapd process regularly decreases the ages of unreferencedpages…and at the end they are paged out(moved out) to disk

kswapd0进程的作用:它是虚拟内存管理中,负责换页的,操作系统
每过一定时间就会唤醒kswapd ,看看内存是否紧张,如果不紧张,则睡眠,在 kswapd 中,有2 个阀值,pages_hige 和
pages_low,当空闲内存页的数量低于 pages_low的时候,kswapd进程就会扫描内存并且每次释放出32 个free
pages,直到 free page 的数量到达pages_high。

physical mem 不足,引起 swap 频繁读写。kswapd0 是系统的虚拟内存管理程序,如果物理内存不够用,系统就会唤醒 kswapd0 进程,由 kswapd0 分配磁盘交换空间作缓存,因而占用大量的 CPU 资源。

  

时间: 2024-10-30 10:00:41

ksvcreate: Process(m000) creation failed的相关文章

ksvcreate: Process(m000) creation failed 处理

ksvcreate: Process(m000) creation failed 处理 同事打电话过来说有台数据库(10.2.0.4.0)连不上了,查看alert日志: Tue Jun 17 14:55:04 2014 Process m000 died, see its trace file Tue Jun 17 14:55:04 2014 ksvcreate: Process(m000) creation failed Tue Jun 17 14:56:05 2014 Process m00

ORA-12537 TNS-12518 Process m000 died

      最近客户邮件描述无法从客户端连接到数据库,其错误号为ORA-12537: TNS:connection closed,连接被关闭.直接通过tnsping没有任何问题.listener日志中出现TNS-12518: TNS:listener could not hand off client connection.即Listener无法分发客户端连接.下面是具体的错误信息.分析与解决的过程.   1.前端错误信息 C:\Program Files\VMware\VMware vSphe

双击"添加和删除程序",弹出Value creation failed "at line

电脑出现这个问题的截图: 1 问题具体描述 只有这个问题,其他方面都没问题.而且通过360安全卫士,QQ管家之类的软件卸载软件都没问题.但是控制面板里面的"添加与删除程序"打开就会出现这个问题,其他文件都有打开试一下,现在没有发现其他问题. 2 出现这个问题的原因 Value creation failed "at line 451意思是在451行变量创建错误!这是在卸载软件的时候发生错误,对于你的系统没任何影响.个人建议可以无视它,反正就"添加与删除程序"

ASM Diskgroup Creation Failed with "IBM AIX RISC system/6000: 6:no such device or address" [ID 12634

In this Document  Symptoms   Cause   Solution   References Applies to:   Oracle Server - Enterprise Edition - Version: 10.2.0.1 and later   [Release: 10.2 and later ] IBM AIX on POWER Systems (64-bit) Symptoms When attempting to create an ASM(Automat

oracle中PMON failed to acquire latch导致crash的例子

一朋友公司的OA系统挂了(泛微技术支持说是神马神马),友情帮忙分析一下. 如下是alert log信息: Mon Jun 23 11:28:53 2014 WARNING: inbound connection timed out (ORA-3136) Mon Jun 23 22:00:06 2014 Thread 1 advanced to log sequence 339 (LGWR switch)  Current log# 3 seq# 339 mem# 0: /oradata/redo

oracle 错误 日志-oracle平时运行好好的,突然就进不去了,帮忙看下日志是什么原因

问题描述 oracle平时运行好好的,突然就进不去了,帮忙看下日志是什么原因 alter.log里面的日志是这样:Wed Dec 31 12:17:13 2014ksvcreate: Process(m000) creation failedWed Dec 31 12:20:34 2014ksvcreate: Process(m000) creation failedWed Dec 31 12:22:46 2014kkjcre1p: unable to spawn jobq slave proc

小麦苗BLOG文章索引

小麦苗BLOG文章索引            自从2014年7月1号开始写blog到2015年5月5日,历时10个月的时间,大概写了90篇文章,这blog多了就乱了,今天抽空出来整理整理,方便大家也方便自己阅读,本文将一直更新,另外,最后我把所有的blog文章全列出来,可能会有用.    小麦苗的所有文章:itpub文章链接-小麦苗.zip     2015年06月03日更新一次,我写的blog数量:109 篇    2015年07月03日更新一次,我写的blog数量:126 篇    2016

由报警邮件分析发现的备库oracle bug

昨天到公司之后,收到两份封报警邮件,可以看到在早晨6:30左右主库的v$dataguard_status检查时发现了一个错误.然后再2分钟后就自动恢复了. 一般这种问题很自然想到可能是网络出现了一些问题.因为自动恢复了,所以也不同太着急处理,于是细细看了下.报警邮件如下: ZABBIX-监控系统: ------------------------------------ 报警内容: DG_issue ------------------------------------ 报警级别: PROBL

一个oracle bug的简单验证

最近碰到了一个oracle bug,但是我感觉还是有些运气的成分,虽然错误日志和bug描述吻合,版本也完全对应,现在有几个问题在我脑海中翻腾,就是这个问题是不是一个特例,是不是一些额外的原因导致的,于是我翻出了日志重新来看. 这是一个一主两备的环境,一个本地灾备,一个异地灾备,数据库版本是10.2.0.4.0,单实例 数据库日志如下: Redo Shipping Client Connected as PUBLIC -- Connected User is Valid RFS[8]: Assig