(转)如何诊断和解决CPU高度消耗(100%)的数据库问题

如何诊断和解决CPU高度消耗(100%)的数据库问题

2008-05-24 13:46

链接:http://www.eygle.com/archives/2004/10/howto_getsql_which_cost_most_cpu.html

很多时候我们的服务器可能会经历CPU消耗100%的性能问题.
排除系统的异常,这类问题通常都是因为系统中存在性能低下甚至存在错误的SQL语句, 消耗了大量的CPU所致.

本文通过一个案例就如何捕获这样的SQL给出一个通用的方法.

问题描述:系统CPU高度消耗,系统运行缓慢
OS:Sun Solaris8
Oracle:Oracle9203

1.首先通过Top命令查看

$ top
                        load averages:  1.61,  1.28,  1.25                     HSWAPJSDB             10:50:44
                        172 processes: 160 sleeping, 1 running, 3 zombie, 6 stopped, 2 on cpu
                        CPU states:     % idle,     % user,     % kernel,     % iowait,     % swap
                        Memory: 4.0G real, 1.4G free, 1.9G swap in use, 8.9G swap free
                        PID USERNAME THR PR NCE  SIZE   RES STATE   TIME FLTS    CPU COMMAND
                        20521 oracle     1 40   0  1.8G  1.7G run     6:37    0 47.77% oracle
                        20845 oracle     1 40   0  1.8G  1.7G cpu02   0:41    0 40.98% oracle
                        20847 oracle     1 58   0  1.8G  1.7G sleep   0:00    0  0.84% oracle
                        20780 oracle     1 48   0  1.8G  1.7G sleep   0:02    0  0.83% oracle
                        15828 oracle     1 58   0  1.8G  1.7G sleep   0:58    0  0.53% oracle
                        20867 root       1 58   0 4384K 2560K sleep   0:00    0  0.29% sshd2
                        20493 oracle     1 58   0  1.8G  1.7G sleep   0:03    0  0.29% oracle
                        20887 oracle     1 48   0  1.8G  1.7G sleep   0:00    0  0.13% oracle
                        20851 oracle     1 58   0  1.8G  1.7G sleep   0:00    0  0.10% oracle
                        20483 oracle     1 48   0  1.8G  1.7G sleep   0:00    0  0.09% oracle
                        20875 oracle     1 45   0 1064K  896K sleep   0:00    0  0.07% sh
                        20794 oracle     1 58   0  1.8G  1.7G sleep   0:00    0  0.06% oracle
                        20842 jiankong   1 52   2 1224K  896K sleep   0:00    0  0.05% sadc
                        20888 oracle     1 55   0 1712K 1272K cpu00   0:00    0  0.05% top
                        19954 oracle     1 58   0  1.8G  1.7G sleep  84:25    0  0.04% oracle

我们发现在进城列表里,存在两个高CPU耗用的Oracle进城,分别消耗了47.77%和40.98%的CPU资源.

 

2.找到存在问题的进程信息


 

                        $ ps -ef|grep 20521
                        oracle 20909 20875  0 10:50:53 pts/10   0:00 grep 20521
                        oracle 20521     1 47 10:43:59 ?        6:45 oraclejshs (LOCAL=NO)
                        $ ps -ef|grep 20845
                        oracle 20845     1 44 10:50:00 ?        0:55 oraclejshs (LOCAL=NO)
                        oracle 20918 20875  0 10:50:59 pts/10   0:00 grep 20845

确认这是两个远程连接的用户进程.

 

3.熟悉一下我的getsql.sql脚本


 

                        SELECT   /*+ ORDERED */
                        sql_text
                        FROM v$sqltext a
                        WHERE (a.hash_value, a.address) IN (
                        SELECT DECODE (sql_hash_value,
                        0, prev_hash_value,
                        sql_hash_value
                        ),
                        DECODE (sql_hash_value, 0, prev_sql_addr, sql_address)
                        FROM v$session b
                        WHERE b.paddr = (SELECT addr
                        FROM v$process c
                        WHERE c.spid = '&pid'))
                        ORDER BY piece ASC
                        /

注意这里我们涉及了3个视图,并应用其关联进行数据获取.
首先需要输入一个pid,这个pid即process id,也就是在Top或ps中我们看到的PID.
通过pid和v$process.spid相关联我们可以获得Process的相关信息
进而通过v$process.addr和v$session.paddr相关联,我们就可以获得和session相关的所有信息.
再结合v$sqltext,我们即可获得当前session正在执行的SQL语句.

通过v$process视图,我们得以把操作系统和数据库关联了起来.

 

4.连接数据库,找到问题sql及进程

通过Top中我们观察到的PID,进而应用我的getsql脚本,我们得到以下结果输出.


 

                        $ sqlplus "/ as sysdba"
                        SQL*Plus: Release 9.2.0.3.0 - Production on Mon Dec 29 10:52:14 2003
                        Copyright (c) 1982, 2002, Oracle Corporation.  All rights reserved.
                        Connected to:
                        Oracle9i Enterprise Edition Release 9.2.0.3.0 - 64bit Production
                        With the Partitioning, OLAP and Oracle Data Mining options
                        JServer Release 9.2.0.3.0 - Production
                        SQL> @getsql
                        Enter value for spid: 20521
                        old  10: where c.spid = '&pid'
                        new  10: where c.spid = '20521'
                        SQL_TEXT
                        ----------------------------------------------------------------
                        select * from (select VC2URL,VC2PVDID,VC2MOBILE,VC2ENCRYPTFLAG,S
                        ERVICEID,VC2SUB_TYPE,CISORDER,NUMGUID,VC2KEY1, VC2NEEDDISORDER,V
                        C2PACKFLAG,datopertime from hsv_2cpsync where datopertime<=sysda
                        te and numguid>70000000000308 order by NUMGUid) where rownum<=20

那么这段代码就是当前正在疯狂消耗CPU的罪魁祸首.
接下来需要进行的工作就是找出这段代码的问题,看是否可以通过优化提高其效率,减少资源消耗.

 

5.进一步的我们可以通过dbms_system包跟踪该进程


 

SQL> @getsid
Enter value for spid: 20521
old 3: select addr from v$process where spid = &spid)
new 3: select addr from v$process where spid = 20521)

SID SERIAL# USERNAME MACHINE
----------------------------------------------------------------
45 38991 HSUSER_V51 hswapjsptl1.hurray.com.cn

SQL> exec dbms_system.set_sql_trace_in_session(45,38991,true);

PL/SQL procedure successfully completed.

SQL> !

 

这部分内容可以参考:
http://www.eygle.com/case/sql_trace_1.htm

对于Windows上的类似问题,可以参考:
http://www.eygle.com/faq/Use.Nt.tools.manage.Oracle.htm

 

6.一点说明

很多时候,高CPU消耗都是由于问题SQL导致的,所以找到这些SQL通常也就找到了问题所在,通过优化调整
通常就可以解决问题。

但是有时候你可能会发现,这些最消耗CPU的进程是后台进程,这一般是由于异常、BUG或者恢复后的异常
导致的,需要具体问题具体分析了.

时间: 2024-09-11 10:29:51

(转)如何诊断和解决CPU高度消耗(100%)的数据库问题的相关文章

Oracle捕获问题SQL解决CPU过渡消耗_oracle

正在看的ORACLE教程是:Oracle捕获问题SQL解决CPU过渡消耗.本文通过实际业务系统中调整的一个案例,试图给出一个常见CPU消耗问题的一个诊断方法.大多数情况下,系统的性能问题都是由不良SQL代码引起的,那么作为DBA,怎样发现和解决这些SQL问题就显得尤为重要.  本案例平台为UNIX,所以不可避免的应用了一些Unix下常用的工具.如vmstat,top等.  本文适宜读者范围:中高级.  系统环境:  OS: Solaris8  Oracle: 8.1.7.4  问题描述:  开发

Oracle中捕获问题SQL解决CPU过渡消耗

oracle|解决|问题 本文通过实际业务系统中调整的一个案例,试图给出一个常见CPU消耗问题的一个诊断方法.大多数情况下,系统的性能问题都是由不良SQL代码引起的,那么作为DBA,怎样发现和解决这些SQL问题就显得尤为重要. 本案例平台为UNIX,所以不可避免的应用了一些Unix下常用的工具.如vmstat,top等. 本文适宜读者范围:中高级. 系统环境: OS: Solaris8 Oracle: 8.1.7.4 问题描述: 开发人员报告系统运行缓慢,已经影响业务系统正常使用.请求协助诊断.

一次诊断和解决CPU利用率超高的例子

业务人员报告说不能登录系统,业务几乎停顿. 听到这个消息首先登录主机执行如下命令 [/@zzld03]#sar -u 1 10   HP-UX zzld03 B.11.23 U ia64    04/16/13   10:32:25    %usr    %sys    %wio   %idle 10:32:26      63       1      26      10 10:32:27      53       1      23      23 10:32:28      49   

AMD将如何解决CPU过热问题

AMD在平台会议上谈了很多关于LDT和Athlon处理器散热系统的设计,但并没有过多的透露任何Athlon新核心的秘密. AMD计划以1.75V的Athlon核心达到1.4GHz,消耗将近76W电力,当1.3G Athlon跑SPECfp测试时也消耗将近68W.这样一来CPU的温度就会过高,那如何解决CPU过热的问题呢?AMD公司将会在Palomino和Duron处理器的die内建感温器,就如同P4一样,Intel的感温器结合高速热控制线路,处理器并不借助任何软件或硬件,能在真实运作条件下保持工

诊断并解决ORA-04031 错误

原文转自冯大辉老师的博客:http://www.dbanotes.net/Oracle/Ora-04031.htm 诊断并解决ORA-04031 错误 当我们在共享池中试图分配大片的连续内存失败的时候,Oracle首先清除池中当前没使用的所有对象,使空闲内存块合并.如果仍然没有足够大单个的大块内存满足请求,就会产生ORA-04031 错误. 当这个错误出现的时候你得到的错误解释信息类似如下: 04031, 00000, "unable to allocate %s bytes of shared

iexplore.exe在打开网页时CPU使用会100%的解决方法_病毒查杀

CPU占用100%解决办法  一般情况下CPU占了100%的话我们的电脑总会慢下来,而很多时候我们是可以通过做一点点的改动就可以解决,而不必问那些大虾了.  当机器慢下来的时候,首先我们想到的当然是任务管理器了,看看到底是哪个程序占了较搞的比例,如果是某个大程序那还可以原谅,在关闭该程序后只要CPU正常了那就没问题:如果不是,那你就要看看是什幺程序了,当你查不出这个进程是什幺的时候就去google或者 baidu 搜.有时只结束是没用的,在 xp下我们可以结合msconfig里的启动项,把一些不

共享:CPU资源占用100%解决方法

解决 1.驱动没有经过认证,造成CPU资源占用100%.大量的测试版的驱动在网上泛滥,造成了难以发现的故障原因. 2.防.杀毒软件造成故障.由于一些防.杀毒软加入了对网页.插件.邮件的随机监控,无疑增大了系统负担,可以根据情况有选择的开启服务. 3.病毒.木马造成.大量的蠕虫病毒在系统内部迅速复制,造成CPU占用资源率据高不下.解决办法:使用最新的杀毒软件在DOS模式下进行杀毒.经常性更新升级杀毒软件和防火墙,加强防毒意识,掌握正确的防杀毒知识. 4.开始->运行->msconfig->

CSS解决未知高度的DIV垂直居中

css|解决 原文标题:Vertical Centering in CSS副标题:Yuhu's Definitive Solution with Unknown Height 尽管有CSS的vertical-align特性,但是并不能有效解决未知高度的垂直居中问题(在一个DIV标签里有未知高度的文本或图片的情况下). 标准浏览器如Mozilla, Opera, Safari等.,可将父级元素显示方式设定为TABLE(display: table;) ,内部子元素定为table-cell (dis

解决列高度自适应(列高度相同)的五种方法

解决|自适应 1.背景图填充这是使用最广泛的一种做法,无hacks,推荐使用: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta