一条SQL语句的执行计划变化探究

最近有个同事碰到一个问题,想让我给点思路。我大体了解了一下,是一个系统目前在做压力测试,但是经业务反馈发现某个环节的处理时间有些长,排查了一圈,最后这件事情就落在了DB这边,希望DB能够给点意见,是否存在一些性能瓶颈。
    我们从开发同学那里得到的一个基本的SQL语句,根据关键字从v$sql中做了提取,发现对应的SQL语句的执行时间还是OK的。

得到的SQL语句如下:
SQL_ID        SQL_FULLTEXT
------------- ----------------------------------------------------------------------------------------------------
6h4w0u8stp3z0 select APP_ID,GOODS_ID,ORDER_ID,ORDER_STATUS,GOODS_REGISTER_ID,GOODS_NUMBER,GROUP_ID,GOODS_PRICE,US
              ER_ID,ROLE_ID,ROLE_NAME,CHANNEL_ID,PUSH_NUM,PUSH_INFO from TB_ORDE
              R WHERE ORDER_ID=:1  AND USER_ID=:2  AND SUBSTR(CHANNEL_ID,0,4)=:3
这样一个语句,如此来看性能上应该是没有多少改进的空间了。我查看了数据库层面的相关统计信息,发现DB time极低,比如Elapsed time为60分钟,DB time就不到1分钟,
类似下面这样的输出。
              Snap Id      Snap Time      Sessions Curs/Sess
            --------- ------------------- -------- ---------
Begin Snap:      3295 24-Aug-16 13:00:17        38        .9
  End Snap:      3296 24-Aug-16 14:00:20        44        .9
   Elapsed:               60.05 (mins)
   DB Time:                0.03 (mins)
如此之低的情况下,很难和性能问题联系起来。通过得到的数据情况分析,细化到ASH报告也没有发现任何异常,所以我们可以说DB层面没有性能瓶颈,这个问题还需要进一步的确认。
当然交代完这件事情,主要任务就完成了。就简单再看了看这个问题。
执行计划的情况如下,看到这样的执行计划似乎也没有任何可挑剔的。

谓词信息如下:

看到这里我开始有一些疑惑,作为一个订单表,订单号应该是作为主键的,看到索引的情况,发现确实是。

表结构如下所示,在分析之前还是需要说明这些基本情况的。

那么问题就来了,按道理是需要走唯一性索引代价最低,为什么执行计划缺走了另外一个索引,由期望中的唯一性索引扫描变为了范围索引扫描,这是疑点1.
解答这个问题的过程中发现,其实会引出更多的问题,原本的问题只是开始,因为后面要走的路还有很多。
对于这个问题,我们得求助于10053事件,这个诊断事件能够从根本上解释清楚这个原因来。
当然开启10053,我开启了1级,日志量相对要更多一些。
    开启10053事件
ALTER SESSION SET EVENTS='10053 trace name context forever, level 1';
    运行SQL语句
    结束10053事件
ALTER SESSION SET EVENTS '10053 trace name context off';
    其中需要说明一点的是,如果采用如下的这种方式开启诊断事件,是不行的。
alter session set current_schema=ordermob;
select 。。。。
    from OP_ORDER WHERE ORDER_ID='160824165342672424'  AND USER_ID='15000501196112'  AND SUBSTR(CHANNEL_ID,0,4)=5046 ;
可以使用如下的方式来代替。
select 。。。
    from ordermob.OP_ORDER WHERE ORDER_ID='160824165342672424'  AND USER_ID='15000501196112'  AND SUBSTR(CHANNEL_ID,0,4)=5046 ;
10053事件中查询转换结果如下:
Final query after transformations:******* UNPARSED QUERY IS *******
SELECT "OP_ORDER"."APP_ID" "APP_ID",。。。。 FROM "ORDERMOB"."TB_ORDER" "OP_ORDER" WHERE "OP_ORDER"."ORDER_ID"='160824165342672424' AND "OP_ORDER"."USER_ID"='15000501196112' AND TO_NUMBER(SUBSTR(TO_CHAR("OP_ORDER"."CHANNEL_ID"),0,4))=5046
kkoqbc: optimizing query block SEL$1 (#0)

统计信息的一些明细信息如下:比如CLUF是集群因子。
***************************************
BASE STATISTICAL INFORMATION
***********************
Table Stats::
  Table: OP_ORDER  Alias: OP_ORDER
    #Rows: 2143  #Blks:  50  AvgRowLen:  157.00  ChainCnt:  0.00
Index Stats::
  Index: IDX_OP_ORDER_PUSH_STATE  Col#: 25
    LVLS: 1  #LB: 6  #DK: 1  LB/K: 6.00  DB/K: 50.00  CLUF: 50.00
  Index: IND_ORDER_USERID  Col#: 15
    LVLS: 1  #LB: 10  #DK: 230  LB/K: 1.00  DB/K: 2.00  CLUF: 625.00
  Index: SYS_C0011155  Col#: 4
    LVLS: 1  #LB: 9  #DK: 2143  LB/K: 1.00  DB/K: 1.00  CLUF: 1271.00

而下面的这段内容就让人更加疑惑了。Density代表列的密度,可以看到Density的值ORDER_ID对应的为0.000467,而USER_ID对应的为0.000233,
表中目前存在2000多条记录,在Oracle中,表里没有直方图信息的时候,是按照1/NDV的形式来计算的。而这里OERDER_ID对应的值,其实就是1/2143得到的值就是0.000467
而user_id的值如果按照1/NDV的形式的话,应该是0,0043478这样的值,很显然这里不是这个值。
***************************************
1-ROW TABLES:  OP_ORDER[OP_ORDER]#0
Access path analysis for OP_ORDER
***************************************
SINGLE TABLE ACCESS PATH
  Single Table Cardinality Estimation for OP_ORDER[OP_ORDER]
  Column (#4): ORDER_ID(
    AvgLen: 19 NDV: 2143 Nulls: 0 Density: 0.000467
  Column (#15):
    NewDensity:0.000233, OldDensity:0.000233 BktCnt:2143, PopBktCnt:2084, PopValCnt:171, NDV:230
  Column (#15): USER_ID(
    AvgLen: 15 NDV: 230 Nulls: 0 Density: 0.000233
    Histogram: Freq  #Bkts: 230  UncompBkts: 2143  EndPtVals: 230

这是为什么呢,我们来看看直方图的信息。可以看到ORDER_ID列是没有直方图信息的,而USER_ID列却含有。
SQL> SELECT COLUMN_NAME,NUM_DISTINCT,NUM_BUCKETS,HISTOGRAM
        FROM DBA_TAB_COL_STATISTICS WHERE OWNER='ORDERMOB' AND TABLE_NAME='OP_ORDER'
COLUMN_NAME                    NUM_DISTINCT NUM_BUCKETS HISTOGRAM
------------------------------ ------------ ----------- ---------------
APP_ID                                    1           1 FREQUENCY
CHANNEL_ID                                6           6 FREQUENCY
ACCOUNT                                 230           1 NONE
ORDER_ID                               2143           1 NONE
GOODS_ID                                 28           1 NONE
USER_ID                                 230         230 FREQUENCY
CREATE_DATE                            2010         254 HEIGHT BALANCED
这里需要提一下直方图分为两种,一种是频率直方图,显示为:FREQUENCY,另外一种是高度平衡直方图,显示为:HEIGHT BALANCED
高度均衡直方图适用于 数据分布不均匀 ,由于列中数据很多,这时数据比较密集,不利于分析和评估,这时直方图需要均衡化。
频率直方图适用于数据分布很均匀的情况。当然如果数据很平均,其实也没有太大的意义,直方图本身就是适用于对应列中数据分布比较倾斜的列(不均匀)
那么问题似乎有了一些眉目,我们知道在Oracle中收集统计信息的时候是推荐使用FOR ALL COLUMNS SIZE AUTO的选项的。
收集统计信息的语句大概是这样的形式。
exec dbms_stats.gather_table_stats(tabname => 'OP_ORDER',ownname => 'ORDERMOB',method_opt => 'FOR ALL COLUMNS SIZE AUTO');
所以我大胆做了一个测试,那就是取消直方图的信息。
exec dbms_stats.gather_table_stats(tabname => 'OP_ORDER',ownname
=> 'ORDERMOB',method_opt => 'FOR ALL COLUMNS SIZE 1');
再次查看执行计划,发现就会采用唯一性索引扫描了,达到了我们预期的效果。
当然问题来了,这个是为什么呢,收集统计信息中的auto选项是什么含义呢。为什么两个数据类型一样的(varchar2(64))的列,境遇却大大不同。且听我下回慢慢道来。

时间: 2024-10-24 23:07:46

一条SQL语句的执行计划变化探究的相关文章

一条SQL语句的执行计划变化探究(r10笔记第9天)

继续上次分析的一个问题,一个简单的SQL语句执行计划有些奇怪,明明可以走唯一性索引但是却走了另外一个索引. 当然了,最后逐步定位,发现是在直方图的地方有一些差别.取消直方图之后,执行计划立刻恢复了正常. 当然问题来了,这个是为什么呢,收集统计信息中的auto选项是什么含义呢.为什么两个数据类型一样的(varchar2(64))的列,境遇却大大不同. 我们来看看一些统计信息的数据. 为了跟进一步验证数据的分布律和选取代价,我们查询它的直方图信息. SQL>   select to_char(end

[20120104]稳定一条sql语句的执行计划.txt

[20120104]稳定一条sql语句的执行计划.txt http://www.itpub.net/thread-1495845-1-1.htmlhttp://space.itpub.net/267265/viewspace-723066 ORACLE8I升级11G R2后,查询系统视图特别慢 我的测试版本:SQL> select * from v$version where rownumBANNER------------------------------------------------

通过分析SQL语句的执行计划优化SQL(二)

优化|语句|执行 第5章 ORACLE的执行计划 背景知识:        为了更好的进行下面的内容我们必须了解一些概念性的术语: 共享sql语句    为了不重复解析相同的SQL语句(因为解析操作比较费资源,会导致性能下降),在第一次解析之后,ORACLE将SQL语句及解析后得到的执行计划存放在内存中.这块位于系统全局区域SGA(system global area)的共享池(shared buffer pool)中的内存可以被所有的数据库用户共享.因此,当你执行一个SQL语句(有时被称为一个

用C#执行SQL语句时,由于有些语句执行时间太长,在执行某一条的过程中,需要对该条语句进行标红,问怎么判断一条SQL语句正在执行中呢???

问题描述 急急急球大神指点!!!! 解决方案 解决方案二:需要对该条语句进行标红是啥意思?解决方案三:你看看这样行不行://这里执行对某行SQL语句文本设置为红色.stringinsertcommand=string.Format(@"insertintoGateChangeInfo(OldValue,NewValue,LastUpdateTime)values('{0}','{1}',{2})",TheOldGateNo.Trim(),textBox_Gate.Text.Trim()

通过分析SQL语句的执行计划优化SQL_MsSql

如何干预执行计划 - - 使用hints提示 基于代价的优化器是很聪明的,在绝大多数情况下它会选择正确的优化器,减轻了DBA的负担.但有时它也聪明反被聪明误,选择了很差的执行计划,使某个语句的执行变得奇慢无比.此时就需要DBA进行人为的干预,告诉优化器使用我们指定的存取路径或连接类型生成执行计划,从而使语句高效的运行.例如,如果我们认为对于一个特定的语句,执行全表扫描要比执行索引扫描更有效,则我们就可以指示优化器使用全表扫描.在Oracle中,是通过为语句添加hints(提示)来实现干预优化器优

通过分析SQL语句的执行计划优化SQL

如何干预执行计划 - - 使用hints提示 基于代价的优化器是很聪明的,在绝大多数情况下它会选择正确的优化器,减轻了DBA的负担.但有时它也聪明反被聪明误,选择了很差的执行计划,使某个语句的执行变得奇慢无比.此时就需要DBA进行人为的干预,告诉优化器使用我们指定的存取路径或连接类型生成执行计划,从而使语句高效的运行.例如,如果我们认为对于一个特定的语句,执行全表扫描要比执行索引扫描更有效,则我们就可以指示优化器使用全表扫描.在Oracle中,是通过为语句添加hints(提示)来实现干预优化器优

ORACLE数据库SQL语句的执行过程

SQL语句在 数据库中处理过程是怎样的呢?执行顺序呢?在回答这个问题前,我们先来回顾一下:在ORACLE数据库系统架构下,SQL语句由用户进程产生,然后传到相 对应的服务端进程,之后由服务器进程执行该SQL语句,如果是SELECT语句,服务器进程还需要将执行结果回传给用户进程. SQL语句的执行过程一般如下: 解析(PARSE)-- 绑定(BIND)--执行(EXECUTE)--提取(FETCH 只有SELECT才需要这步) 解析   服务器进程接收到一个SQL语句时,首先要将其转换成执行这个S

sql oracle-关于怎么快速执行10000条sql语句

问题描述 关于怎么快速执行10000条sql语句 由于我的数据库有几千万条数据,每一条查询都会花费0.5秒,但是10000条查询需要半个多小时,所以希望有快速一点的方法,求各位大神指点,下面是我的函数. /** * 这是一个横着的for循环,图的缩放级别是13,11*10方格,不同区域到不同区域的上车点数量 */ public static void CountListPointsOfOnetoOne() { ArrayList ListSql = new ArrayList(); double

SQL Server中如何清除特定语句的执行计划缓存

SQL server运行到一定的时候, 执行计划的缓存可能会相当大,有些能到几个GB的大小.这个时候假设某个语句比较复杂而且SQL server 生成的执行计划不够优化,你希望把该执行计划的缓存清除使得SQL server能够重新编译该语句.该如何做呢? 如果是存储过程则很好办,直接使用sp_recompile就可以了,如下所示.如果参数是表,那么所有用到该表的存储过程或http://www.aliyun.com/zixun/aggregation/17067.html">trigger都