使用索引的误区之五:空值的妙用

索引

使用索引的误区之五:空值的妙用
并不是因为完全为空的条目不被记录到索引中,就坚决不能使用空值,相反,有时候合理使用oracle的空值会为我们的查询带来几倍甚至几十倍的效率提高。

举个例子,加入有一个表,里面有个字段是“处理时间”,如果没有处理的事务,该列就为空,并且在大部分情况下,处理的事务总是在总记录数的10%或者更少,而等待处理的记录(“处理时间”这列为空)总是绝大多数的记录,那么在“等待时间”这列上建立索引,索引中就总是会保存很少的记录,我们希望的访问方式是,当访问表中所有代处理的记录(即10%或者更多的记录数目)时,我们希望通过全表扫描的方式来检索;然而,当我们希望访问已经处理的事务(即5%或者更少的记录数目)时,我们希望通过索引来访问,因为索引中的记录数目很少,请看下面的例子:

SQL> create table tt as select * from sys.dba_objects;

 

Table created

 

Executed in 0.601 seconds

 

SQL> alter table tt add (t int);

 

Table altered

 

Executed in 0.061 seconds

 

SQL> select count(*) from tt;

 

  COUNT(*)

----------

      6131c

 

Executed in 0.01 seconds

 

SQL> UPDATE tt set t=1 where owner='DEMO';

 

10 rows updated

 

Executed in 0.03 seconds

 

SQL> COMMIT;

 

Commit complete

 

Executed in 0 seconds

 

SQL> select count(*) from tt where OWNER='DEMO';

 

  COUNT(*)

----------

        10  ――――――――――――――已经处理的数目

 

Executed in 0.08 seconds

s

SQL> select count(*) from tt;

 

  COUNT(*)

----------

      6131      ――――――――――――――总记录数目

 

 

Executed in 0.01 seconds

 

下面的查询因为访问表中的大多数记录(代处理的记录,即10%以上的记录数目),可以看见,它如我们所希望的那样使用了全表扫描:

 

select object_name from tt where t is null;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE ACCESS FULL   | TT          |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("TT"."T" IS NULL)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.05 seconds

 

下面的查询因为要访问表中的少数记录,我们希望通过索引来访问:

select object_name from tt where t=1;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE ACCESS FULL   | TT          |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("TT"."T"=1)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.06 seconds

请注意,这里并没有如我们所希望的那样使用索引,而是使用了全表扫描,这里有一个结论:

建立了索引后,要想在CBO下合理的使用索引,一定要定期的更新统计信息

 

下面我们分析一下索引,看看有什么效果:

SQL> analyze index tt_idx validate structure;

 

Index analyzed

 

Executed in 0 seconds

 

SQL> select lf_rows from index_stats;

 

   LF_ROWS

----------

        10  ――――――――――索引中总共有10行

 

Executed in 0.05 seconds

 

SQL> exec dbms_stats.gather_index_stats('DEMO','TT_IDX');

 

PL/SQL procedure successfully completed

 

Executed in 0.03 seconds

 

SQL> SELECT DISTINCT_KEYS FROM USER_INDEXES;

 

DISTINCT_KEYS

-------------

            1   ――――――――――只有一个键值

 

Executed in 0.05 seconds

 

SQL> select * from tt where t is null;

 

已选择6121行。

 

 

Execution Plan

----------------------------------------------------------

   0      SELECT STATEMENT Optimizer=CHOOSE

   1    0   TABLE ACCESS (FULL) OF 'TT'

 

 

 

 

Statistics

----------------------------------------------------------

          0  recursive calls

          0  db block gets

        485  consistent gets

          0  physical reads

          0  redo size

     355012  bytes sent via SQL*Net to client

       4991  bytes received via SQL*Net from client

        410  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

       6121  rows processed

 

SQL> select * from tt where t=5;

 

未选定行

 

 

Execution Plan

----------------------------------------------------------

   0      SELECT STATEMENT Optimizer=CHOOSE

   1    0   TABLE ACCESS (BY INDEX ROWID) OF 'TT'

   2    1     INDEX (RANGE SCAN) OF 'TT_IDX' (NON-UNIQUE)

 

 

 

 

Statistics

----------------------------------------------------------

          0  recursive calls

          0  db block gets

          1  consistent gets

          0  physical reads

          0  redo size

        964  bytes sent via SQL*Net to client

        372  bytes received via SQL*Net from client

          1  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

          0  rows processed

 

SQL> select * from tt where t=1;

 

已选择10行。

 

 

Execution Plan

----------------------------------------------------------

   0      SELECT STATEMENT Optimizer=CHOOSE

   1    0   TABLE ACCESS (BY INDEX ROWID) OF 'TT'

   2    1     INDEX (RANGE SCAN) OF 'TT_IDX' (NON-UNIQUE)

 

 

 

 

Statistics

----------------------------------------------------------

          0  recursive calls

          0  db block gets

          4  consistent gets

          0  physical reads

          0  redo size

       1639  bytes sent via SQL*Net to client

        503  bytes received via SQL*Net from client

          2  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

         10  rows processed

 

SQL> update tt set t=2 where t=1;

 

已更新10行。

 

 

Execution Plan

----------------------------------------------------------

   0      UPDATE STATEMENT Optimizer=CHOOSE

   1    0   UPDATE OF 'TT'

   2    1     INDEX (RANGE SCAN) OF 'TT_IDX' (NON-UNIQUE)

 

 

 

 

Statistics

----------------------------------------------------------

          0  recursive calls

         14  db block gets

          1  consistent gets

          0  physical reads

       3216  redo size

        616  bytes sent via SQL*Net to client

        527  bytes received via SQL*Net from client

          3  SQL*Net roundtrips to/from client

          2  sorts (memory)

          0  sorts (disk)

         10  rows processed

 

SQL> set autotrace traceonly

SQL> update tt set t=3 where t is null;

 

6121 rows updated.

 

 

Execution Plan

----------------------------------------------------------

   0      UPDATE STATEMENT Optimizer=CHOOSE

   1    0   UPDATE OF 'TT'

   2    1     TABLE ACCESS (FULL) OF 'TT'

 

 

 

 

Statistics

----------------------------------------------------------

          0  recursive calls

      18683  db block gets

         80  consistent gets

          0  physical reads

    2583556  redo size

        618  bytes sent via SQL*Net to client

        533  bytes received via SQL*Net from client

          3  SQL*Net roundtrips to/from client

          1  sorts (memory)

          0  sorts (disk)

       6121  rows processed

 

SQL>

 

 

时间: 2025-01-04 15:58:43

使用索引的误区之五:空值的妙用的相关文章

使用索引的误区之四:空值对索引的影响

索引 使用索引的误区之四:空值对索引的影响我们首先做一些测试数据: SQL> create table t(x int, y int);   Table created   请注意,这里我对表t做了一个唯一(联合)索引: SQL> create unique index t_idx on t(x,y);   Index created   SQL> insert into t values(1,1);   1 row inserted   SQL> insert into t va

使用索引的误区之二:使用了 和 != 操作符,导致查询不使用索引

索引 使用索引的误区之二:使用了 <> 和 != 操作符,导致查询不使用索引首先,请记住这个结论: 使用了<> 和!=后,就不会使用索引   例如,下面的例子使用了<>,所以查询没有用到索引 select empno from emp where empno <>10;   PLAN_TABLE_OUTPUT ---------------------------------------------------------------------------

使用索引的误区之六:为索引列都建立索引

索引 使用索引的误区之六:为所有列都建立索引我们知道,建立索引是为了提高查询的效率,但是同时也应该注意到,索引增加了对DML操作(insert, update, delete)的代价,而且,一给中的索引如果太多,那么多数的索引是根本不会被使用到的,而另一方面我们维护这些不被使用的所以还要大幅度降低系统的性能.所以,索引不是越多越好,而是要恰到好处的使用.   比如说,有些列由于使用了函数,我们要使用已有的索引(如一些复合索引)是不可能的(详细请参见前面"函数索引"),那么就必须建立单独

使用索引的误区之一:没有使用复合索引的前导列导致查询不使用索引

索引 使用索引的误区之一:没有使用复合索引的前导列导致查询不使用索引在oracle中,我们经常以为建立了索引,sql查询的时候就会如我们所希望的那样使用索引,事实上,oracle只会在一定条件下使用索引,这里我们总结数第一点:oracle会在条件中包含了前导列时使用索引,即查询条件中必须使用索引中的第一个列,请看下面的例子 SQL> select * from tab;   TNAME                          TABTYPE  CLUSTERID -----------

使用索引的误区之三:基于函数的索引

函数|索引 使用索引的误区之三:基于函数的索引使用基于函数的索引(BFI, Based Function Index): 从Oracle 8i开始,可以使用基于函数的索引来提高查询性能,   使用基于函数的索引,需要几个条件: 1,  用户需要有create index或者create any index权限 2,  用户需要有query rewrite或者global query rewirte权限 3,  设置系统参数 query_rewrite_enabled=TRUE 和 query_r

Sql Server 查询性能优化之走出索引的误区分析_MsSql

据了解绝大多数开发人员对于索引的理解都是一知半解,局限于大多数日常工作没有机会.也什么没有必要去关心.了解索引,实在哪天某个查询太慢了找到查询条件建个索引就ok,哪天又有个查询慢了,再建立个索引就是,或者干脆把整个查询SQL直接发给DBA,让DBA直接帮忙优化了,所以造成的状况就是开发人员对于索引的理解.认识很局限,以下就把我个人对于索引的理解及浅薄认识和大家分享下,希望能解除一些大家的疑惑,一起走出索引的误区 误区1.在表上建立了索引,在查询时用到了索引的列,索引就一定会生效 首先明确下这样的

分析Sql Server查询性能优化之走出索引的误区

误区1.在表上建立了索引,在查询时用到了索引的列,索引就一定会生效 首先明确下这样的观点是错误的,SQL Server查询优化器是基于开销进行选择的优化器,通过一系列复杂判断来决定是否使用索引.使用什么类型索引.使用那个索引.SQL Server内部维护着索引列上的数据的统计,统计信息会随着索引列内容的变化而变化,索引的有效期完全取决于索引列上的统计信息,随着数据的变化关于索引的检索机制也随之变化.对于查询优化器来说始终保持查询开销最低始终是其的不二选择,如果一个非聚集索引的列上有大量的重复值,

Sql Server 查询性能优化之走出索引的误区分析

据了解绝大多数开发人员对于索引的理解都是一知半解,局限于大多数日常工作没有机会.也什么没有必要去关心.了解索引,实在哪天某个查询太慢了找到查询条件建个索引就ok,哪天又有个查询慢了,再建立个索引就是,或者干脆把整个查询SQL直接发给DBA,让DBA直接帮忙优化了,所以造成的状况就是开发人员对于索引的理解.认识很局限,以下就把我个人对于索引的理解及浅薄认识和大家分享下,希望能解除一些大家的疑惑,一起走出索引的误区 误区1.在表上建立了索引,在查询时用到了索引的列,索引就一定会生效 首先明确下这样的

zac北京MADCon大会深入解析SEO十大误区

众所周知,北京MADCon 大会已经结束了,但是其意义已经深入影响甚至是引领了国内seo.在这里杭州seo寂寞哥和大家聊聊zac北京MADCon 大会演讲的SEO十大误区.虽然seo在国内发展的如火如荼,可是大部分seo朋友还是处于学习发展期,不可避免的经常不如seo误区.接下来一起来看看seo站长朋友经常步入那十大误区. SEO误区之一:所谓"百度权重"是网站权重指标 什么是网站权重?所谓"百度权重"是排名查询的简单反向应用.其实"百度权重"和