Sql Server之旅——第十站 看看DML操作对索引的影响

原文:Sql Server之旅——第十站 看看DML操作对索引的影响

  我们都知道建索引是需要谨慎的,当只有利大于弊的时候才适合建,我们也知道建索引是需要维护成本的,这个维护也就在于DML操作了,

下面我们具体看看到底DML对索引都有哪些内幕。。。。

 

一:delete操作

  现在我们已经知道,索引都是以B树的形式存在的,既然是B树,我们就要看看他们的叶子节点和分支结点,先准备点测试数据,如下图:

CREATE TABLE Person(ID INT,NAME CHAR(200))
CREATE INDEX idx_Name ON Person(NAME)

DECLARE @ch AS INT=65
WHILE @ch<=122
BEGIN
    INSERT INTO dbo.Person(ID,NAME)
    VALUES
    (
      @ch,
      REPLICATE(CHAR(@ch),200)
    )
    SET @ch=@ch+1
END

<1> 叶子结点的变化

  从上面的图中大概可以看到,当我插入完毕后,现在有4个索引数据页,其中PID=200的为分支数据页,其他三个为叶子节点数据页,分别

为175,201,202号数据页,然后我就挑选第二个叶子节点数据页201号,看看里面的数据是啥样的。

从数据页中可以看到在201号数据页中有18个槽位,当然除了通过槽位看记录条数之外,你还可以通过Pageheader中的m_slotCnt来观察记

录个数,如下图:

接下来,我们看看slot0槽位的内容是啥样,如下图:

 1 0000000000000000:   16484848 48484848 48484848 48484848 †.HHHHHHHHHHHHHHH
 2 0000000000000010:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 3 0000000000000020:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 4 0000000000000030:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 5 0000000000000040:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 6 0000000000000050:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 7 0000000000000060:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 8 0000000000000070:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
 9 0000000000000080:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
10 0000000000000090:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
11 00000000000000A0:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
12 00000000000000B0:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
13 00000000000000C0:   48484848 48484848 48970000 00010007 †HHHHHHHHH.......
14 00000000000000D0:   00020000 ††††††††††††††††††††††††††††....      

看到内容之后,我们把这条记录删掉,然后快速的观察数据页的变化,很有意思的。。。。如下图:

仔细观察上面的图,你会看到m_slotCnt=18。。。。你也看到m_ghostRecCnt=1,看这个名字你就知道是“幻象”的意思。。。正因为被

标记为幻象,所以sqlserver的后台进程会在某个时候把数据正真的删除掉,比如你过个几秒之后再查看就能看到真的被清除了。

 

<2> 分支节点的变化

    说完叶子节点,然后我们继续看看分支节点,通过前面的博文,你应该知道在分支节点中是依次保存着排序后的每个叶子节点中的最小值,刚好

我删除了第二个叶子节点的第一个值,那这个值也正好保存在分支节点中,那下面一个问题来了,我刚才删除了ID=72的记录,那这个ID=72的还会

在分支节点中保存吗???不用太兴奋,我们用数据来说说看,继续查看200号数据页。

 

二:insert操作

  我们知道索引都是按照索引列升序的,那当我insert的时候,是不是需要给我插入到排序的指定位置呢???比如说我刚才删除的HHH。。。

数据,这次我再insert的时候,是不是需要给我插入到第二个数据页的slot0位置呢???下面继续用数据说话。

1 INSERT INTO dbo.Person VALUES(72,REPLICATE(CHAR(72),200))
2 DBCC PAGE(Ctrip,1,201,1)
 1 Slot 0, Offset 0x101c, Length 212, DumpStyle BYTE
 2
 3 Record Type = INDEX_RECORD           Record Attributes =  NULL_BITMAP     Record Size = 212
 4
 5 Memory Dump @0x000000000FE5B01C
 6
 7 0000000000000000:   16686868 68686868 68686868 68686868 †.hhhhhhhhhhhhhhh
 8 0000000000000010:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
 9 0000000000000020:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
10 0000000000000030:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
11 0000000000000040:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
12 0000000000000050:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
13 0000000000000060:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
14 0000000000000070:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
15 0000000000000080:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
16 0000000000000090:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
17 00000000000000A0:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
18 00000000000000B0:   68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh
19 00000000000000C0:   68686868 68686868 68c10000 00010002 †hhhhhhhhh.......
20 00000000000000D0:   00020000 ††††††††††††††††††††††††††††....
21
22 Slot 1, Offset 0x1f04, Length 212, DumpStyle BYTE
23
24 Record Type = INDEX_RECORD           Record Attributes =  NULL_BITMAP     Record Size = 212
25
26 Memory Dump @0x000000000FE5BF04
27
28 0000000000000000:   16484848 48484848 48484848 48484848 †.HHHHHHHHHHHHHHH
29 0000000000000010:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
30 0000000000000020:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
31 0000000000000030:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
32 0000000000000040:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
33 0000000000000050:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
34 0000000000000060:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
35 0000000000000070:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
36 0000000000000080:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
37 0000000000000090:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
38 00000000000000A0:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
39 00000000000000B0:   48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH
40 00000000000000C0:   48484848 48484848 48c10000 00010015 †HHHHHHHHH.......
41 00000000000000D0:   00020000 ††††††††††††††††††††††††††††....       

从上面可以看到,当我再次把删除的”H"插入到数据页的时候,发现“H”在201号数据页的slot1位置了,有人就奇怪了,,,为什么不在slot0

的???仔细想想确实可以告诉我们一个道理,那就是sql是不区别大小写的,所以“H”和“h”对sqlserver来说都是一样的,仔细想想其实还有

一个问题,那就是数据页分裂,比如说当你insert的数据页已满,那这时候该怎么办呢?sqlserver的手段就是数据页分裂,将满页的一半数据

导出到新分配的数据页,同样我也可以做个例子。

1 CREATE TABLE Person(ID INT,NAME CHAR(5) DEFAULT 'xxxxx')
2 CREATE INDEX idx_Name ON Person(NAME)
3
4 DECLARE @i as int=1
5 WHILE @i<801
6 BEGIN
7     INSERT INTO dbo.Person(ID) VALUES(@i)
8     SET @i=@i+1
9 END

接下来,我导出126号数据页的记录,可以看到它的范围是1-449,如下图:

下面我要做的事情就是插入一个ID在1-449范围的一条记录,这样的话就会造成数据页分裂了,对不对。

可以看到,现在多了一个192号数据页,是不是很有意思,哈哈~~~然后我就非常好奇的再次导出126,192号数据页,看看数据是不是只剩

一半啦~~~

 

三:update操作

  如果你看懂了上面的insert和delete,那么update就是这两个操作的组合,对不对。。。所以也没什么好说的。

 

好了,夜深了,洗洗睡了~

 

时间: 2024-09-11 19:37:44

Sql Server之旅——第十站 看看DML操作对索引的影响的相关文章

Sql Server之旅——第十站 看看DML操作对索引的影响 

我们都知道建索引是需要谨慎的,当只有利大于弊的时候才适合建,我们也知道建索引是需要维护成本的,这个维护也就在于DML操作了, 下面我们具体看看到底DML对索引都有哪些内幕.... 一:delete操作 现在我们已经知道,索引都是以B树的形式存在的,既然是B树,我们就要看看他们的叶子节点和分支结点,先准备点测试数据,如下图: CREATE TABLE Person(ID INT,NAME CHAR(200)) CREATE INDEX idx_Name ON Person(NAME) DECLAR

Sql Server之旅——第十四站 深入的探讨锁机制

原文:Sql Server之旅--第十四站 深入的探讨锁机制 上一篇我只是做了一个堆表让大家初步的认识到锁的痉挛状态,但是在现实世界上并没有这么简单的事情,起码我的表不会没有索引对吧,,,还 有就是我的表一定会有很多的连接过来,10:1的读写,很多码农可能都会遇到类似神乎其神的死锁,卡住,读不出来,插不进入等等神仙的事情导致性 能低下,这篇我们一起来探讨下.   一: 当select遇到性能低下的update会怎么样? 1. 还是使用原始的person表,插入6条数据,由于是4000字节,所以两

Sql Server之旅——第十二站 sqltext的参数化处理

原文:Sql Server之旅--第十二站 sqltext的参数化处理   说到sql的参数化处理,我也是醉了,因为sql引擎真的是一个无比强大的系统,我们平时做系统的时候都会加上缓存,我想如果没有缓存,就不会有什么 大网站能跑的起来,而且大公司一般会在一个东西上做的比较用心,比较细,sqlserver同样也使用了缓存,其中就包括Data cache 和Plan cache两个大头. 现在我们也知道了Plan cache包括上一篇生成的xml结构和sql text,更有趣的是,sql text

Sql Server之旅——第十三站 对锁的初步认识

原文:Sql Server之旅--第十三站 对锁的初步认识 终于这个系列快结束了,马上又要过年了,没什么心情写博客...作为一个开发人员,锁机制也是我们程序员必须掌握的东西,很久之前 在学习锁的时候,都是教科书上怎么说,然后我怎么背,缺少一个工具让我们眼见为实...如果这样的话,学习一个东西就很容易忘记... 因为这些都是你背诵过来的...这篇的话我就来分享一个工具来帮助我们学习锁.   一:到底都有哪些锁 学习锁之前,必须要知道锁大概有几种???通常情况下作为码农我们只需知道如下几个锁即可..

Sql Server之旅——第四站 你必须知道的非聚集索引扫描

原文:Sql Server之旅--第四站 你必须知道的非聚集索引扫描 非聚集索引,这个是大家都非常熟悉的一个东西,有时候我们由于业务原因,sql写的非常复杂,需要join很多张表,然后就泪流满面了...这时候就 有DBA或者资深的开发给你看这个猥琐的sql,通过执行计划一分析...或许就看出了不该有的表扫描...万恶之源...然后给你在关键的字段加上非 聚集索引后...才发现提速比阿斯顿马丁还要快...那么一个问题来了,为什么非聚集索引能提速这么快...怎么做到的???是不是非常的好奇??? 这

Sql Server之旅——第十一站 简单说说sqlserver的执行计划

我们知道sql在底层的执行给我们上层人员开了一个窗口,那就是执行计划,有了执行计划之后,我们就清楚了那些烂sql是怎么执行的,这样 就可以方便的找到sql的缺陷和优化点. 一:执行计划生成过程 说到执行计划,首先要知道的是执行计划大概生成的过程,这样就可以做到就心中有数了,下面我画下简图: 1. 分析过程 这三个比较容易理解,首先我们要保证sql的语法不能错误,select和join的表是必须存在的,以及你是有执行这个sql的权限,对不对... 这样我们就走完了执行计划生命周期的第一个流程. 2

Sql Server之旅——第七站 为什么都说状态少的字段不能建索引

我们在学sqlserver的时候,大多教科书和前辈们都说状态少的字段不要建索引,由此带来的开销还不如不建索引,但是这句话有多少人真的知道, 或者说有多少人真的对此有比较深刻的理解,而不是听别人道听途说...这样记得快,忘记的也不慢...这篇我来分析一下这句话到底有几个意思.   一:现象 首先我们还是用测试数据来发现问题,我先建立一个Person,有5个字段,建表sql如下: DROP TABLE dbo.Person CREATE TABLE Person(ID INT PRIMARY KEY

Sql Server之旅——第六站 使用winHex利器加深理解数据页

        这篇我来介绍一个winhex利器,这个工具网上有介绍,用途大着呢,可以用来玩数据修复,恢复删除文件等等....它能够将一个file解析成 hex形式,这样你就可以对hex进行修改,然后你就可以看到修复后的结果,为什么要在sqlserver系列中说这个呢???很简单呀,sqlserver的DB本 质上也是一个mdf文件,对吧,既然是文件,我就可以利用winhex对它进行随意的修改,然后你也知道sqlserver的数据都是以数据页的形式封装的, 那我就可以修改它的数据页,对不对,这样

Sql Server之旅——第八站 复合索引和include索引到底有多大区别?

周末终于搬进出租房了,装了宽带....才发现没网的日子...那是一个怎样的与世隔绝呀...再也受不了那样的日子了....好了,既然网 安上去了,还得继续我的这个系列. 索引和锁,这两个主题对我们开发工程师来说,非常的重要...只有理解了这两个主题,我们才能写出高质量的sql语句,在之前的博客中,我所说的 索引都是单列索引...当然数据库不可能只认单列索引,还有我这篇的复合索引,说到复合索引,可能熟悉的人又会说到include索引,那这两个索引到底 有什么区别呢,当然我也是菜鸟一枚...所以下面的