在 DB2 数据库中,索引是按一个或多个键的值进行逻辑排序的一组指针。指针可以引用表中的行、MDC 表中的块,或在 XML 存储对象中的 XML 数据。 索引通常用于加快对表中的行的访问。若在表上定义了良好的索引,查询就可以更快地访问行。
索引是数据库对象。它们是物理对象,而不是逻辑对象(如,视图)。因此,索引也占用">存储空间,需要那些会占用系统资源的必要维护。一组精心设计的索引可以提高 DB2 系统的性能。
索引类型
索引有多种类型,在设计物理 DB2 数据库模型时可根据不同目的进行选择。
惟一索引和非惟一索引
您可以使用惟一索引在表的索引列上强制惟一性。如果表上创建惟一索引,行在索引键列上不能有相同的数据值。非惟一索引对表没有这种约束。
集群和非集群索引
集群索引是数据页面中行的顺序与索引中行的顺序相对应的索引。一个表中只能存在一个集群索引。然而,对一个表上的非集群索引的数量并没有实际限制。
分区和非分区索引
这些类型的索引只适用于范围分区表。分区索引由一组索引分区组成,其中每个索引分区都包含相应数据分区的索引条目。每个索引分区只包含对其相应数据分区中的数据的引用。非分区索引可应用于整个表。
XML 索引
在 XML 列上建立的索引是 XML 索引。XML 索引使用一个特定的 XML 模式表达式为 XML 文档中的路径和值建立索引,这些 XML 文档存储在单个 XML 列中。
多维集群 (MDC) 块索引
当创建 MDC 表时,会自动创建两个索引:一个维度块索引,其中包含一个维度的每个被占用块的指针;一个复合块索引,其中包含所有维度键列,用于在插入和更新活动期间维护集群。
OLTP 工作负载的索引指南
在一个特定的表上可以定义不超过 32767 的任意数量的索引。它们对查询性能可以起到有益的作用。
索引管理器必须在删除、插入和更新操作期间维护索引。OLTP 工作负载的主要组成部分包括删除、插入和更新操作。因此,如果为一个接收许多更新的表建立大型索引键或多个索引,则有可能会减缓这些操作的处理。 索引使用磁盘空间是因为这些空间是物理数据库对象。所使用的磁盘空间量根据键列的长度和被索引的行数而有所不同。索引的大小随着更多数据被插入到表中而增加。因此,在规划数据库的大小时应考虑被索引的数据量。
索引还是不索引
在考虑表上的索引时,请注意,这些好处会带来一定的成本。索引的惟一目的是加快从表中查找某个特定的值。除了存储成本之外,还有删除、插入和更新操作中的额外的索引维护成本。 在创建索引时请记住,虽然索引可以提高读取性能,但它们会给写性能带来负面影响。出现这种负面影响是因为数据库管理器必须更新写入表中的每一行的索引。因此,只应在有明确的整体性能优势时才能创建索引。
索引列的良好候选者
在所有主键 (PK) 和大部分外键上建立索引 (FK),这很重要,因为大多数联接发生在 PK 和 FK 之间。FK 索引也提高了引用完整性检查的性能。为 PK 索引显式提供索引,可以实现更简单的管理。如果您没有指定 PK,DB2 数据库管理器会自动生成一个使用系统生成的名称的 PK,这更加难以管理。 经常在 WHERE、GROUP BY 或 ORDER BY 子句中引用的列是很好的索引候选列。此规则的一个例外是谓词提供了最低限度的筛选。索引对于不等式几乎没用,因为不等式提供有限的筛选。在 WHERE 子句中,不等式示例是 WHERE cost <> 4。
选择复合索引的前导列有利于匹配索引扫描。前导列应该能够反映经常在 WHERE 子句中使用的列。DB2 数据库管理器只通过在 WHERE 子句中所使用的前导列的 B-tree 索引自上而下进行导航,该导航也称为匹配索引扫描。如果某个索引的前导列不在 WHERE 子句中,优化器可能仍然使用该索引,但优化器被迫在整个索引中使用非匹配索引扫描。 同样,在频繁查询的 GROUP BY 子句中出现的列也可能会受益于索引的创建。如果用于分组的值的数量相对于被分组的行的数量较小,这些列的受益会特别明显。
按索引键对列进行排序,从最独特的列到最不独特的列,这可以提供更快的数据访问。虽然按索引键对列进行排序在创建索引时并无区别,但对于优化器,在决定是否使用索引时,这可能会有明显区别。例如,如果一个查询有一个 ORDER BY col1,col2 子句,那么可能会使用在 (col1,col2) 上创建的索引,但可能不会使用在 (col2,col1) 上创建的索引。同样,如果查询指定了一个条件,如 WHERE col1 >= 50 and col1 <= 100 or WHERE col1=74,那么在 (col1) 或在 (col1,col2) 上的索引可能会有用,但在 (col2,col1) 上使用索引的机会就少得多。
使用包含列可以启用数据检索的仅索引访问,从而提高性能。包含列并不是惟一索引键的一部分,但它在索引中储存或维护。通过使用 CREATE INDEX 语句的 INCLUDE 子句,在创建惟一索引时可以指定包含列。只有惟一键列会被排序,并被视作惟一。 例如,如果在 col1上有一个惟一索引,并且 col2被指定为包含列,像 SELECT col1, col2 FROM table1 WHERE col1 < 10 这样的查询会导致仅索引 (index-only) 访问。 包含列会增加索引的空间要求。如果经常更新所包含的列,包含列也会增加索引维护成本。更新包含列的维护成本小于更新键列的成本,但大于更新不属于索引的列的成本。