MongoDB 部分索引(Partial Indexes)

MongoDB部分索引只为那些在一个集合中,满足指定的筛选条件的文档创建索引。由于部分索引是一个集合文档的一个子集,因此部分索引具有较低的存储需求,并降低了索引创建和维护的性能成本。部分索引通过指定过滤条件来创建,可以为MongoDB支持的所有索引类型使用部分索引。

一、语法描述

    创建部分索引语法
    db.collection.createIndex(keys, options)

    options可以使用partialFilterExpression,即部分过滤表达式,其类型为文档类型

    过滤表达式通常包括以下

            equality expressions (i.e. field: value or using the $eq operator),
            $exists: true expression,
            $gt, $gte, $lt, $lte expressions,
            $type expressions,
            $and operator at the top-level only

    过滤表达式使用示例:
        db.persons.createIndex({name:1},{partialFilterExpression:{age: {$gt:25}}})

二、演示部分索引

1、演示环境

    > db.version()
    3.2.10

    //演示中用到的文档,可参考:http://blog.csdn.net/leshami/article/details/52672310

    > db.persons.find().pretty().limit(1)
    {
            "_id" : ObjectId("5812cbaaa129eed14b46458d"),
            "name" : "robinson.cheng",
            "age" : 25,
            "email" : "robinson.cheng@qq.com",
            "score" : {
                    "c" : 89,   //Author : Leshami
                    "m" : 96,   //Blog   : http://blog.csdn.net/leshami
                    "e" : 87
            },
            "country" : "USA",
            "books" : [
                    "JS",
                    "C++",
                    "EXTJS",
                    "MONGODB"
            ]
    }

    > db.persons.find().count()
    11

2、创建部分索引

//基于age列创建大于25岁的部分索引
    > db.persons.createIndex({country:1},{partialFilterExpression: {age: {$gt:25}}})
    {
            "createdCollectionAutomatically" : false,
            "numIndexesBefore" : 1,
            "numIndexesAfter" : 2,
            "ok" : 1
    }

    //查询谓词条件为{country:"China",age:{$gt:25},年龄大于25
    > db.persons.find({country:"China",age:{$gt:25}}).explain()
    {
            "queryPlanner" : {
                    ......
                    "winningPlan" : {
                            "stage" : "FETCH",
                            "filter" : {
                                    "age" : {
                                            "$gt" : 25
                                    }
                            },
                            "inputStage" : {
                                    "stage" : "IXSCAN",
                                    "keyPattern" : {
                                            "country" : 1
                                    },
                                    "indexName" : "country_1",
                                       .......
                                    "isPartial" : true,  //这里描述为部分索引
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "country" : [
                                                    "[\"China\", \"China\"]"
                         ......
            "ok" : 1
    }

    //查询谓词条件为{country:"China",age:{$gte:25}},年龄大于等于25
    > db.persons.find({country:"China",age:{$gte:25}}).explain()
    {
            "queryPlanner" : {
                    ........
                    "winningPlan" : {
                            "stage" : "COLLSCAN", //此时为集合扫描方式
                            "filter" : {
                                    "$and" : [
                                            {
                                                    "country" : {
                                                            "$eq" : "China"
                                                    }
                                            },
                                            {
                                                    "age" : {
                                                            "$gte" : 25
              ......
            "ok" : 1
    }

    //查询谓词为{country:"China",age:{$gte:26}},年龄大于等于26
    > db.persons.find({country:"China",age:{$gte:26}}).explain()
    {
            "queryPlanner" : {
             ......
                    "winningPlan" : {
                            "stage" : "FETCH",
                            "filter" : {
                                    "age" : {
                                            "$gte" : 26
                                    }
                            },
                            "inputStage" : {
                                    "stage" : "IXSCAN",//此时为索引扫描,因为26大于索引值25
                                    "keyPattern" : {
                                            "country" : 1
                                    },
                                    "indexName" : "country_1",
                                     ......
                                    "isPartial" : true,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "country" : [
                                                    "[\"China\", \"China\"]"
             ......
            "ok" : 1
    }

    //谓词{country:"China",age:{$lt:25},年龄小于25
    > db.persons.find({country:"China",age:{$lt:25}}).explain()
    {
            "queryPlanner" : {
           .......
                    "winningPlan" : {
                            "stage" : "COLLSCAN", //小于25为集合扫描方式
                            "filter" : {
                                    "$and" : [
                                            {
                                                    "country" : {
                                                            "$eq" : "China"
                                                    }
                                            },
                                            {
                                                    "age" : {
                                                            "$lt" : 25
            ......
            "ok" : 1
    }

三、创建部分唯一索引的一些限制

    部分索引只为集合中那些满足指定的筛选条件的文档创建索引。
    如果你指定的partialfilterexpression和唯一约束、那么唯一性约束只适用于满足筛选条件的文档。
    具有唯一约束的部分索引不会阻止不符合唯一约束且不符合过滤条件的文档的插入。

    示例文档
    > db.users.insertMany([
    { "_id" : ObjectId("56424f1efa0358a27fa1f99a"), "username" : "david", "age" : 29 },
    { "_id" : ObjectId("56424f37fa0358a27fa1f99b"), "username" : "amanda", "age" : 35 },
    { "_id" : ObjectId("56424fe2fa0358a27fa1f99c"), "username" : "rajiv", "age" : 57 }])

    //为集合添加索引
    > db.users.createIndex(
        { username: 1 },
        { unique: true, partialFilterExpression: { age: { $gte: 21 } } }
     )

    //在集合users上插入用户名相同的文档,收到了重复键的错误提示
    > db.users.insert( { username: "david", age: 27 } )
    WriteResult({
            "nInserted" : 0,
            "writeError" : {
                    "code" : 11000,
                    "errmsg" : "E11000 duplicate key error collection: test.users index: username_1 dup key: { : \"david\" }"
            }
    })

    //下面插入年龄小于部分索引值或者age键为空的同用户名文档,可以成功插入。
    //也就是说对于不在部分索引限制之类的其他键值重复是允许的
    > db.users.insert( { username: "david", age: 20 } )
    WriteResult({ "nInserted" : 1 })
    > db.users.insert( { username: "amanda" } )
    WriteResult({ "nInserted" : 1 })
    > db.users.insert( { username: "rajiv", age: null } )
    WriteResult({ "nInserted" : 1 })

四、部分索引与稀疏索引的比对

    稀疏索引指的是在一个集合中文档A,C中包含某些列,如Key_A,而其他文档不包含Key_A,Key_A上的索引为稀疏索引
    部分索引代表的稀疏索引提供的功能的一个超集,应该优先于稀疏索引
    部分索引主要是针对那些满足条件的文档(非字段缺失)创建索引,比稀疏索引提供了更具有表现力
    稀疏索引是文档上某些字段的存在与否,存在则为其创建索引,否则该文档没有索引键

    如下示例,可以使用部分索引达到实现稀疏索引相同的效果(在名字列上过滤表达式为判断列是否存在)

    db.contacts.createIndex(
       { name: 1 },
       { partialFilterExpression: { name: { $exists: true } } }
    )

    基于非索引列过滤的部分索引
    如下示例,过滤表达式为非索引列,及email列
    db.contacts.createIndex(
       { name: 1 },
       { partialFilterExpression: { email: { $exists: true } } }
    )       

    在这种情况下,索引要如何才能被使用到呢?
    查询谓词在email字段上应该包含一个非空的匹配,同时也要使用name作为过滤条件,如下:

    //下面的查询将使用索引
    db.contacts.find( { name: "xyz", email: { $regex: /\.org$/ } } )

    //下面的查询将不会使用到索引
    db.contacts.find( { name: "xyz", email: { $exists: false } } )

五、小结

a、部分索引就是带有过滤条件的索引,即索引只存在与某些文档之上
b、满足过滤条件的文档在查询时,其执行计划将使用该列上的索引,否则不会被使用
c、稀疏索引与部分索引的差异是一个是基于某些文档存在的列,一个是列上的某些匹配条件的值
d、可以基于某个列上创建索引,而在另外的列来使用过滤条件

六、更多参考
MongoDB 单键(列)索引
MongoDB 复合索引
MongoDB 多键索引
MongoDB执行计划获取(db.collection.explain())
MongoDB 唯一索引

时间: 2024-09-27 22:59:46

MongoDB 部分索引(Partial Indexes)的相关文章

MongoDB 稀疏(间隙)索引(Sparse Indexes)

稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,即使索引字段包含一个空值.也就是说间隙索引可以跳过那些索引键不存在的文档.因为他并非包含所有的文档,因此称为稀疏索引.与之相对的非稀疏索引或者说普通索引则包含所有的文档以及为那些不包含索引的字段存储null值. 一.间隙索引创建描述 稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,跳过索引键不存在的文档 本文中后面的描述使用间隙索引 创建索引的语法: db.collection.createIndex(keys, optio

MongoDB的索引代码实现--BtreeBasedAccessMethod

MongoDB的索引代码实现--BtreeBasedAccessMethod 前言 学习开源软件的最好的办法就是阅读代码,MongoDB整个代码库有接近90万行代码,DB核心层大概50万行,代码量确实非常多.本文作为MongoDB代码导读的第一篇,从Index部分上入手分析代码实现.为何从索引部分开始介绍,首先代码量较少,总共5000多行,且相对其他模块来说比较独立:其次索引对数据库的优化至关重要,了解其实现,对日后的运维优化和索引自身的限制约定都具有实际意义.毕竟文档上的描述还是没有代码来的准

[20130812]12c Partial Indexes For Partitioned Tables Part I.txt

[20130812]12c Partial Indexes For Partitioned Tables Part I.txt 参考链接:http://richardfoote.wordpress.com/2013/07/08/12c-partial-indexes-for-partitioned-tables-part-i-ignoreland/ 更多的是重复作者的测试,加深理解: 1.测试环境: SQL> @ver BANNER                                

[20130812]12c Partial Indexes For Partitioned Tables Part II.txt

[20130812]12c Partial Indexes For Partitioned Tables Part II.txt 参考链接:http://richardfoote.wordpress.com/2013/07/12/12c-partial-indexes-for-partitioned-tables-part-ii-vanishing-act/ 更多的是重复作者的测试,加深理解: 1.测试环境: SQL> @ver BANNER                           

pymongo给mongodb创建索引的简单实现方法

  这篇文章主要介绍了pymongo给mongodb创建索引的简单实现方法,涉及Python使用pymongo模块操作mongodb的技巧,需要的朋友可以参考下 下面的代码给user的user_name字段创建唯一索引 ? 1 2 3 4 import pymongo mongo = pymongo.Connection('localhost') collection = mongo['database']['user'] collection.ensure_index('user_name',

mondodb-C#声明一个mongodb地理位置索引,并修改索引范围

问题描述 C#声明一个mongodb地理位置索引,并修改索引范围 默认情况下,mongodb地理空间索引假定你在索引经度/维度,并且这些值的范围是[-180180].但是我的坐标是大地坐标,不是经纬度,怎么在C#声明一个mongodb地理位置索引,并修改索引范围?shell是这样修改的:db.places.ensureIndex( { loc : ""2d"" } { min : -500 max : 500 } ) 解决方案 这里有现成的http://blog.c

数据-mongodb创建索引后过段时间就消失了?

问题描述 mongodb创建索引后过段时间就消失了? 对A,B两个集合同时创建两组复合索引,索引字段都才4个,创建成功后查询速度比原来快多了.过一天后查询看发现A集合又慢了,发现A集合的复合索引没有了,B集合的索引还在.(A集合数据比较大一大) 给A重新创建了几次索引,都是过段时间索引就自动消失了.要重新创建.求解啊 解决方案 这个应该不会主动消失 是不是倒入数据的时候又覆盖索引 解决方案二: 这个不应该把,索引创建了,只有有人删除了,才会没有. 不太可能说没人删除,就自动没有了,那mongod

MongoDB 复合索引

MongoDB支持复合索引,即将多个键组合到一起创建索引.该方式称为复合索引,或者也叫组合索引,该方式能够满足多键值匹配查询使用索引的情形.其次复合索引在使用的时候,也可以通过前缀法来使用索引.MongoDB中的复合索引与关系型数据库基本上一致.在关系型数据库中复合索引使用的一些原则同样适用于MongoDB.本文主要描述MongoDB复合索引. 一.复合索引相关概述 1.复合索引创建语法 db.collection.createIndex( { <field1>: <type>,

MongoDB 唯一索引

MongoDB支持的索引种类很多,诸如单键索引,复合索引,多键索引,TTL索引,文本索引,空间地理索引等.同时索引的属性可以具有唯一性,即唯一索引.唯一索引用于确保索引字段不存储重复的值,即强制索引字段的唯一性.缺省情况下,MongoDB的_id字段在创建集合的时候会自动创建一个唯一索引.本文主要描述唯一索引的用法. 一.创建唯一索引语法 //语法 db.collection.createIndex( <key and index type specification>, { unique: