MongoDB教程之聚合(count、distinct和group)_MongoDB

1. count:

复制代码 代码如下:

    --在空集合中,count返回的数量为0。
    > db.test.count()
    0
    --测试插入一个文档后count的返回值。
    > db.test.insert({"test":1})
    > db.test.count()
    1
    > db.test.insert({"test":2})
    > db.test.count()
    2
    --count和find一样,也接受条件。从结果可以看出,只有符合条件的文档参与了计算。
    > db.test.count({"test":1})
    1

    
2. distinct:

    distinct用来找出给定键的所有不同的值。使用时也必须指定集合和键。
 

复制代码 代码如下:

    --为了便于后面的测试,先清空测试集合。
    > db.test.remove()
    > db.test.count()
    0
    --插入4条测试数据。请留意Age字段。
    > db.test.insert({"name":"Ada", "age":20})
    > db.test.insert({"name":"Fred", "age":35})
    > db.test.insert({"name":"Andy", "age":35})
    > db.test.insert({"name":"Susan", "age":60})
    --distinct命令必须指定集合名称,如test,以及需要区分的字段,如:age。
    --下面的命令将基于test集合中的age字段执行distinct命令。
    > db.runCommand({"distinct":"test", "key":"age"})
    {
            "values" : [
                    20,
                    35,
                    60
            ],
            "stats" : {
                    "n" : 4,
                    "nscanned" : 4,
                    "nscannedObjects" : 4,
                    "timems" : 0,
                    "cursor" : "BasicCursor"
            },
            "ok" : 1
    }   

3. group:
    group做的聚合有些复杂。先选定分组所依据的键,此后MongoDB就会将集合依据选定键值的不同分成若干组。然后可以通过聚合每一组内的文档,产生一个结果文档。
 
复制代码 代码如下:

    --这里是准备的测试数据
    > db.test.remove()
    > db.test.insert({"day" : "2012-08-20", "time" : "2012-08-20 03:20:40", "price" : 4.23})
    > db.test.insert({"day" : "2012-08-21", "time" : "2012-08-21 11:28:00", "price" : 4.27})
    > db.test.insert({"day" : "2012-08-20", "time" : "2012-08-20 05:00:00", "price" : 4.10})
    > db.test.insert({"day" : "2012-08-22", "time" : "2012-08-22 05:26:00", "price" : 4.30})
    > db.test.insert({"day" : "2012-08-21", "time" : "2012-08-21 08:34:00", "price" : 4.01})
    --这里将用day作为group的分组键,然后取出time键值为最新时间戳的文档,同时也取出该文档的price键值。
    > db.test.group( {
    ... "key" : {"day":true},           --如果是多个字段,可以为{"f1":true,"f2":true}
    ... "initial" : {"time" : "0"},       --initial表示$reduce函数参数prev的初始值。每个组都有一份该初始值。
    ... "$reduce" : function(doc,prev) {  --reduce函数接受两个参数,doc表示正在迭代的当前文档,prev表示累加器文档。
    ...     if (doc.time > prev.time) {
    ...         prev.day = doc.day
    ...         prev.price = doc.price;
    ...         prev.time = doc.time;
    ...     }
    ... } } )
    [
        {
            "day" : "2012-08-20",
            "time" : "2012-08-20 05:00:00",
            "price" : 4.1
        },
        {
            "day" : "2012-08-21",
            "time" : "2012-08-21 11:28:00",
            "price" : 4.27
        },
        {
            "day" : "2012-08-22",
            "time" : "2012-08-22 05:26:00",
            "price" : 4.3
        }
    ]
    --下面的例子是统计每个分组内文档的数量。
    > db.test.group( {
    ... key: { day: true},
    ... initial: {count: 0},
    ... reduce: function(obj,prev){ prev.count++;},
    ... } )
    [
        {
            "day" : "2012-08-20",
            "count" : 2
        },
        {
            "day" : "2012-08-21",
            "count" : 2
        },
        {
            "day" : "2012-08-22",
            "count" : 1
        }
    ]
    --最后一个是通过完成器修改reduce结果的例子。
    > db.test.group( {
    ... key: { day: true},
    ... initial: {count: 0},
    ... reduce: function(obj,prev){ prev.count++;},
    ... finalize: function(out){ out.scaledCount = out.count * 10 } --在结果文档中新增一个键。
    ... } )
    [
        {
            "day" : "2012-08-20",
            "count" : 2,
            "scaledCount" : 20
        },
        {
            "day" : "2012-08-21",
            "count" : 2,
            "scaledCount" : 20
        },
        {
            "day" : "2012-08-22",
            "count" : 1,
            "scaledCount" : 10
        }   
    ]

时间: 2025-01-28 01:06:09

MongoDB教程之聚合(count、distinct和group)_MongoDB的相关文章

MongoDB入门教程之聚合和游标操作介绍_MongoDB

 今天跟大家分享一下mongodb中比较好玩的知识,主要包括:聚合,游标. 一: 聚合       常见的聚合操作跟sql server一样,有:count,distinct,group,mapReduce. <1> count         count是最简单,最容易,也是最常用的聚合工具,它的使用跟我们C#里面的count使用简直一模一样.  <2> distinct        这个操作相信大家也是非常熟悉的,指定了谁,谁就不能重复,直接上图.  <3> gr

MySQL中Distinct和Group By语句的基本使用教程_Mysql

MySQL Distinct 去掉查询结果重复记录DISTINCT 使用 DISTINCT 关键字可以去掉查询中某个字段的重复记录. 语法: SELECT DISTINCT(column) FROM tb_name 例子: 假定 user 表有如下记录: uid username 1 小李 2 小张 3 小李 4 小王 5 小李 6 小张 SQL 语句: SELECT DISTINCT(username) FROM user 返回查询结果如下: username 小李 小张 小王 提示 使用 D

Mongodb聚合函数count、distinct、group如何实现数据聚合操作_MongoDB

 上篇文章给大家介绍了Mongodb中MapReduce实现数据聚合方法详解,我们提到过Mongodb中进行数据聚合操作的一种方式--MapReduce,但是在大多数日常使用过程中,我们并不需要使用MapReduce来进行操作.在这边文章中,我们就简单说说用自带的聚合函数进行数据聚合操作的实现. MongoDB除了基本的查询功能之外,还提供了强大的聚合功能.Mongodb中自带的基本聚合函数有三种:count.distinct和group.下面我们分别来讲述一下这三个基本聚合函数. (1)cou

distinct xx和count(distinct xx)的变态递归优化方法

今天要说的这个优化是从前面一篇讲解<performance tuning case :use cursor or trigger replace group by and order by>http://blog.163.com/digoal@126/blog/static/16387704020128142829610/的延展. CASE 例如一个表中有一个字段是性别, 这个表不管有多少条记录, 性别这个字段一般来说也就2个值select count(distinct sex) from t

distinct xx和count(distinct xx)的变态递归优化方法 - 收敛(skip scan)扫描

标签 PostgreSQL , 递归去重 , 递归优化 , count(distinct ), 稀疏列 , 统计 背景 今天要说的这个优化是从前面一篇讲解<performance tuning case :use cursor or trigger replace group by and order by> http://blog.163.com/digoal@126/blog/static/16387704020128142829610/ 的延展. CASE 例如一个表中有一个字段是性别,

HybridDB · 性能优化 · Count Distinct的几种实现方式

前言 最近遇到几个客户在HybridDB上做性能测试时,都遇到Count Distinct的性能调优问题.这里我们总结一下HybridDB中,对Count Distinct的几种处理方式. 我们以一个客户的案例来做说明.客户的典型的业务场景是,在用户行为日志中统计对应类别的行为数,类别有几千个,独立的行为的总量很多,有几千万:为分析行为,要查询一段时间内的基于类别的独立行为数,查询如下(test的建表语句见附录): select category, count(distinct actionId

叠加报错-oracle distinct、group by、union all叠加使用报错

问题描述 oracle distinct.group by.union all叠加使用报错 分组聚合条件下,计算xjh不重复的记录条数以及所有记录条数: with a as( select '2012' xn,'a'xxdm,'x1' xjh from dual union all select '2012' xn,'a'xxdm,'x1' xjh from dual union all select '2012' xn,'a'xxdm,'x2' xjh from dual union all

MySQL中distinct与group by之间的性能进行比较_Mysql

最近在网上看到了一些测试,感觉不是很准确,今天亲自测试了一番.得出了结论,测试过程在个人计算机上,可能不够全面,仅供参考. 测试过程: 准备一张测试表  CREATE TABLE `test_test` ( `id` int(11) NOT NULL auto_increment, `num` int(11) NOT NULL default '0', PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1

mysql中distinct和group by过滤删除重复行

下面先来看看例子:  代码如下 复制代码 table id name 1 a 2 b 3 c 4 c 5 b 库结构大概这样,这只是一个简单的例子,实际情况会复杂得多. 比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录.  代码如下 复制代码 select distinct name from table 得到的结果是: name a b c 好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:  代码如下 复制代码 select d