[Mongodb 5.0]聚合操作

本文对应Aggregation Operations --- MongoDB Manual

正文

此章节主要介绍了Aggregation Pipeline,其实就是将若干个聚合操作放在管道中进行执行,每一个聚合操作的结果作为下一个聚合操作的输入,每个聚合指令被称为一个stage。

在正式开始学习聚合操作前,请先按照下面的方式在你的mongodb中创建数据可和插入记录:

首先通过创建数据库和表,我这里为了方便直接使用可视化工具Robo3T(官网推荐)来进行操作

然后直接通过下面指令添加记录

javascript 复制代码
db.orders.insertMany( [
   { _id: 0, name: "Pepperoni", size: "small", price: 19,
     quantity: 10, date: ISODate( "2021-03-13T08:14:30Z" ) },
   { _id: 1, name: "Pepperoni", size: "medium", price: 20,
     quantity: 20, date : ISODate( "2021-03-13T09:13:24Z" ) },
   { _id: 2, name: "Pepperoni", size: "large", price: 21,
     quantity: 30, date : ISODate( "2021-03-17T09:22:12Z" ) },
   { _id: 3, name: "Cheese", size: "small", price: 12,
     quantity: 15, date : ISODate( "2021-03-13T11:21:39.736Z" ) },
   { _id: 4, name: "Cheese", size: "medium", price: 13,
     quantity:50, date : ISODate( "2022-01-12T21:23:13.331Z" ) },
   { _id: 5, name: "Cheese", size: "large", price: 14,
     quantity: 10, date : ISODate( "2022-01-12T05:08:13Z" ) },
   { _id: 6, name: "Vegan", size: "small", price: 17,
     quantity: 10, date : ISODate( "2021-01-13T05:08:13Z" ) },
   { _id: 7, name: "Vegan", size: "medium", price: 18,
     quantity: 10, date : ISODate( "2021-01-13T05:10:13Z" ) }
] )

上面插入的数据,用Robo3T的表格形式显示一下如下:

现在有了数据后,我们开始正式学习聚合操作相关的指令

运行聚合操作,使用的命令为

javascript 复制代码
 db.collection.aggregate() 

下面开始学习聚合相关的指令

  • **match** match相当于sql中的where条件,来看例子:
    例子:将表中,size字段为medium的记录查询出来

    javascript 复制代码
    db.orders.aggregate( [
       {
          $match: { size: "medium" }
       }
    ] )
  • **group** group就是分组的意思,看例子
    例子:查找size为medium,并且对其进行分组显示

    javascript 复制代码
    db.orders.aggregate( [
       // Stage 1: Filter pizza order documents by pizza size
       {
          $match: { size: "medium" }
       },
       // Stage 2: Group remaining documents by pizza name and calculate total quantity
       {
          $group: { _id: "$name", totalQuantity: { $sum: "$quantity" } }
       }
    ] )

    在这个例子中我们就会看到聚合操作中所谓的pipeline的用法,例子中我们用了match和group两个指令,他们的执行是分为2个阶段(stage),第一个阶段通过match来进行数据的过滤,将满足的数据作为group指令的输入,group指令将match的结果进行分组。后面的例子中全都是这种pipeline方式的聚合操作。

  • $project

    $project用来指定只输出哪些字段,看例子

    例子:查询name字段为Pepperoni的记录,并且只显示_id和name两个字段

    javascript 复制代码
    db.orders.aggregate( [
       { $match: { name: "Pepperoni"} },
       { $project: { _id: 1, name: 1} }
     ] )

    通过project我们指定结果中只显示_id和name字段,注意的是,在match这个阶段输出的结果中包含了所有的字段,而只有在$project这个阶段,才将所以字段中的_id和name两个字段拿出来显示。

  • $sort

    $sort就是就它上面阶段输出的内容进行排序的作用,看例子

    例子:查询name字段为Pepperoni的记录按照_id进行排序,并且只显示_id和name两个字段.

    javascript 复制代码
    db.orders.aggregate( [
       // Stage 1: Filter pizza order documents by date range
       { 
           $match: { name: "Pepperoni"} 
       },
       { 
           $project: { _id: 1, name: 1}
        },
        {
            $sort:{_id:-1} // -1:倒序 | 1:正序
        }
     ] )

关于更多的aggregate Pipeline的的指令这里就全部列出来了,大家可以到官网中查询剩余的其他指令,下面讲一下关于使用aggregate pipeline的一些限制

  1. 在使用aggregate命令执行聚合操作是,对于发挥结果是由限制的,也就是你返回的json内容大小不能超过16 megabyte(16MB)
  2. 上面介绍的这些例如project,sort这些用在pipeline中的指令不能超过1000个(每个指令被称为一个阶段stage)阶段
  3. 当查询结果大于16MB时,会默认使用磁盘来存储结果,可以通过 { allowDiskUse: false }来禁用这个写入磁盘的操作。

Aggregation Pipeline and Sharded Collections

就是当我们的mongdb是在分片模式下,如何使用聚合操作

相关推荐
vvvae12346 小时前
分布式数据库
数据库
雪域迷影6 小时前
PostgreSQL Docker Error – 5432: 地址已被占用
数据库·docker·postgresql
bug菌¹7 小时前
滚雪球学Oracle[4.2讲]:PL/SQL基础语法
数据库·oracle
逸巽散人7 小时前
SQL基础教程
数据库·sql·oracle
月空MoonSky7 小时前
Oracle中TRUNC()函数详解
数据库·sql·oracle
momo小菜pa7 小时前
【MySQL 06】表的增删查改
数据库·mysql
向上的车轮8 小时前
Django学习笔记二:数据库操作详解
数据库·django
编程老船长8 小时前
第26章 Java操作Mongodb实现数据持久化
数据库·后端·mongodb
全栈师9 小时前
SQL Server中关于个性化需求批量删除表的做法
数据库·oracle
Data 3179 小时前
Hive数仓操作(十七)
大数据·数据库·数据仓库·hive·hadoop