[Mongodb 5.0]聚合操作

本文对应Aggregation Operations --- MongoDB Manual

正文

此章节主要介绍了Aggregation Pipeline，其实就是将若干个聚合操作放在管道中进行执行，每一个聚合操作的结果作为下一个聚合操作的输入，每个聚合指令被称为一个stage。

在正式开始学习聚合操作前，请先按照下面的方式在你的mongodb中创建数据可和插入记录：

首先通过创建数据库和表，我这里为了方便直接使用可视化工具Robo3T(官网推荐)来进行操作

然后直接通过下面指令添加记录

javascript 复制代码

db.orders.insertMany( [
   { _id: 0, name: "Pepperoni", size: "small", price: 19,
     quantity: 10, date: ISODate( "2021-03-13T08:14:30Z" ) },
   { _id: 1, name: "Pepperoni", size: "medium", price: 20,
     quantity: 20, date : ISODate( "2021-03-13T09:13:24Z" ) },
   { _id: 2, name: "Pepperoni", size: "large", price: 21,
     quantity: 30, date : ISODate( "2021-03-17T09:22:12Z" ) },
   { _id: 3, name: "Cheese", size: "small", price: 12,
     quantity: 15, date : ISODate( "2021-03-13T11:21:39.736Z" ) },
   { _id: 4, name: "Cheese", size: "medium", price: 13,
     quantity:50, date : ISODate( "2022-01-12T21:23:13.331Z" ) },
   { _id: 5, name: "Cheese", size: "large", price: 14,
     quantity: 10, date : ISODate( "2022-01-12T05:08:13Z" ) },
   { _id: 6, name: "Vegan", size: "small", price: 17,
     quantity: 10, date : ISODate( "2021-01-13T05:08:13Z" ) },
   { _id: 7, name: "Vegan", size: "medium", price: 18,
     quantity: 10, date : ISODate( "2021-01-13T05:10:13Z" ) }
] )

上面插入的数据，用Robo3T的表格形式显示一下如下：

现在有了数据后，我们开始正式学习聚合操作相关的指令

运行聚合操作，使用的命令为

javascript 复制代码

 db.collection.aggregate()

下面开始学习聚合相关的指令

** $match**$ match相当于sql中的where条件，来看例子：
例子：将表中，size字段为medium的记录查询出来
javascript 复制代码
```
db.orders.aggregate( [
   {
      $match: { size: "medium" }
   }
] )
```
** $group**$ group就是分组的意思，看例子
例子：查找size为medium，并且对其进行分组显示
javascript 复制代码
```
db.orders.aggregate( [
   // Stage 1: Filter pizza order documents by pizza size
   {
      $match: { size: "medium" }
   },
   // Stage 2: Group remaining documents by pizza name and calculate total quantity
   {
      $group: { _id: "$name", totalQuantity: { $sum: "$quantity" } }
   }
] )
```
在这个例子中我们就会看到聚合操作中所谓的pipeline的用法，例子中我们用了 $match和$ group两个指令，他们的执行是分为2个阶段(stage)，第一个阶段通过 $match来进行数据的过滤，将满足的数据作为$ group指令的输入， $group指令将$ match的结果进行分组。后面的例子中全都是这种pipeline方式的聚合操作。
$project

$project用来指定只输出哪些字段，看例子

例子：查询name字段为Pepperoni的记录，并且只显示_id和name两个字段
javascript 复制代码
```
db.orders.aggregate( [
   { $match: { name: "Pepperoni"} },
   { $project: { _id: 1, name: 1} }
 ] )
```
通过 $project我们指定结果中只显示_id和name字段，注意的是，在$ match这个阶段输出的结果中包含了所有的字段，而只有在$project这个阶段，才将所以字段中的_id和name两个字段拿出来显示。

$sort

$sort就是就它上面阶段输出的内容进行排序的作用，看例子

例子：查询name字段为Pepperoni的记录按照_id进行排序，并且只显示_id和name两个字段.

javascript 复制代码

db.orders.aggregate( [
   // Stage 1: Filter pizza order documents by date range
   { 
       $match: { name: "Pepperoni"} 
   },
   { 
       $project: { _id: 1, name: 1}
    },
    {
        $sort:{_id:-1} // -1:倒序 | 1:正序
    }
 ] )

关于更多的aggregate Pipeline的的指令这里就全部列出来了，大家可以到官网中查询剩余的其他指令，下面讲一下关于使用aggregate pipeline的一些限制

在使用aggregate命令执行聚合操作是，对于发挥结果是由限制的，也就是你返回的json内容大小不能超过16 megabyte(16MB)
上面介绍的这些例如 $project,$ sort这些用在pipeline中的指令不能超过1000个(每个指令被称为一个阶段stage）阶段
当查询结果大于16MB时，会默认使用磁盘来存储结果，可以通过 { allowDiskUse: false }来禁用这个写入磁盘的操作。

Aggregation Pipeline and Sharded Collections

就是当我们的mongdb是在分片模式下，如何使用聚合操作