MongoDB聚合运算符:$stdDevPop

MongoDB聚合运算符:$stdDevPop

文章目录

$stdDevPop聚合运算符用来计算输入值的总体标准差。如果确认数据代表了整个数据集,且不希望对更大的群体进行归纳,可以使用 $stdDevPop来计算总体标准差。如果数据仅代表了总体的一部分样本,但又想把结论推广到整个数据集,则应该使用 $stdDevSamp

$stdDevPop可以应用于下面的阶段:

  • $addFields,从MongoDB3.4开始支持
  • $group
  • $match阶段的$expr表达式
  • $project
  • $replaceRoot,从MongoDB 3.4开始支持
  • $replaceWith,从MongoDB 4.2开始支持
  • $set,从MongoDB 4.2开始支持
  • $setWindowFields,从MongoDB 5.0开始支持

语法

当用于$bucket$bucketAuto$group$setWindowFields阶段时的语法为:

js 复制代码
{ $stdDevPop: <expression> }

当用于其它阶段时,$stdDevPop的语法有两种形式:

  • 操作数为一个表达式:

    js 复制代码
    { $stdDevPop: <expression> }
  • 操作数为一个表达式列表:

    js 复制代码
     { $stdDevPop: [ <expression1>, <expression2> ... ]  }

<expression>为可解析为数组的表达式。

参数可以是任何能够解析为数组的表达式。

使用

非数值类型的值

$stdDevPop忽略所有非数值的值,如果所有的操作数都是非数值的值,$stdDevPop返回null。

单个值

如果样本只有一个数值类型的值,$stdDevPop返回0。

数组操作数

$group$setWindowFields阶段,如果表达式解析为数组,$stdDevPop会将操作数视为非数字值,对计算没有影响。

针对其它阶段:

  • 当使用单个表达式作为操作数时,如果表达式解析为数组,$stdDevPop会遍历数组元素,并对数字元素进行操作返回单个值。
  • 当使用表达式列表作为操作数,如果表达式解析为数组,$stdDevPop不会遍历该数组,而是将数组视为非数字值。

窗口值

对于$setWindowFields阶段窗口的值:

  • 忽略窗口中的非数值、空值和缺失字段。
  • 如果窗口为空,则返回 null。
  • 如果窗口中包含 NaN 值,则返回空值。
  • 如果窗口包含 Infinity 值,则返回空值。
  • 如果前面几点都不适用,则返回一个 double 值。

举例

应用于$group阶段

使用下面的脚本创建users集合:

js 复制代码
db.users.insertMany( [
   { _id : 1, name : "dave123", quiz : 1, score : 85 },
   { _id : 2, name : "dave2", quiz : 1, score : 90 },
   { _id : 3, name : "ahn", quiz : 1, score : 71 },
   { _id : 4, name : "li", quiz : 2, score : 96 },
   { _id : 5, name : "annT", quiz : 2, score : 77 },
   { _id : 6, name : "ty", quiz : 2, score : 82 }
] )

下面的例子计算测验的标准差:

js 复制代码
db.users.aggregate( [
   { $group: { _id: "$quiz", stdDev: { $stdDevPop: "$score" } } }
] )

操作结果如下:

json 复制代码
{ "_id" : 2, "stdDev" : 8.04155872120988 }
{ "_id" : 1, "stdDev" : 8.04155872120988 }

$project阶段使用

使用下面的脚本创建quizzes集合:

js 复制代码
db.quizzes.insertMany( [
   {
      _id : 1,
      scores : [
         { name : "dave123", score : 85 },
         { name : "dave2", score : 90 },
         { name : "ahn", score : 71 }
      ]
   },
   {
      _id : 2,
      scores : [
         { name : "li", quiz : 2, score : 96 },
         { name : "annT", score : 77 },
         { name : "ty", score : 82 }
      ]
   }
] )

下面的示例计算了每次测验的标准差:

js 复制代码
db.quizzes.aggregate( [
   { $project: { stdDev: { $stdDevPop: "$scores.score" } } }
] )

操作结果如下:

json 复制代码
{ "_id" : 2, "stdDev" : 8.04155872120988 }
{ "_id" : 1, "stdDev" : 8.04155872120988 }

$setWindowFields阶段使用

使用下面的脚本创建cakeSales集合,包含了在加利福尼亚州(CA)和华盛顿州(WA)的蛋糕销售记录:

js 复制代码
db.cakeSales.insertMany( [
   { _id: 0, type: "chocolate", orderDate: new Date("2020-05-18T14:10:30Z"),
     state: "CA", price: 13, quantity: 120 },
   { _id: 1, type: "chocolate", orderDate: new Date("2021-03-20T11:30:05Z"),
     state: "WA", price: 14, quantity: 140 },
   { _id: 2, type: "vanilla", orderDate: new Date("2021-01-11T06:31:15Z"),
     state: "CA", price: 12, quantity: 145 },
   { _id: 3, type: "vanilla", orderDate: new Date("2020-02-08T13:13:23Z"),
     state: "WA", price: 13, quantity: 104 },
   { _id: 4, type: "strawberry", orderDate: new Date("2019-05-18T16:09:01Z"),
     state: "CA", price: 41, quantity: 162 },
   { _id: 5, type: "strawberry", orderDate: new Date("2019-01-08T06:12:03Z"),
     state: "WA", price: 43, quantity: 134 }
] )

下面的示例在 $setWindowFields 阶段使用 $stdDevPop 输出每个州蛋糕销售数量的人口标准差:

js 复制代码
db.cakeSales.aggregate( [
   {
      $setWindowFields: {
         partitionBy: "$state",
         sortBy: { orderDate: 1 },
         output: {
            stdDevPopQuantityForState: {
               $stdDevPop: "$quantity",
               window: {
                  documents: [ "unbounded", "current" ]
               }
            }
         }
      }
   }
] )

在本例中:

  • partitionBy: "$state"按照州state对集合的文档进行分区,有CAWA两个区。
  • sortBy: { orderDate: 1 }根据orderDate对分区内文档进行由小到大的排序,orderDate最早的排在第一个。
  • output使用$stdDevPop将窗口内文档的quantity标准差赋予stdDevPopQuantityForState字段。窗口包含无界下限和输出中的当前文档之间的文档,这意味着$stdDevPop返回分区开头和当前文档之间文档的数量总体标准差。

在此示例输出中,CAWAquantity总体标准差放在stdDevPopQuantityForState字段:

操作结果如下:

js 复制代码
{ _id : 4, type : "strawberry", orderDate : ISODate("2019-05-18T16:09:01Z"),
  state : "CA", price : 41, quantity : 162, stdDevPopQuantityForState : 0 }
{ _id : 0, type : "chocolate", orderDate : ISODate("2020-05-18T14:10:30Z"),
  state : "CA", price : 13, quantity : 120, stdDevPopQuantityForState : 21 }
{ _id : 2, type : "vanilla", orderDate : ISODate("2021-01-11T06:31:15Z"),
  state : "CA", price : 12, quantity : 145, stdDevPopQuantityForState : 17.249798710580816 }
{ _id : 5, type : "strawberry", orderDate : ISODate("2019-01-08T06:12:03Z"),
  state : "WA", price : 43, quantity : 134, stdDevPopQuantityForState : 0 }
{ _id : 3, type : "vanilla", orderDate : ISODate("2020-02-08T13:13:23Z"),
  state : "WA", price : 13, quantity : 104, stdDevPopQuantityForState : 15 }
{ _id : 1, type : "chocolate", orderDate : ISODate("2021-03-20T11:30:05Z"),
  state : "WA", price : 14, quantity : 140, stdDevPopQuantityForState : 15.748015748023622 }
相关推荐
cyt涛2 小时前
MyBatis 学习总结
数据库·sql·学习·mysql·mybatis·jdbc·lombok
Rookie也要加油2 小时前
01_SQLite
数据库·sqlite
liuxin334455662 小时前
教育技术革新:SpringBoot在线教育系统开发
数据库·spring boot·后端
看山还是山,看水还是。3 小时前
MySQL 管理
数据库·笔记·mysql·adb
fishmemory7sec3 小时前
Koa2项目实战2(路由管理、项目结构优化)
数据库·mongodb·koa
momo小菜pa3 小时前
【MySQL 09】表的内外连接
数据库·mysql
Jasonakeke3 小时前
【重学 MySQL】四十九、阿里 MySQL 命名规范及 MySQL8 DDL 的原子化
数据库·mysql
程序猿小D3 小时前
第二百六十九节 JPA教程 - JPA查询OrderBy两个属性示例
java·开发语言·数据库·windows·jpa
小宇成长录4 小时前
Mysql:数据库和表增删查改基本语句
数据库·mysql·数据库备份
团儿.4 小时前
解锁MySQL高可用新境界:深入探索MHA架构的无限魅力与实战部署
数据库·mysql·架构·mysql之mha架构