MongoDB聚合运算符:$derivative

$derivative聚合运算符返回返回指定窗口内的平均变化率(即求导),变化率使用以下公式计算:

  • $setWindowFields阶段窗口中的第一个和最后一个文件。
  • 分子,等于最后一个文档的表达式的值减去第一个文档表达式的值。
  • 分母,等于最后一个文档sortBy字段值减去第一个文档sortBy字段值。

语法

js 复制代码
{
   $derivative: {
      input: <expression>,
      unit: <time unit>
   }
}

参数说明:

  • <expression> 指定要指定的表达式,表达式必须要能被解析为数值
  • unit 字符串,用于指定时间单位,可以是:weekdayhourminutesecondmillisecond。如果sortBy字段不是日期类型,就必须忽略unit,换而言之,如果指定了unit,那么sortBy就必须是日期类型字段。

使用

$derivative只能用于$setWindowFields阶段,而且必须指定一个窗口。

举例

使用下面的脚本创建deliveryFleet集合,其内容是以30秒为间隔的送货卡车的里程表读数:

js 复制代码
db.deliveryFleet.insertMany( [
   { truckID: "1", timeStamp: new Date( "2020-05-18T14:10:30Z" ), miles: 1295.1 },
   { truckID: "1", timeStamp: new Date( "2020-05-18T14:11:00Z" ), miles: 1295.63 },
   { truckID: "1", timeStamp: new Date( "2020-05-18T14:11:30Z" ), miles: 1296.25 },
   { truckID: "1", timeStamp: new Date( "2020-05-18T14:12:00Z" ), miles: 1296.76 },
   { truckID: "2", timeStamp: new Date( "2020-05-18T14:10:30Z" ), miles: 10234.1 },
   { truckID: "2", timeStamp: new Date( "2020-05-18T14:11:00Z" ), miles: 10234.33 },
   { truckID: "2", timeStamp: new Date( "2020-05-18T14:11:30Z" ), miles: 10234.73 },
   { truckID: "2", timeStamp: new Date( "2020-05-18T14:12:00Z" ), miles: 10235.13 }
] )

本例在$setWindowFields阶段使用$derivative获得每辆卡车的平均车速,单位是英里/小时,并且使用$match阶段过滤掉车速小于50英里/每小时的卡车。

js 复制代码
db.deliveryFleet.aggregate( [
   {
      $setWindowFields: {
         partitionBy: "$truckID",
         sortBy: { timeStamp: 1 },
         output: {
            truckAverageSpeed: {
               $derivative: {
                  input: "$miles",
                  unit: "hour"
               },
               window: {
                  range: [ -30, 0 ],
                  unit: "second"
               }
            }
         }
      }
   },
   {
      $match: {
         truckAverageSpeed: {
            $gt: 50
         }
      }
   }
] )

在本例中:

  • $setWindowFields阶段获取每辆卡车每小时英里数的平均车速:
    • partitionBy: "$truckID"根据truckID对集合文档进行分区
    • sortBy:{timeStamp:1}根据timeStamp字段对文档进行正向排序,最早的里程表读数排在最前面
    • output在窗口范围内使用$derivativemailes的导数值赋予新的字段truckAverageSpeed
      • input表达式为$miles,作为求导计算的分子
      • $derivativetimeStamp字段指定了"hour"为单位,作为求导计算的分母
      • 窗口包含了下限-30秒(前30秒的文档)和0秒(当前文档的时间戳)之间的范围。这意味着$derivative返回卡车在30秒窗口中的速度(英里/小时)。
  • $match阶段使用大于运算符$gt筛选出平均速度大于50英里每小时的卡车。

在下面的输出中可以看出,卡车1的速度显示在truckAverageSpeed字段,卡车2的速度没有显示,因为卡车2的速度未超过50英里每小时

json 复制代码
{ "_id" : ObjectId("60cb8a7e833dfeadc8e6285c"), "truckID" : "1",
  "timeStamp" : ISODate("2020-05-18T14:11:00Z"), "miles" : 1295.63,
  "truckAverageSpeed" : 63.60000000002401 }
{ "_id" : ObjectId("60cb8a7e833dfeadc8e6285d"), "truckID" : "1",
  "timeStamp" : ISODate("2020-05-18T14:11:30Z"), "miles" : 1296.25,
  "truckAverageSpeed" : 74.3999999999869 }
{ "_id" : ObjectId("60cb8a7e833dfeadc8e6285e"), "truckID" : "1",
  "timeStamp" : ISODate("2020-05-18T14:12:00Z"), "miles" : 1296.76,
  "truckAverageSpeed" : 61.199999999998916 }
相关推荐
fen_fen4 分钟前
用户信息表建表及批量插入 100 条数据(MySQL/Oracle)
数据库·mysql·oracle
马克Markorg6 小时前
常见的向量数据库和具有向量数据库能力的数据库
数据库
Coder_Boy_8 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
helloworldandy9 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
数据知道10 小时前
PostgreSQL 故障排查:如何找出数据库中最耗时的 SQL 语句
数据库·sql·postgresql
qq_124987075310 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
枷锁—sha10 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
Coder_Boy_11 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Gain_chance11 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
此生只爱蛋11 小时前
【Redis】主从复制
数据库·redis