MongoDB聚合运算符:$sampleRate

MongoDB聚合运算符:$sampleRate

文章目录

  • [MongoDB聚合运算符:sampleRate](#MongoDB聚合运算符:sampleRate)

$sampleRate聚合运算符用$match,按照指定的抽样比例,从输入的文档中随机选择相应的文档。

语法

js 复制代码
{ $sampleRate: <non-negative float> }

使用

选择过程使用均匀随机分布。采样率是 0 到 1 之间的浮点数(含 0 和 1),表示给定文档在通过管道时被选择的概率。

例如,采样率为 0.33 时,大约会选择三分之一的文档。

表达式:

js 复制代码
{ $match: { $sampleRate: 0.33 } }

等价于下面使用$rand操作符的表达式:

js 复制代码
{ $match: { $expr: { $lt: [ { $rand: {} }, 0.33 ] } } }

在重复执行的情况下,输出的结果可能是不同的,因为选择的过程是不确定的。通常,较小的数据集在每次运行时所选文档数量的变化会更大,随着集合大小的增加,所选文档的数量将接近均匀随机分布的预期值。

如果每次运行都需要确切数量的文档,则应使用$sample运算符而不是 $sampleRate

举例

使用下面的脚本创建100个文档:

js 复制代码
N = 100
bulk = db.collection.initializeUnorderedBulkOp()
for ( i = 0; i < N; i++) { bulk.insert( {_id: i, r: 0} ) }
bulk.execute()

$sampleRate运算符可用于管道中从集合中选择随机文档,在下面的示例中,使用$sampleRate选择大约三分之一的文档:

js 复制代码
db.collection.aggregate(
   [
     { $match: { $sampleRate: 0.33 } },
     { $count: "numMatches" }
   ]
)

操作返回下面的结果:

json 复制代码
{ "numMatches" : 38 }
{ "numMatches" : 36 }
{ "numMatches" : 29 }
{ "numMatches" : 29 }
{ "numMatches" : 28 }
相关推荐
TDengine (老段)11 分钟前
TDengine IDMP 5 个实测场景让监控变简单
大数据·数据库·物联网·ai·时序数据库·tdengine·涛思数据
叫我阿柒啊41 分钟前
Java全栈开发面试实战:从基础到复杂场景的深度解析
java·数据库·spring boot·面试·vue·测试·全栈开发
万邦科技Lafite1 小时前
京东API分类接口实战指南:获取各类商品信息
数据库·人工智能·api接口·开放api·电商开放平台
望获linux4 小时前
【Linux基础知识系列】第一百一十篇 - 使用Nmap进行网络安全扫描
java·linux·开发语言·前端·数据库·信息可视化·php
乘乘凉4 小时前
Python中函数的闭包和装饰器
前端·数据库·python
百锦再4 小时前
四、Python 脚本常用模块(续)
jvm·数据库·oracle
༒࿈༙྇洞察༙༙྇྇࿈༒7 小时前
PostgreSQL快速入门
数据库·postgresql
携欢7 小时前
Portswigger靶场之Visible error-based SQL injection通关秘籍
数据库·sql
-XWB-7 小时前
PostgreSQL诊断系列(4/6):表空间与膨胀分析——解决“越用越大”的存储难题
数据库·postgresql
幸福清风7 小时前
【SQL】深入理解MySQL存储过程:MySQL流程控制语句详解
数据库·sql·mysql