MongoDB聚合运算符:$sampleRate
文章目录
$sampleRate
聚合运算符用$match
,按照指定的抽样比例,从输入的文档中随机选择相应的文档。
语法
js
{ $sampleRate: <non-negative float> }
使用
选择过程使用均匀随机分布。采样率是 0 到 1 之间的浮点数(含 0 和 1),表示给定文档在通过管道时被选择的概率。
例如,采样率为 0.33 时,大约会选择三分之一的文档。
表达式:
js
{ $match: { $sampleRate: 0.33 } }
等价于下面使用$rand
操作符的表达式:
js
{ $match: { $expr: { $lt: [ { $rand: {} }, 0.33 ] } } }
在重复执行的情况下,输出的结果可能是不同的,因为选择的过程是不确定的。通常,较小的数据集在每次运行时所选文档数量的变化会更大,随着集合大小的增加,所选文档的数量将接近均匀随机分布的预期值。
如果每次运行都需要确切数量的文档,则应使用$sample
运算符而不是 $sampleRate
。
举例
使用下面的脚本创建100个文档:
js
N = 100
bulk = db.collection.initializeUnorderedBulkOp()
for ( i = 0; i < N; i++) { bulk.insert( {_id: i, r: 0} ) }
bulk.execute()
$sampleRate
运算符可用于管道中从集合中选择随机文档,在下面的示例中,使用$sampleRate
选择大约三分之一的文档:
js
db.collection.aggregate(
[
{ $match: { $sampleRate: 0.33 } },
{ $count: "numMatches" }
]
)
操作返回下面的结果:
json
{ "numMatches" : 38 }
{ "numMatches" : 36 }
{ "numMatches" : 29 }
{ "numMatches" : 29 }
{ "numMatches" : 28 }