MongoDB的Map-Reduce操作与聚合管道操作的两个实例相互转换

一、插入集合 comment 的文档的内容

二、题目要求

将集合 comment 中的文档进行聚合操作,即将字段 state为1的文档查询出来,然后按字段 nickname 进行分组,最后计算出每个评论者的评论条数。

三、mapReduce 操作代码

sql 复制代码
db.comment.mapReduce(
  // Map函数:用于遍历集合中的每个文档,并将键值对传给reduce函数
  function() { 
    // 代表每次出现一个评论就计数为1
    emit(this.nickname, 1); 
  },
  
  // Reduce函数:用于聚合Map函数发射的相同键(nickname)的值
  function(key, values) { 
    // 使用Array.sum方法将相同key的所有值相加,得到该评论者的评论总数
    return Array.sum(values);
  },
  
  {
    // Query选项:指定仅对满足条件的文档(state为"1")执行mapReduce操作
    query: { state: "1" },
    
    // 输出选项:将mapReduce的结果输出到一个新的集合中,例如'output_collection'
    out: "output_collection"
  }
);
sql 复制代码
db.comment.mapReduce(
  function() { 
    // Map函数:筛选state为1的文档,并将nickname作为键,值为1
    if (this.state === 1) {
      emit(this.nickname, 1);
    }
  },
  function(key, values) { 
    // Reduce函数:将同一nickname的评论数相加
    return Array.sum(values);
  },
  {
    // 输出选项:将结果输出到一个新的集合中,例如output_collection
    out: "output_collection"
  }
);

上述两种方法效果相同。

1. emit(this.nickname, 1) 的作用

(1) 生成键值对:对于每一个满足条件(state 为 1)的文档,emit 函数会将当前文档的 nickname 字段的值作为键(key),并将 1 作为值(value)。

(2) 用于分组和计数emit(this.nickname, 1) 生成的键值对会被传递给 reduce 函数。nickname 作为键用于分组,1 作为值用于计数。在 reduce 函数中,会将同一个 nickname 的所有 1 累加起来,得到该 nickname 出现的次数(即每个评论者的评论总数)。

四、聚合管道操作代码

sql 复制代码
db.comment.aggregate([
  // Stage 1: 筛选文档,选择state为1的文档
  { 
    $match: { state: "1" } 
  },
  // Stage 2: 按nickname字段进行分组,并计算每个组的数量
  { 
    $group: { 
      _id: "$nickname",  // 按nickname分组,_id为每个评论者的昵称
      count: { $sum: 1 } // 计算每个分组中的文档数量
    }
  },
  // Stage 3: 输出选项(可选),按照需要排序或进一步处理结果
  {
    $sort: { count: -1 } // 按评论数量降序排序(可选)
  }
]);
相关推荐
只因在人海中多看了你一眼3 分钟前
B.40.5.1-数据库基础与核心原理
数据库
2503_9284115617 分钟前
11.11 Express-generator和文件上传和身份认证
数据库·node.js·express
长沙红胖子Qt29 分钟前
关于 mariadb开源数据库忘记密码 的解决方法
数据库·mariadb
二进制的Liao1 小时前
【编程】脚本编写入门:从零到一的自动化之旅
数据库·python·算法·自动化·bash
影子24011 小时前
oralce创建种子表,使用存储过程生成最大值sql,考虑并发,不考虑并发的脚本,plsql调试存储过程,java调用存储过程示例代码
java·数据库·sql
武子康1 小时前
Java-172 Neo4j 访问方式实战:嵌入式 vs 服务器(含 Java 示例与踩坑)
java·服务器·数据库·sql·spring·nosql·neo4j
昂子的博客2 小时前
Redis缓存 更新策略 双写一致 缓存穿透 击穿 雪崩 解决方案... 一篇文章带你学透
java·数据库·redis·后端·spring·缓存
xixixi777772 小时前
了解一下APM工具——就像给软件系统装的“全身CT”,能实时透视从用户点击到后端数据库的每个环节性能,精准定位哪里慢、为什么慢
数据库·安全·数据采集·apm·日志监控
q***9942 小时前
PON架构(全光网络)
网络·数据库·架构
Leon-Ning Liu2 小时前
Oracle查看正在rebuild online的索引
数据库·oracle