MongoDB【四】查询与聚合框架

在MongoDB中,查询数据主要包括基础查询以及使用聚合框架(Aggregation Framework)进行复杂数据处理。

基础查询操作

1. find() 查询

  • db.collection.find(query, projection) 是最基本的查询方法,其中:
    • query 是一个JSON形式的对象,定义了要匹配的文档条件。
    • projection 可选,用于指定返回文档中包含哪些字段,可以用来做字段筛选和投影操作。

示例:

javascript 复制代码
db.users.find({ age: { $gt: 18 } }); // 查询年龄大于18的所有用户
db.users.find({ gender: 'male' }, { name: 1, email: 1 }); // 查询性别为男性的用户,并仅返回姓名和邮箱字段

2. 查询条件

  • 使用各种查询操作符如 $gt, $gte, $lt, $lte, $ne, $in, $nin, $exists, $regex 等来进行特定条件的匹配。

3. 排序(Sort)

  • 使用 sort() 方法对查询结果进行排序,例如:
javascript 复制代码
db.users.find().sort({ age: 1, name: -1 }); // 按照年龄升序、姓名降序排列结果

4. 限制查询结果的数量(Limit & Skip)

  • limit() 方法用于限制返回的结果数量,而 skip() 方法则是跳过指定数量的文档再返回结果。
javascript 复制代码
db.users.find().sort({ registrationDate: -1 }).limit(10); // 获取最新注册的前10个用户
db.users.find().skip(50).limit(10); // 跳过前50个文档,然后获取接下来的10个文档

聚合框架(Aggregation Pipeline)

MongoDB的聚合框架允许用户执行多个阶段的处理,将数据从原始集合转换成单一输出结果。每个阶段都会处理文档流,并将其传递给下一个阶段。

  • 常见操作符
    • $match: 类似于 find() 的查询过滤阶段。
    • $project: 改变输入文档的结构或内容,类似于 find() 的投影阶段。
    • $group: 将文档按某个字段分组,并计算每个组的统计值,如总和、平均值等。
    • $sort: 对中间结果进行排序。
    • $skip$limit: 在聚合管道中也可以使用来控制输出文档的数量和起始位置。
    • $unwind: 将数组类型的字段拆分成多条文档。
    • $lookup: 进行类似JOIN的操作,从其他集合中加入相关文档。
    • $merge: 合并聚合结果到另一个集合。
    • 更多操作符如 $addFields, $bucket, $bucketAuto, $count, $facet, $replaceRoot, $sample 等,提供丰富的数据处理能力。

聚合操作示例:

javascript 复制代码
db.orders.aggregate([
   { $match: { status: "completed" } },
   { $group: { _id: "$customer_id", totalSpent: { $sum: "$amount" } } },
   { $sort: { totalSpent: -1 } },
   { $limit: 10 }
]);

这个聚合操作会找到所有已完成状态的订单,按客户ID分组计算每位客户的总消费额,并返回消费额最高的前10名客户。

相关推荐
剩下了什么10 小时前
MySQL JSON_SET() 函数
数据库·mysql·json
山峰哥11 小时前
数据库工程与SQL调优——从索引策略到查询优化的深度实践
数据库·sql·性能优化·编辑器
较劲男子汉11 小时前
CANN Runtime零拷贝传输技术源码实战 彻底打通Host与Device的数据传输壁垒
运维·服务器·数据库·cann
java搬砖工-苤-初心不变11 小时前
MySQL 主从复制配置完全指南:从原理到实践
数据库·mysql
山岚的运维笔记13 小时前
SQL Server笔记 -- 第18章:Views
数据库·笔记·sql·microsoft·sqlserver
roman_日积跬步-终至千里14 小时前
【LangGraph4j】LangGraph4j 核心概念与图编排原理
java·服务器·数据库
汇智信科14 小时前
打破信息孤岛,重构企业效率:汇智信科企业信息系统一体化运营平台
数据库·重构
野犬寒鸦14 小时前
从零起步学习并发编程 || 第六章:ReentrantLock与synchronized 的辨析及运用
java·服务器·数据库·后端·学习·算法
晚霞的不甘16 小时前
揭秘 CANN 内存管理:如何让大模型在小设备上“轻装上阵”?
前端·数据库·经验分享·flutter·3d
市场部需要一个软件开发岗位16 小时前
JAVA开发常见安全问题:纵向越权
java·数据库·安全