MongoDB 的索引是提高查询性能的核心机制,类似于传统关系型数据库的索引。以下是对 MongoDB 索引的详细说明:

MongoDB 的索引是提高查询性能的核心机制,类似于传统关系型数据库的索引。以下是对 MongoDB 索引的详细说明:

一、索引基础

  1. 索引的作用

加速查询:通过索引快速定位数据,避免全集合扫描(COLLSCAN)。

排序优化:索引可以加速排序操作(如 sort())。

唯一性约束:通过唯一索引(unique: true)确保字段值不重复。

稀疏性控制:稀疏索引(sparse: true)仅对存在该字段的文档创建索引。

  1. 默认索引

MongoDB 自动为 _id 字段创建唯一索引,不可删除。

二、索引类型

  1. 单字段索引(Single Field Index)

对单个字段创建索引:

javascript

复制

db.collection.createIndex({ field: 1 }) // 1 表示升序,-1 表示降序

适用于精确匹配或范围查询的字段。

  1. 复合索引(Compound Index)

对多个字段联合创建索引:

javascript

复制

db.collection.createIndex({ field1: 1, field2: -1 })

字段顺序重要:查询条件中字段的顺序需与索引一致或前缀匹配。

排序优化:索引字段的顺序会影响 sort() 的性能。

  1. 多键索引(Multikey Index)

自动为数组字段中的每个元素创建索引:

javascript

复制

db.collection.createIndex({ arrayField: 1 })

适用于查询数组中的元素(如 arrayField: value)。

  1. 文本索引(Text Index)

支持全文搜索:

javascript

复制

db.collection.createIndex({ content: "text" })

支持多字段联合文本索引:

javascript

复制

db.collection.createIndex({ title: "text", description: "text" })

  1. 地理空间索引(Geospatial Index)

2dsphere:支持球面几何查询(如经纬度):

javascript

复制

db.places.createIndex({ location: "2dsphere" })

2d:支持平面几何查询(适用于旧版本)。

  1. 哈希索引(Hashed Index)

对字段值计算哈希后创建索引,常用于分片键:

javascript

复制

db.collection.createIndex({ field: "hashed" })

  1. TTL 索引(Time-To-Live Index)

自动删除过期文档(如日志数据):

javascript

复制

db.logs.createIndex({ createdAt: 1 }, { expireAfterSeconds: 3600 })

  1. 唯一索引(Unique Index)

确保字段值唯一:

javascript

复制

db.users.createIndex({ email: 1 }, { unique: true })

  1. 稀疏索引(Sparse Index)

仅索引包含该字段的文档:

javascript

复制

db.users.createIndex({ phone: 1 }, { sparse: true })

三、索引管理

  1. 查看索引

javascript

复制

db.collection.getIndexes() // 查看集合的所有索引

  1. 删除索引

javascript

复制

db.collection.dropIndex("indexName") // 删除指定索引

db.collection.dropIndexes() // 删除所有索引(保留 _id 索引)

  1. 重建索引

javascript

复制

db.collection.reIndex() // 重建所有索引(慎用,可能阻塞操作)

四、索引使用策略

  1. 索引选择

MongoDB 查询优化器会自动选择最优索引。

可通过 explain() 分析查询执行计划:

javascript

复制

db.collection.find({ field: "value" }).explain("executionStats")

  1. 覆盖查询(Covered Query)

如果查询结果完全由索引字段提供,无需回表查文档:

javascript

复制

// 创建复合索引

db.users.createIndex({ name: 1, age: 1 })

// 覆盖查询示例

db.users.find({ name: "Alice" }, { _id: 0, name: 1, age: 1 })

  1. 索引交集(Index Intersection)

MongoDB 可以将多个索引的结果合并,但通常复合索引更高效。

五、索引的限制与注意事项

内存占用:

索引存储在内存中,大集合的索引可能占用较多内存。

写操作开销:

索引会降低插入、更新、删除操作的性能。

索引键大小限制:

索引键(Index Key)的总大小不能超过 1024 字节。

查询模式匹配:

某些查询可能无法使用索引(如正则表达式未左锚定)。

六、最佳实践

优先使用复合索引:避免创建过多单字段索引。

避免全集合扫描:对高频查询字段建立索引。

索引选择性:高基数(唯一值多)的字段更适合建索引。

监控索引使用:

javascript

复制

db.collection.aggregate({ $indexStats: {} })

删除冗余索引:定期清理未使用的索引。

示例场景

场景 1:查询优化

javascript

复制

// 创建复合索引

db.orders.createIndex({ customerId: 1, orderDate: -1 })

// 查询最近订单

db.orders.find({ customerId: 123 }).sort({ orderDate: -1 })

场景 2:唯一约束

javascript

复制

// 确保用户名唯一

db.users.createIndex({ username: 1 }, { unique: true })

通过合理设计索引,可以显著提升 MongoDB 的查询性能,但需根据实际场景权衡读写开销。

相关推荐
这个DBA有点耶4 分钟前
NULL不是空——数据库里最反直觉的设计,90%新人踩过的坑
数据库·mysql·代码规范
这个DBA有点耶2 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
镜舟科技3 小时前
Databricks 再提 LTAP,AI 时代的数据底座为何重回大一统叙事?
数据库·架构·agent
Databend3 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
ClouGence7 小时前
SQL Server CDC 能放到 Always On 备库读吗?一文讲透原理与实践
数据库·sql server
葫芦和十三10 小时前
图解 MongoDB 25|分片架构三件套:mongos、config server 和 shard
后端·mongodb·agent
葫芦和十三16 小时前
图解 MongoDB 26|片键设计:决定集群命运的一个决定
后端·mongodb·agent
先吃饱再说1 天前
存储的进化:从 MySQL 到浏览器缓存,数据到底住在哪?
数据库
Nturmoils1 天前
字段太多看不全,ksql 的展开模式和输出控制怎么用
数据库·后端
Databend1 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent