MongoDB——索引(单索引,复合索引,索引创建、使用)

MongoDB索引

官方文档

https://docs.mongodb.com/manual/indexes/#create-an-index

默认索引 _id index

Mongodb 在 collection 创建时会默认建立一个基于_id 的唯一性索引作为 document 的 primarykey,这个 index 无法被删除

单个字段索引

单字段索引是 Mongodb 最简单的索引类型,不同于 MySQL,MongoDB 的索引是有顺序的,支持升序或者降序。

B树组织

但是对于单字段索引来说,索引的顺序无关紧要,因为 MongoDB 支持任意顺序遍历单字段索引。

在此创建一个 records collection:

json 复制代码
{
 "_id": ObjectId("570c04a4ad233577f97dc459"),
 "score": 1034,
 "location": { state: "NY", city: "New York" }
}

然后创建一个 单字段索引:
db.records.createIndex({ score: 1 } )

上面的语句在 collection 的 score field 上创建了一个 升序索引,这个索引支持以下查询:
db.records.find( { score: 2 } )
db.records.find( { score: { $gt: 10 } } )

可以使用 MongoDB 的 explain 来对以上两个查询进行分析:
db.records.find({score:2}).explain('executionStats')
db.records.find({"location.state":"NY"}).explain('executionStats')

嵌套字段的单索引

db.records.createIndex( { "location.state": 1 } )

上面的 embedded index 支持以下查询:
db.records.find( { "location.state": "CA" } )
db.records.find( { "location.city": "Albany", "location.state": "NY" } )

单索引排序

因为索引是排序的,所以可以支持对索引字段的排序(快速)

对于单索引来说,由于 MongoDB index 本身支持顺序查找,所以对于单索引来说以下都是可以使用到索引的

js 复制代码
db.records.find().sort( { score: 1 } )
db.records.find().sort( { score: -1 } )
db.records.find({score:{$lte:100}}).sort( { score: -1 } )

复合索引

Mongodb 支持对多个字段建立索引,称之为复合索引。复合索引 中 field 的顺序对索引的性能有至关重要的影响,比如索引 {userid:1, score:-1}首先根据 userid 排序,然后再在每个userid 中根据 score降序排序。

创建复合索引

在此创建一个 products collection:

js 复制代码
db.products.insert({
	"item": "Banana",
	"category": ["food", "produce", "grocery"],
	"location": "4th Street Store",
	"stock": 4,
	"type": "cases"
})

然后创建一个 复合索引:
db.products.createIndex( { "item": 1, "stock": 1 } )

这个 index 引用的 document 首先会根据 item 排序,然后在 每个 item 中,又会根据 stock

排序,以下语句都满足该索引:
db.products.find( { item: "Banana" } )
db.products.find( { item: "Banana", stock: { $gt: 5 } } )

条件 {item: "Banana"} 满足是因为这个 query 满足 prefix 原则

最左匹配原则

和MySQL索引最左匹配类似,都是由于底层数据结构组织的原因,MongoDB是B树组织索引,MySQL是B+树组织索引。对于复合索引来说,就需要满足最左匹配的原则Index prefix 是指 index fields 的左前缀子集,考虑以下索引:
{ "item": 1, "location": 1, "stock": 1 }

这个索引包含以下 index prefix:

js 复制代码
{ item: 1 }
{ item: 1, location: 1 }
{ "item": 1, "location": 1, "stock": 1 }

所以只要语句满足 index prefix 原则都是可以支持使用 复合索引 的:

js 复制代码
db.products.find( { item: "Banana" } )
db.products.find( { item: "Banana",location:"4th Street Store"} )
db.products.find( { item: "Banana",location:"4th Street Store",stock:4})

相反如果不满足 index prefix 则无法使用索引。

js 复制代码
db.products.find( { location:"4th Street Store",stock:4} )

排序使用复合索引

sort 的顺序必须要和创建索引的顺序是一致的,一致的意思是不一定非要一样

即排序的顺序必须要和索引一致,逆序之后一致也可以,下表清晰的列出了 复合索引 满足的

query 语句:

考虑索引 { a: 1, b: 1, c: 1, d: 1 },即使排序的 field 不满足 index prefix 也是可以的,

但前提条件是排序 field 之前的 index field 必须是等值条件。在前面的field是等值条件情况下,B树索引构建时,在前置filed相同时,会根据后面的field排序构建,所以这种情况的排序是可以使用索引查找到对应数据的。

js 复制代码
r1 db.data.find( { a: 5 } ).sort( { b: 1, c: 1 } ) { a: 1 , b: 1, c: 1 }
r2 db.data.find( { b: 3, a: 4 } ).sort( { c: 1 } ) { a: 1, b: 1, c: 1 }
r3 db.data.find( { a: 5, b: { $lt: 3} } ).sort( { b: 1 } ) { a: 1, b: 1 }

field顺序对索引的影响

对索引构建是没太大影响,但是对于需要扫描的文档,顺序的不同可能差别就很大了。个人理解是对基数大(数据重复度低)的字段排在前面。优先考虑能够最大化限制数据范围的索引顺序。

慢查询监控

对于查询的优化,我们可以开启慢查询监控

MongoDB 支持对 DB 的请求进行 profiling,目前支持 3 种级别的 profiling。

  • 0: 不开启 profiling
  • 1: 将处理时间超过某个阈值(默认 100ms)的请求都记录到 DB 下的 system.profile 集合 (类似于 mysql、redis 的 slowlog)
  • 2: 将所有的请求都记录到 DB 下的 system.profile 集合(生产环境慎用)

通常,生产环境建议使用 1 级别的 profiling,并根据自身需求配置合理的阈值,用于监测慢请求的情况,并及时的做索引优化。

如果能在集合创建的时候就能『根据业务查询需求决定应该创建哪些索引』,当然是最佳的选择;但由于业务需求多变,要根据实际情况不断的进行优化。索引并不是越多越好,集合的索引太多,会影响写入、更新的性能,每次写入都需要更新所有索引的数据;所以你 system.profile 里的慢请求可能是索引建立的不够导致,也可能是索引过多导致

创建删除索引

参考文章开头链接就好,很简单的。

相关推荐
play_big_knife18 分钟前
鸿蒙项目云捐助第二十八讲云捐助项目首页组件云数据库加载轮播图
数据库·华为·harmonyos·鸿蒙·云开发·鸿蒙开发·鸿蒙技术
qq_321665331 小时前
mysql 数据库迁移到达梦数据库
数据库·mysql
Hello.Reader2 小时前
Redis大Key问题全解析
数据库·redis·bootstrap
靖顺4 小时前
【OceanBase 诊断调优】—— packet fly cost too much time 的根因分析
数据库·oceanbase
liuxin334455664 小时前
学籍管理系统:实现教育管理现代化
java·开发语言·前端·数据库·安全
行走的山峰7 小时前
ES和MONGODB备份脚本
mongodb·es
yuanbenshidiaos7 小时前
C++--------------树
java·数据库·c++
dengjiayue8 小时前
MySQL 查询大偏移量(LIMIT)问题分析
数据库·mysql
言之。8 小时前
【MySQL】在MySQL中如何定位慢查询?
数据库·mysql
DashVector9 小时前
如何通过HTTP API插入Doc
数据库·人工智能·http·阿里云·向量检索