松散索引扫描/跳跃索引扫描

松散索引扫描(Loose Index Scan) 是 MySQL 优化器的一种高级查询策略,主要用于优化 GROUP BYDISTINCT 查询。

它的核心思想是:不需要扫描索引中所有的行,而是跳过不符合条件的行,直接"跳跃"到每个分组的第一个或最后一个匹配项上。


1. 核心原理:从"地毯式搜索"到"跳跃式前进"

在传统的**紧凑索引扫描(Tight Index Scan)**中,数据库会扫描索引中的每一条记录。而松散索引扫描则利用了索引的有序性,只读取每个组中极少数的行。

直观对比:

假设你在一个按 (A, B) 排序的索引中查找每个 A 的最小值:

  • 紧凑扫描 :读取 A=1 的所有行找到最小值,再读取 A=2 的所有行......这就像翻完一整本书。
  • 松散扫描 :读取 A=1 的第一行(由于有序,第一行必是最小值),然后直接跳到 索引中 A=2 的起始位置。这就像直接看每章的目录。

2. 触发松散索引扫描的条件

MySQL 并不会对所有查询都使用这一策略,它通常需要满足以下严格条件:

  1. 单表查询:查询只涉及一张表。
  2. 前缀索引GROUP BYDISTINCT 使用的列必须符合索引的最左前缀原则。
  3. 聚合函数限制 :只支持 MIN()MAX()。且这些函数的参数必须是索引中的列,并且紧跟在 GROUP BY 列之后。
  4. 完整性 :索引中的所有列必须参与了查询(要么在 GROUP BY 中,要么在 MIN/MAX 中)。

3. 一个具体的示例

假设有一张表 orders,索引为 (customer_id, order_date)

sql 复制代码
SELECT customer_id, MIN(order_date)
FROM orders
GROUP BY customer_id;

执行逻辑:

  1. 数据库定位到索引的头部。
  2. 获取第一个 customer_id (比如 ID=100) 的第一条记录。
  3. 关键动作 :由于索引是排好序的,ID=100 的第一条记录对应的 order_date 一定是该客户最早的订单。
  4. 跳跃 :数据库直接通过索引树的 B+ 结构,寻找比 ID=100 大的下一个 customer_id
  5. 重复此过程,直到索引结束。

4. 如何在 EXPLAIN 中识别?

当你运行 EXPLAIN 时,如果在 Extra 列中看到以下字样,说明松散索引扫描生效了:

Using index for group-by

这标志着查询性能得到了质的提升,因为数据库处理的数据行数从 全表记录数 降低到了 分组数


相关推荐
苍煜2 小时前
二叉树、红黑树、B树、B+树通俗教学:各自适配场景+MySQL索引终极选型原因
数据结构·b树·mysql
星马梦缘3 小时前
数据库作战记录 实验7、8
数据库·sql·oracle
安逸sgr3 小时前
Hermes Agent + Obsidian 打造第二大脑(六):分层记忆系统的设计逻辑——L0/L1/L2/L3 四层记忆详解
数据库·agent·知识库·hermes·hermesagent
苍煜4 小时前
一篇讲懂分库分表:概念、spirngboot实战
数据库·oracle
梦想画家4 小时前
PostgreSQL 物化视图实战:从数据固化到智能刷新的全链路指南
数据库·postgresql·物化视图
weoptions4 小时前
简单sql注入中如何通过简单语句判断注入类型&注入方法
数据库·sql
小短腿的代码世界4 小时前
Qt数据库编程深度解析:从SQL基础到ORM架构设计
数据库·sql·qt
Database_Cool_5 小时前
在 RDS PostgreSQL 中实现 RaBitQ 量化
数据库·阿里云·ai·postgresql
【心态好不摆烂】5 小时前
MySQL操作库
数据库·mysql