松散索引扫描/跳跃索引扫描

松散索引扫描(Loose Index Scan) 是 MySQL 优化器的一种高级查询策略,主要用于优化 GROUP BYDISTINCT 查询。

它的核心思想是:不需要扫描索引中所有的行,而是跳过不符合条件的行,直接"跳跃"到每个分组的第一个或最后一个匹配项上。


1. 核心原理:从"地毯式搜索"到"跳跃式前进"

在传统的**紧凑索引扫描(Tight Index Scan)**中,数据库会扫描索引中的每一条记录。而松散索引扫描则利用了索引的有序性,只读取每个组中极少数的行。

直观对比:

假设你在一个按 (A, B) 排序的索引中查找每个 A 的最小值:

  • 紧凑扫描 :读取 A=1 的所有行找到最小值,再读取 A=2 的所有行......这就像翻完一整本书。
  • 松散扫描 :读取 A=1 的第一行(由于有序,第一行必是最小值),然后直接跳到 索引中 A=2 的起始位置。这就像直接看每章的目录。

2. 触发松散索引扫描的条件

MySQL 并不会对所有查询都使用这一策略,它通常需要满足以下严格条件:

  1. 单表查询:查询只涉及一张表。
  2. 前缀索引GROUP BYDISTINCT 使用的列必须符合索引的最左前缀原则。
  3. 聚合函数限制 :只支持 MIN()MAX()。且这些函数的参数必须是索引中的列,并且紧跟在 GROUP BY 列之后。
  4. 完整性 :索引中的所有列必须参与了查询(要么在 GROUP BY 中,要么在 MIN/MAX 中)。

3. 一个具体的示例

假设有一张表 orders,索引为 (customer_id, order_date)

sql 复制代码
SELECT customer_id, MIN(order_date)
FROM orders
GROUP BY customer_id;

执行逻辑:

  1. 数据库定位到索引的头部。
  2. 获取第一个 customer_id (比如 ID=100) 的第一条记录。
  3. 关键动作 :由于索引是排好序的,ID=100 的第一条记录对应的 order_date 一定是该客户最早的订单。
  4. 跳跃 :数据库直接通过索引树的 B+ 结构,寻找比 ID=100 大的下一个 customer_id
  5. 重复此过程,直到索引结束。

4. 如何在 EXPLAIN 中识别?

当你运行 EXPLAIN 时,如果在 Extra 列中看到以下字样,说明松散索引扫描生效了:

Using index for group-by

这标志着查询性能得到了质的提升,因为数据库处理的数据行数从 全表记录数 降低到了 分组数


相关推荐
倔强的石头_19 小时前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
云技纵横19 小时前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
沉默王二19 小时前
面试官:RAG 不用向量数据库,用 MySQL 硬扛?我:100 万向量不是很轻松?
mysql·面试·ai编程
冬奇Lab1 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
小猿姐1 天前
MySQL Top 10 热点问题 AI 运维实战:从内核诊断到云原生运维
mysql·云原生·aiops
jump_jump2 天前
流式 HTML:从 htmx 片段装配到浏览器原生增量渲染
javascript·性能优化·前端工程化
ClouGence2 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
云技纵横2 天前
Gap Lock 死锁实战:5 秒在本地复现 MySQL 间隙锁死锁
后端·mysql
无响应de神2 天前
三、用户与权限管理
数据库·mysql