mysql8 loose index skip scan 特性加速分组查询性能

要理解Loose Index Scan（松散索引扫描） 如何加速 GROUP BY，核心是抓住「索引有序性 」和「跳过无效数据、只取分组核心值」这两个关键点------它彻底避开了"遍历所有数据→临时表分组"的低效路径，直接从有序索引中"精准提取"分组结果。

假设表 t1 有索引 idx(c1,c2)，数据如下（索引是有序存储的，所以实际索引中 c1 的值是连续的）：

如果执行 SELECT c1, MIN(c2) FROM t1 GROUP BY c1;，常规方式的执行步骤是：

这个过程要遍历所有数据，还需要临时表，数据量越大效率越低。

因为索引 idx(c1,c2) 是 有序的 （BTREE 索引特性），c1 相同的记录在索引中是连续排列的。Loose Index Scan 利用这一点，只读取每个分组的"关键值"，跳过同分组的其他数据：

定位索引中第一个 c1=1 的记录，其 c2=10------因为索引有序，同组后续的 c1=1 记录的 c2 一定≥10，所以 MIN(c2) 直接确定为 10，无需读取 c1=1 的下一条记录（c2=20）；
跳过所有 c1=1 的剩余记录，直接定位到第一个 c1=2 的记录，其 c2=30------同理，MIN(c2)=30，跳过 c1=2 的下一条记录（c2=40）；
跳过所有 c1=2 的剩余记录，定位到第一个 c1=3 的记录，其 c2=50------MIN(c2)=50；
直接返回结果，全程只读取了 3 条记录（每个分组 1 条），且无需创建临时表。

如果查询是 SELECT c1, MIN(c2) FROM t1 WHERE c1 < 3 GROUP BY c1;：

"松散"的核心是------它不"紧密"遍历索引的每一个键值，而是跳过同分组的所有冗余记录，只抓每个分组的"锚点"（首条记录），就像从有序的数组中"跳着找"分组，而非逐个遍历。

必须满足「GROUP BY 列是索引最左前缀」+「聚合函数仅 MIN/MAX 且列紧跟分组列」，本质是：

如果不满足这些条件（比如用 SUM、GROUP BY 列不是最左前缀），就无法"跳着找"，只能退化为 Tight Index Scan 或常规方式。

简单总结：Loose Index Scan 把 GROUP BY 的执行成本，从「依赖数据总量」降到了「依赖分组数量」，分组数远小于数据量时，加速效果极其显著。