GROUP BY隐性排序：MySQL 5.x 与 8.x 的行为大不同

一、前言：一次"消失的排序"引发的血案

某天，一个老项目从 MySQL 5.7 升级到 8.0 后，前端同事突然发现报表顺序乱了。

明明查询语句没改：

sql 复制代码

SELECT category, COUNT(*) FROM products GROUP BY category;

在 5.7 下结果是有序的，而在 8.0 下却顺序随机。

于是，团队一度怀疑：是不是MySQL出了Bug？

其实，并不是------是你一直在"误用" GROUP BY 的副作用。

二、回顾：MySQL 的 GROUP BY 到底做了什么？

GROUP BY 的本意，是分组聚合 而非排序。

它的职责是：

把具有相同分组键的行合并为一组，并计算聚合函数结果。

但在 MySQL 5.x 中，很多人发现------

执行：

sql 复制代码

SELECT category, COUNT(*) FROM products GROUP BY category;

结果似乎总是按 category 升序排列。

这就让人误以为：

"GROUP BY 默认会排序"。

其实这是个实现副作用，而不是标准行为。

三、MySQL 5.x 的"隐性排序"机制

在 MySQL 5.x（特别是5.6、5.7）中，执行 GROUP BY 时，优化器往往采用以下逻辑：

使用 filesort 排序 + 临时表 做分组；
或使用 索引顺序扫描 实现分组；
在多数场景下，最终结果是有序的（升序） 。

举例：

sql 复制代码

CREATE TABLE orders (
  id INT AUTO_INCREMENT PRIMARY KEY,
  customer_id INT,
  amount DECIMAL(10,2),
  INDEX idx_customer (customer_id)
);

执行：

sql 复制代码

SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id;

在 MySQL 5.7 中，如果索引被使用，执行计划会按索引顺序分组。

所以结果看起来是：

复制代码

customer_id
1
2
3
4

表面有序，实则是"顺带的副作用" 。

四、MySQL 8.0 的行为改变：标准优先，副作用被移除

MySQL 8.0 做了大量底层重构（尤其是优化器与临时表逻辑）。

官方在 MySQL 8.0 Release Note 中明确指出：

GROUP BY 不再保证结果的排序顺序。

若想排序，必须显式使用 ORDER BY。

也就是说，下面这条语句：

sql 复制代码

SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id;

在 8.0 下，可能输出：

复制代码

或者其他任意顺序------完全不保证有序性。

五、为什么 MySQL 8.0 要取消隐性排序？

主要有三个原因👇

1️⃣ 符合 SQL 标准

SQL 标准明确规定：

GROUP BY 的结果集顺序是未定义的。

MySQL 过去的行为偏离标准，导致迁移兼容性问题。

2️⃣ 提升执行效率

排序操作会引发：

临时表创建
filesort 排序
额外内存/磁盘I/O

取消隐性排序能让优化器更自由地选择执行计划，

在某些场景下，性能可提升 20%~50% 。

3️⃣ 避免错误依赖

开发者常常无意中依赖隐性排序 ，

例如：

sql 复制代码

SELECT category, SUM(amount)
FROM orders
GROUP BY category
LIMIT 10;

这种写法在 MySQL 5.7 下结果"看起来正确"，

但在 8.0 下可能完全乱序，影响分页或展示逻辑。

六、EXPLAIN 验证：行为差异对比

在 MySQL 5.7 下：

sql 复制代码

EXPLAIN SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id;

可能出现：

vbnet 复制代码

Using index for group-by

表示顺序分组（隐性有序）。

在 MySQL 8.0 下：

sql 复制代码

Using temporary; Using filesort

排序不再依赖索引顺序，结果随机。

七、如何在 MySQL 8.0 保证结果顺序？

非常简单：显式加 ORDER BY。

sql 复制代码

SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id
ORDER BY customer_id;

✅ 优点：

结果稳定、可预测
跨版本兼容
可配合 LIMIT 实现分页

八、补充：GROUP BY + ORDER BY 的性能优化

✅ 情况1：ORDER BY 与 GROUP BY 字段一致

MySQL 可直接利用索引顺序，避免排序。

sql 复制代码

CREATE INDEX idx_customer ON orders(customer_id);
SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id
ORDER BY customer_id;

性能最佳。

⚠️ 情况2：ORDER BY 与 GROUP BY 字段不同

MySQL 需要额外的排序步骤，性能会下降。

sql 复制代码

SELECT customer_id, SUM(amount)
FROM orders
GROUP BY customer_id
ORDER BY SUM(amount) DESC;

可考虑在应用层排序或做缓存。

九、总结：别再被"隐性排序"骗了

对比项	MySQL 5.x	MySQL 8.x
是否自动排序	是（副作用）	否（严格标准）
排序依据	GROUP BY 字段顺序	不保证顺序
性能表现	稍慢	更高效
解决方案	显式 `ORDER BY`	同上

🧩 写在最后

在 MySQL 5.x 下能跑的 SQL，不一定在 8.0 下"逻辑正确"。

升级版本前，请检查所有 GROUP BY 查询 ，

尤其是报表、统计、分页场景。

一句话总结👇

"GROUP BY 用来分组，不是排序。别再迷信副作用。"