MySQL 复合索引怎么设计?从业务 SQL 反推索引顺序

索引不是越多越好,也不是"把 where 里的字段全塞进去"就结束。

这篇讲一个更实用的方法:从你的真实 SQL 反推索引。

先给一个可直接用的原则

设计复合索引时,按这个优先级排字段:

  1. 等值过滤字段(= / IN
  2. 排序字段(ORDER BY
  3. 范围字段(> < BETWEEN
  4. 返回列(用于覆盖索引,按需补)

一句话:先过滤,再排序,最后才是范围和覆盖。


一、先看业务 SQL,再谈索引

假设订单列表最常见 SQL:

sql 复制代码
SELECT id, user_id, status, create_time
FROM orders
WHERE user_id = 10086
  AND status = 1
  AND create_time >= '2026-03-01 00:00:00'
ORDER BY create_time DESC, id DESC
LIMIT 20;

从这条 SQL 反推:

  • user_idstatus:等值过滤,放前面
  • create_timeid:排序字段,接在后面

候选索引:

sql 复制代码
CREATE INDEX idx_orders_uid_status_ctime_id
ON orders(user_id, status, create_time DESC, id DESC);

二、为什么顺序这么重要

复合索引是按最左前缀匹配的,顺序错了,收益会掉很多。

比如你建成:

sql 复制代码
CREATE INDEX idx_bad ON orders(create_time, user_id, status);

那上面的 SQL 会先按 create_time 走,user_id/status 的过滤收益会被拖后,扫描行数往往更大。


三、3 个高频场景的索引模板

场景 1:列表查询(过滤 + 排序 + 分页)

SQL 特征:

  • WHERE a = ? AND b = ?
  • ORDER BY c DESC, id DESC
  • LIMIT ?

推荐:

sql 复制代码
INDEX(a, b, c DESC, id DESC)

场景 2:详情页查单条(精确定位)

SQL 特征:

  • WHERE biz_no = ?WHERE tenant_id = ? AND biz_no = ?

推荐:

sql 复制代码
UNIQUE INDEX(tenant_id, biz_no)

能保证唯一性,也避免重复脏数据。

场景 3:统计报表(时间范围 + 分组)

SQL 特征:

  • WHERE tenant_id = ? AND create_time BETWEEN ? AND ?
  • GROUP BY status

推荐起步:

sql 复制代码
INDEX(tenant_id, create_time, status)

报表类还要结合数据量评估是否做离线聚合,别把在线库当数仓打。


四、你最容易踩的 6 个坑

  1. 把低选择度字段放最前 比如 gender/status/is_deleted 放第一列,过滤效果很弱。

  2. 只看 where,不看 order by 结果命中过滤却 Using filesort,耗时依然高。

  3. 索引过宽 字段太多会增大维护成本,写入变慢,内存占用更高。

  4. 重复索引 (a,b,c) 已经存在,再建 (a,b) 往往是冗余。

  5. 把范围字段放太早 一旦前面进入范围匹配,后续列利用效率会下降。

  6. 以为覆盖索引永远最好 覆盖索引确实快,但也更重;高写入表要平衡读写成本。


五、我自己的落地流程(5 步)

  1. 先拉一周慢 SQL,按调用量和耗时排序
  2. 选 TOP 场景逐条 EXPLAIN,确认 rows/key/extra
  3. 给每个核心 SQL 设计 1 个主索引(而不是每条 SQL 一个索引)
  4. 灰度上线,观察慢日志和写入延迟
  5. 清理冗余索引,避免"索引越优化越慢"

六、一个"改前改后"例子

慢 SQL:

sql 复制代码
SELECT *
FROM orders
WHERE status = 1
  AND user_id = 10086
ORDER BY create_time DESC
LIMIT 20;

问题:

  • SELECT * 回表重
  • 索引顺序不合理,排序额外开销大

改造:

sql 复制代码
-- 索引
CREATE INDEX idx_orders_uid_status_ctime
ON orders(user_id, status, create_time DESC);

-- SQL
SELECT id, user_id, status, create_time
FROM orders
WHERE user_id = 10086
  AND status = 1
ORDER BY create_time DESC
LIMIT 20;

通常你会看到:扫描行数下降、排序成本下降、P95 明显变稳。


最后总结

复合索引设计不是背口诀,而是把业务查询路径"翻译"成 B+Tree 顺序。

如果你只记一个句子,就记这个:

先拿慢 SQL,再反推索引;先服务高频场景,再追求理论完美。

相关推荐
AI 小老六7 分钟前
Google AX 控制面拆解:分布式 Agent 如何把断点恢复、审计策略和执行调度收进同一条链路
人工智能·分布式·后端·ai·架构·ai编程
YHHLAI10 分钟前
从零搭建一个 RESTful Todo 服务 —— Bun + TypeScript 全栈最小闭环
后端·typescript·restful
小闹54917 分钟前
一个 65 行的小需求,我让 Claude Code 跑了 25 个 agent、整整两小时
后端·claude
天青色等烟雨..20 分钟前
智慧农林核心遥感技术99个案例实践
运维·人工智能·spring boot·后端·自动化
西安邮电大学24 分钟前
贪心算法详细讲解
java·后端·其他·算法·面试
橙序员小站27 分钟前
从"夯"到"拉":谷歌苹果华为开发者大会,谁在裸泳?
人工智能·后端
HjhIron1 小时前
从零实现一个待办事项应用:前端必学的Ajax与Node.js实战
前端·后端
浩风祭月1 小时前
我用 AI 辅助重构了遗留项目的认证模块:从明文存储到 OAuth 2.0 的安全升级
后端·php·ai编程
用户34232323763171 小时前
数据质量与异常检测——当采集系统学会了“怀疑“
后端