1. 明确业务场景和查询需求
- 首先要了解系统的核心业务和查询场景,明确:
- 主要的查询语句是哪些?
- 查询中常用的过滤条件(WHERE)、排序(ORDER BY)、连接(JOIN)字段。
- 数据量规模和表的读写比例(读多还是写多)。
2. 分析SQL语句执行计划
通过 EXPLAIN 语句分析查询的执行计划,判断:
- 是否存在全表扫描(type=ALL),如果有,考虑加索引。
- 哪些索引被使用,索引的访问类型(ref、range等)。
- 查询的选择性,即索引过滤效率如何。
3. 选择合适的索引类型
- 单列索引:适合对某个字段经常做等值查询。
- 联合索引(复合索引):适合多个字段组合查询,遵循"最左前缀原则"。
- 唯一索引:保证数据唯一性的同时也能加快查询。
- 覆盖索引:索引包含查询需要的所有字段,减少回表。
- 全文索引:文本搜索场景使用。
4. 设计索引字段和顺序
- 优先选择选择性高(基数大的字段)作为索引列。
- 复合索引中,把选择性高且查询中用得最频繁的字段放在前面(最左边)。
- 避免将低基数字段(如布尔状态、性别)单独建索引。
- 对于经常用于排序的字段,可以考虑放入复合索引中。
5. 避免过度索引
- 索引会增加写操作(INSERT、UPDATE、DELETE)的开销和存储空间。
- 不要为不常用的查询建立索引,避免冗余索引。
- 定期审查和删除无用索引。
6. 测试和监控
- 建立索引后,使用 EXPLAIN 和性能监控工具验证查询是否使用了索引。
- 对比加索引前后的查询性能和写入性能变化。
- 在生产环境注意监控索引的维护成本。
用 EXPLAIN 判断查询是否合适,主要看:
- 是否用到索引
- 访问类型是否合理(避免全表扫描)
- 预计扫描行数是否合理
- 是否有临时表或文件排序
- 多表连接是否高效