MySQL 索引特性与性能优化全解

前言:

大家好,今天这篇文章将从索引本质、数据结构、物理存储、索引分类、创建删除、性能压测、最左前缀、索引优化全覆盖、可直接复制运行,适合学习、笔记、复习、面试使用。在 MySQL 性能优化中,索引是最关键、最有效、最常用的手段。没有索引 = 全表扫描;有了索引 = 快速定位。但索引不是越多越好,理解原理、结构、适用场景,才能写出真正高效的 SQL。声明一下,由于本章概念性的知识比较多,有些地方会直接放上资料的截图大家自行进行查看理解一下。

一. 索引是什么

1.1 初步认识索引

索引是帮助 MySQL高效获取数据的数据结构(B + 树)。可以理解为:书的目录。

优点

  • 大幅提高查询速度
  • 降低磁盘 IO 次数
  • 优化排序、分组操作

缺点

  • 占用磁盘空间
  • 降低增删改效率(需要维护索引树)
  • 过多索引会导致优化器选择困难

大家感兴趣的话可以做一下下面这个实验

二. 索引底层数据结构:B + 树

2.1 B + 树结构的特点

  • 叶子节点保存有数据,非叶子节点(即路上节点)不存储数据,只存储目录项。因为非叶子节点不存数据,所以可以存储更多的目录项,从而管理更多的叶子节点。这样形成的树结构矮胖,查找时经过的节点少,每次读取的 page 更少,可以大大提升搜索效率。在十层左右的树中,整体效率会有显著提高。

  • 叶子节点全部用链表级联起来。这是 B+ 树的一个重要特点,主要目的是为了高效地进行范围查找。

为何选择 B+

  • 节点不存储 data,这样一个节点就可以存储更多的 key。可以使得树更矮,所以 IO 操作次数更少。
  • 叶子节点相连,更便于进行范围查找

2.2 为何选择 B+ 树

重点:为什么不用二叉树、红黑树、B 树?

  • 二叉树:数据倾斜时高度极高,IO 多
  • 红黑树:层数仍然高
  • B 树:叶子节点不连续,范围查询慢
  • B + 树:MySQL 最终选择

三. InnoDB 与 MyISAM 索引实现(聚簇索引和非聚簇索引)

3.1 InnoDB:聚簇索引

  • 索引即数据,数据即索引
  • .ibd 文件 = 索引 + 数据
  • 主键索引叶子节点存储完整记录
  • 辅助索引叶子节点存储:主键值

3.2 MyISAM:非聚簇索引

  • 索引和数据分开存储
  • .MYD 数据文件
  • .MYI 索引文件
  • 索引叶子节点存储:数据地址指针

3.3 回表查询(辅助索引补充)

通过辅助索引找到主键 → 再通过主键查数据 → 叫回表

避免回表的方法:覆盖索引 (后面会讲到的)。

四. 索引分类与创建

4.1 主键索引(primary key)

  • 非空、唯一、一个表只能一个
  • 默认为聚簇索引
sql 复制代码
create table user(
    id int primary key auto_increment,
    name varchar(20)
);

4.2 唯一索引(unique)

  • 列值唯一,允许 null
  • 适合身份证、手机号、邮箱
sql 复制代码
create unique index idx_name on user(name);

4.3 普通索引(index)

  • 仅加速查询
  • 无唯一性限制
sql 复制代码
create index idx_name on user(name);

4.4 复合索引(常用)

  • 多个字段组合成索引
  • 遵循最左前缀原则
  • 最左前缀:必须从左到右依次匹配,不能跳过。
sql 复制代码
create index idx_name_age on user(name,age);

举个例子

假设有一张用户表:

sql 复制代码
CREATE TABLE user (
    id INT PRIMARY KEY,          -- 主键索引
    name VARCHAR(20),
    age INT,
    city VARCHAR(20),
    INDEX idx_name_age (name, age)   -- 复合索引 (name, age)
);

查询1:使用覆盖索引,避免回表

sql 复制代码
SELECT name, age FROM user WHERE name = '张三';
  • 条件用了复合索引的最左列 name,满足最左前缀原则。
  • 索引 idx_name_age 中已经包含了 nameage,查询需要的字段都在索引里,直接从索引返回数据,不用回表

查询2:缺少最左列,索引失效

sql 复制代码
SELECT name, age FROM user WHERE age = 25;
  • 条件没有 name,不满足最左前缀原则,idx_name_age 无法高效使用。

查询3:索引未覆盖所有字段,仍需回表

sql 复制代码
SELECT name, age, city FROM user WHERE name = '张三';
  • 虽然满足最左前缀,但 city 不在 idx_name_age 中,索引只能找到 nameage,还得拿着 id 回主键索引取 city

总结:

复合索引遵循 最左前缀原则 ,只有从第一列开始连续匹配才能被有效利用;如果索引 包含了查询所需的所有列(覆盖索引) ,就能 避免回表,直接返回结果。

4.5 全文索引(fulltext)

  • 用于大文本检索
  • 不支持 like "% xxx%"
sql 复制代码
create fulltext index idx_content on article(content);

五. 索引的删除与查看操作

5.1 删除索引

sql 复制代码
drop index idx_name on user;

5.2 查看索引

sql 复制代码
show index from user;
show index from user\G

六. 索引知识点小结

6.1 索引失效场景

  • 违反最左前缀
  • 使用函数 where upper(name)='A'
  • 隐式类型转换 where id='123'
  • like '% xxx' 以通配符开头
  • 使用 or 但有字段无索引
  • order by 违反最左前缀
  • 使用!= 、 not in 、 not exists
  • 优化器判断全表扫描更快(数据量少)

6.2 索引设计最佳实践

  • 优先创建复合索引,而不是单列索引
  • 索引字段要高选择性(如性别不适合)
  • 不要索引频繁更新的字段
  • 不要索引无用字段
  • 单表索引建议不超过 5 个
  • 复合索引字段顺序:等值在前,范围在后
  • 尽量使用覆盖索引,避免 select *

6.3 总结

  • 索引是 B + 树结构,目的是减少 IO、加速查询
  • InnoDB 是聚簇索引,MyISAM 是非聚簇索引
  • 辅助索引存主键,查询可能回表
  • 复合索引必须遵循最左前缀
  • 覆盖索引能避免回表,大幅提升速度
  • 索引不是越多越好,要按业务设计
  • 掌握索引失效场景,SQL 才能真正高效
相关推荐
霞姐聊IT13 小时前
缓存技术:从CPU Cache到AI KV Cache (一)
缓存·性能优化
朝阳58114 小时前
树莓派跑了个 M3U8 下载服务,内存从 600MB 降到 2MB
性能优化·rust
梵得儿SHI14 小时前
SpringCloud 进阶拓展:性能优化指南(缓存三大问题 + 分库分表入门)
spring cloud·缓存·微服务·性能优化·高并发·分库分表·数据库优化
山峰哥14 小时前
索引策略与SQL优化:从Explain对比到生产调优的完整方法论
android·java·数据库·sql·性能优化·深度优先
全球通史15 小时前
Jetson Nano 双摄像头芯片检测视觉系统:小尺度难定位问题解决,从零开始实现教程说明
嵌入式硬件·算法·ubuntu·性能优化
爱喝水的鱼丶16 小时前
SAP-ABAP:条件判断与循环控制语句(7篇)第七篇:性能优化:条件与循环代码的常见性能瓶颈与优化方案
学习·算法·性能优化·sap·abap
孟俊宇-MJY1 天前
Brew 包管理器深度评测:从安装效率到生态兼容性
性能优化
Saniffer_SH1 天前
【每日一题】不只是点亮画面:UniGraf 如何把 HDMI/DP 接口问题拆成可定位、可复现、可自动化验证的测试流程?
运维·人工智能·测试工具·fpga开发·性能优化·自动化·压力测试
189228048611 天前
N9BYW固态MT29F16T08ESLHHL5-42QM:H
性能优化