总结于JavaGuide
知识点总结
索引是什么?
索引为什么快?
MySQL 索引底层数据结构是什么?
B+树拓展思考
树的高度极低:百万级数据的 B + 树,高度仅需 3~4 层。一次查询最多只需要3~4 次磁盘 IO,就能定位到目标数据。
1.为什么是3~4层?
2.为什么层数就是IO数?
回答
1. 索引是什么?
索引是数据库中为提升数据查询效率而创建的有序数据结构,本质是对数据表中一列 / 多列的值进行排序的映射关系,类似书籍的目录 ------ 通过索引可直接定位到目标数据的物理位置,避免全表扫描。
2. 索引为什么快?
核心是减少磁盘 IO 次数 + 避免全表遍历:
- 索引将无序的原始数据转化为有序结构,能快速定位数据位置,无需逐行扫描整张表;
- 数据库性能瓶颈主要在磁盘 IO,索引的紧凑结构可大幅减少磁盘 IO 的次数(只需遍历索引树而非全表数据);
- 索引的有序性还能直接支持排序、范围查询等操作,无需额外排序计算。
3. MySQL 索引底层数据结构是什么?
MySQL 主流存储引擎的索引底层核心是B + 树:
- InnoDB/MyISAM 引擎默认使用 B + 树 作为索引底层结构(两者的 B + 树 实现略有差异,如 InnoDB 是聚簇索引,MyISAM 是非聚簇索引);
拓展思考
-
**为什么 3~4 层?**分支因子(每节点子节点数)大(100~1000),叶子节点数随高度指数级增长(f^(h-1))。百万级数据下,3 层可容纳约 100²=1 万到 1000²=100 万,4 层可容纳约 100³=1000 万到 1000³=10 亿,因此高度为 3~4 层。
-
**为什么层数 = IO 数?**B + 树的每个节点对应一个磁盘块,一次 IO 只能读取一个磁盘块。查询时,需要从根到叶子依次读取路径上的每一层节点,因此层数等于磁盘 IO 次数。