InnoDB选用B+树作为索引的原因

B+树

mysql的InnoDB引擎采用b+树存储索引; 为什么采取这个数据结构,我觉得可以对比其他的树形结构,来体会它的优点。

1、为什么不选二叉树 / 红黑树?

像二叉树,红黑树(特殊的二叉树)如果数据量很多的话,树会很高;

==》 每多一层就意味着多一次磁盘 I/O 操作,这在数据库场景中是性能瓶颈。

2、为什么不选b树?

b树每个节点可以存储更多的数据,例如5阶B树可最多可以存储4个key:

B 树通过 "多路平衡" 的设计,确实大幅降低了树高,但它有两个明显缺点:

非叶子节点存数据;范围查询效率低

3、b+树

1) 非叶节点只存指针 :

b+树的非叶节点只有存储指针,不存存储数据,它们的作用只是为了导航找到叶子节点的数据; 这样的优点有:磁盘的读取代价比b树更低;

(因为在找树形叶子节点中数据的过程中,中间节点也会被完整加载,正因其非叶节点只存储索引。故而可以容纳更多索引键,从而减低树高,即减少IO次数)

2)叶子节点的双向链表

b+树的叶子节点是一个双向链表,我们可以在叶子节点层面上进行数据的查找扫描; 即b+树便于扫描和区间查询 。

高效场景 :执行 BETWEEN ... AND ...ORDER BY 这类范围查询时,B + 树只需找到区间的起始叶子节点,然后顺着链表向后扫描即可,效率远高于 B 树。

讨论:

1、b+树它优势在于磁盘页可以存储更多的索引键**。 是否因为这样我们可以在一个节点中设计更多的索引键,这样就能压缩树高?**

==> 是的,数据库在设计时,会让一个 B+ 树节点的大小恰好等于一个磁盘页。 即你看的树高只是逻辑样态,我们最终关系的其实查找到目标值所需要的IO数。

物理层面:数据库的最小 IO 单位是「磁盘页」(通常 4KB)。每次 IO 操作,就是读取或写入一个完整的磁盘页。

逻辑层面:B + 树的一个节点,在物理上就对应一个磁盘页。所以,访问一个节点,就等于触发一次磁盘 IO。

性能层面 :我们说的「树高」,本质上就是从根节点到叶子节点需要经过的节点数量,也就是需要触发的IO 次数

相关推荐
05候补工程师13 小时前
【408狂飙·数据结构】核心考点深度复盘:数组地址计算、特殊矩阵压缩存储与树的五大性质解题直觉
数据结构·笔记·线性代数·考研·算法·矩阵
炘爚14 小时前
数据结构:顺序表
数据结构
LuminousCPP14 小时前
数据结构 - 线性表第二篇:动态顺序表进阶接口实现
c语言·数据结构·笔记·顺序表·线性表
承渊政道14 小时前
【贪心算法】(经典实战应用解析(五):单调递增的数字、坏了的计算器、合并区间、⽆重叠区间、⽤最少数量的箭引爆⽓球)
数据结构·c++·leetcode·贪心算法·排序算法·动态规划·哈希算法
念恒1230615 小时前
Python(while循环)
数据结构·python·算法
bqq1986102615 小时前
Redis持久化
数据结构·数据库·redis·缓存
阳明山水16 小时前
模型迭代实战:如何将准确率从75%提升到89%
数据结构·人工智能·算法·机器学习·微信·微信公众平台·微信开放平台
故事和你9117 小时前
洛谷-【图论2-2】最短路4
开发语言·数据结构·c++·算法·动态规划·图论
承渊政道17 小时前
【贪心算法】(经典实战应用解析(四):分发饼干、最优除法、跳跃游戏、跳跃游戏Ⅱ、加油站)
数据结构·c++·算法·leetcode·贪心算法·动态规划·哈希算法
m0_6294947317 小时前
LeetCode 热题 100-----24.回文链表
数据结构·算法·leetcode·链表