Mysql InnoDB B+Tree是什么?

"mysql中常用的数据库搜索引擎InnoDB,其索引通过B+Tree的方式进行构建。"

实在想不起来B+Tree是怎么一回事了。以点带线,将涉及到的数据结构一起复习一下。

文章目录

数据结构定义

数据结构 定义
二叉树 每个节点最多有两个子树
二叉排序树 又叫二叉搜索树。在二叉树的基础上,递归定义 任意子树根节点大于其左子树最大值小于右子树最小值. 左<根<右
平衡二叉树 在二叉排序树的基础上, 递归定义 任意节点 左右子树的高度差≤1.
红黑树 在二叉排序树的基础上,递归定义 见下方
BTree B-Tree 同一个东西。见下方
B+Tree 见下方

如果插入的是有序序列, 二叉排序树的效率降低为O(n). 所以推出 平衡二叉树

红黑树

定义

  1. 左中右: 前提是一棵二叉搜索树(左<中<右)
  2. 根、叶黑: 根节点和叶子结点都是黑色
  3. 不红红: 不存在两个红色节点有直接父子关系
  4. 黑路同: 任意节点到所有叶子节点经过的黑色节点数相同

使命

红黑树并不是在平衡二叉树的基础上定义的。

由于平衡二叉树左右子树高度差≤1,要求过于严格。虽然查询效率较高,但插入、删除时,调整频繁, 因此引入红黑树。

由于不红红和黑路同的性质可以推断出:红黑树左右子树最长路径节点数不超过最短路径的2倍。

相对于平衡二叉树,插入、删除效率有所提升。

BTree

BTree 就是多路查找树(一个节点内可以有多个元素),每个元素都有左右子树。 2阶BTree, 退化成平衡二叉树

定义

  1. 有序 1. 结点元素内有序 2. 元素的左子树都小于它,右子树都大于它

  2. 平衡 所有的叶结点都在同一层

  3. 节点限制 m阶BTree

    根节点至少有1个元素,2个分支

    其他节点 至少有(m+1)/2个分支, (m-1)/2个元素(左右间隙肯定要比元素数多1)

    所有节点元素数<m, 分支数≤m。 所有叶子节点在同一层上

使命

数据是存储在磁盘上,每次将节点读入内存,就需要一次IO操作,IO操作是比较耗时。树的高度,限制了数据的查找效率。

一次IO读取连续地址的多个字节和读取一个字节几乎没有什么差别。

通过增加节点元素数,降低树的高度 就成为了必然的选择。

一个节点可以有多个元素 每个元素左右间隙指向后续节点。将左右间隙视为左右子树。

B+Tree

定义

从BTree基础上发展而来,

  1. 非叶子结点直接存储索引,>左子树最大值,<=右子树最小值
  2. 叶结点包含全部关键字及指向相应记录的指针,非叶结点只作索引
  3. 所有节点元素数<m(也有地方说是<=m), 分支数≤m
  4. 每一个叶子节点都有指向后续叶子节点的指针

InnoDB B+Tree

对经典B+Tree进行改造,除了记录叶子节点的头部位置,后续叶子节点外, 记录了前驱节点。提升了中序遍历和范围查找效率。

旋转与调整

二叉树就是为了阐述的需要,没有实际应用的意义,不存在调整的问题。

二叉排序树

插入

与当前节点比较, 小于当前节点在左子树进行比较 大于当前节点在右子树进行比较。

最后插入到叶子节点上。

Insert 4 2 3 1

删除

通过比较查找定位到待删除的节点

叶子节点,直接删除
只有左子树或只有右子树 删除后,让子树占据其位置
左右子树都有 需要进行转化 让其中序遍历前驱节点或后继结点占据其位置,转化为删除中序遍历前驱节点或后继结点。转化为前两种情况。

演示一下删除节点50的过程

  1. 节点50左右子树都有,使用中序遍历定位后继节点。将节点65放到节点50的位置
  2. 待删除的节点只有右子树, 将右子树直接挂上

平衡二叉树

插入

通过递归进行节点比较,插入到叶子节点。 然后判定是否出现左右子树高度差>1的情况。

没有出现, 插入结束。否则根据下面四种情况进行调整

类型 调整方式
LL 爷爷节点顺时针旋转(右旋)
RR 爷爷节点逆时针旋转(左旋)
LR 父节点逆时针旋转,爷爷节点顺时针旋转(右旋)
RL 父节点顺时针旋转,爷爷节点逆时针旋转(左旋)

所有的旋转都是绕着直接子孩子进行的旋转。 调整之后, 高度-1. 调整完成。

删除

分为两个过程

  1. 删除 删除方法与二叉搜索树相同
  2. 调整 找到层级最低(靠近叶子节点)失衡的节点C,然后确定类型和调整方式
    找到C层级更深的子树A.
    找到A层级更深的子树B.
    AB对应上面的LL、RR、LR、RL四种情况,然后进行调整。

这里面有一种特殊情况: B不存在(A的左右子树深度一致)

如果是L型(A是左子树),进行顺时针旋转.如果是R型,进行逆时针旋转。

红黑树

插入

红黑树的插入容易违反:根叶黑和不红红的特性。

新插入的节点定义为红色

分下面几种情况进行讨论:

1. 新插入节点是根节点: 直接变黑 调整完成
2. 新插入节点的父节点是黑节点: 不需要调整
3. 新插入节点的父节点是红节点: 违反不红红的特点,
 参照下面的方法进行调整。

2.插入的是红色节点, 父亲是红色节点

如果叔叔是黑色,违反黑路同;

如果叔叔为红色,不能有子节点(红色违反不红红,黑色违反黑路同)

叔叔节点 调整方式
R 叔叔节点R->B, 父亲节点R->B,爷爷节点B->R, 从爷爷开始继续调整(不违反根叶黑、不红红就完成)
不存在(或者为黑色节点) 插入节点、父节点、爷爷节点 根据LL\RR\LR\RL进行旋转调整

变换后,设置新根节点(三个节点中)为黑色,其他2个节点为红色.

来一个插入演示。

Insert 34、23、15、10、13、14、35、36.

删除

红黑树删除容易破坏黑路同的性质。

通过节点比较 定位到要删除的节点

与二叉搜索树一样:如果左右子树都有 转化为中序遍历直接前驱或者直接后继(将节点内容用直接前驱或直接后继的值进行代替), 转化为对叶子节点或者单子树的删除。

叶子节点可能为红或者黑;

单子树只可能为黑色节点下面挂一个红色节点。

待删除节点为红色叶子节点,直接删除

待删除节点有单子树,将红色节点挂到子树上,变成黑色。

待删除节点为黑色叶子节点较为复杂:

兄弟节点颜色 兄弟节点有红孩 调整方式
B 待删除节点变成双黑节点 根据其类型参照下面表格进行旋转变色。
B 兄弟变红, 双黑节点(可以理解为-1黑节点)上移到父节点
R 兄父变色, 然后父节点绕兄弟节点旋转 双黑节点继续调整

双黑节点碰到红色节点 Red->Black 调整结束。

双黑碰到根节点, 直接变成黑节点 调整结束。

双黑节点碰到兄弟节点是null,调整结束。

删除节点为黑色节点,兄弟节点为黑色节点,兄弟至少有一个红孩

表格中的孩子指的是:兄弟的孩子,父节点指的是:当前节点的父节点(当然也是兄弟父节点)

变色和旋转情况如下:

兄弟 兄弟左孩子 兄弟右孩子 类型 变色与旋转
左子树 R - LL 左孩子R->B, 兄弟节点变成父节点颜色, 父节点变黑。 然后进行旋转
右子树 - R RR 右孩子R->B, 兄弟节点变成父节点颜色, 父节点变黑。 然后进行旋转
左子树 B(或者null) R LR 右孩子变成父节点颜色, 父节点变黑。 然后进行旋转
右子树 R - RL 左孩子变成父节点颜色,父节点变黑。 然后进行旋转

删除顺序:

17 15 13 34 25 23 18 27 37 10 9 6


m阶BTree

插入

所有直接的插入都在叶子节点进行(从根节点定位到叶子节点);

1. 只有一个元素作为根节点
2. 从根部进行比较, 跳转到叶子节点后, 进行插入。 
如果节点元素数=m, 需要进行分裂。 m/2位置元素上移, 以该元素作为分界点,将一个节点拆分为两个节点。然后将比较节点(m/2位置元素)移动到父节点。 继续判断父节点是否发生上溢, 继续进行调整。

m = 3

插入序列:

27 14 18 36 70 3 17 20 23 34 45 53 58 84

删除

  1. 定位到要删除的元素,如果发生在非叶子节点: 将中序遍历直接前驱或直接后继进行替换。 修改为删除直接前驱或直接后继节点

删除后,节点元素数>= (m-1)/2,结束.

如果<(m-1)/2,寻找左兄弟节点或者右兄弟节点进行借元素。

寻找左兄弟借元素 ,左兄弟 最大值上位, 父节点里面的父元素移动到节点左侧。

寻找右兄弟借元素 ,右兄弟 最小值上位, 父节点里面的父元素移动到节点右侧。

如果左右兄弟都不够借, 就与左兄弟或右兄弟合并。 与左兄弟合并的时候, 父节点的父元素下移到左兄弟,然后当前节点所有元素合并到左兄弟节点右侧。 此时, 如果父节点发生向下溢出,对父节点继续调整, 否则,调整结束。

m=3 最小节点数 (3-1)/2 == 1 ,不存在向下溢出的情况了, 这里使用m=5.进行演示

84 36 90 58 70 53 34 27 45 21 20 23 17

m 阶B+Tree

B+Tree所有元素都保存在叶子节点

插入都发生在叶子节点,进行分裂时, 分裂点左侧断裂, 向上copy一份中间元素。

左侧指向的索引节点小于当前索引值,右侧>=当前索引值

叶子节点有指向中序遍历后续叶子节点的指针。

插入

m = 5.

插入序列:

27 14 18 36 70 3 17 20 23 34 45 53 58 84 90

删除

删除非索引节点时,直接删除。

发生向下溢出,左右可以借的话, 进行左右借位。借位后,索引修改为借到元素,并将该元素合并过去

如果不够借,进行作用合并,注意索引的调整。 以及可能发生的父节点向下溢出。

删除序列:

53 36 34 20 58 70 20 84 14 27 45 18

参考内容

B站蓝不过海呀数据结构教学视频
旧金山大学数据结构可视化工具

相关推荐
maply11 分钟前
Redis 持久化机制:RDB 和 AOF
数据库·redis·缓存·aof·rdb
m0_748241701 小时前
【Redis入门到精通六】在Spring Boot中集成Redis(含配置和操作演示)
数据库·spring boot·redis
ekskef_sef1 小时前
Spring Boot——日志介绍和配置
java·数据库·spring boot
王中阳Go3 小时前
某讯一面,感觉问Redis的难度不是很大
数据库·redis·缓存·面试
万亿少女的梦1683 小时前
基于PHP的校园兼职系统的设计与开发
开发语言·网络·数据库·爬虫·网络安全·php
老马啸西风3 小时前
数据库高可用方案-06-监控与报警
数据库·oracle
码明4 小时前
SpringBoot整合junit
数据库·spring boot·junit
程序研4 小时前
MySQL 数据操作语言 (DML)
数据库·mysql
maply5 小时前
如何使用 Redis 作为高效缓存
数据库·redis·缓存
dal118网工任子仪5 小时前
47,【5】BUUCTF web lovesql
数据库·sql