红黑树、B树、B+树


文章目录


前言

通过问答的方式来了解一下树的演变。


一、抛砖

java 复制代码
问:mysql 存储索引用的什么数据结构
答:B+树

问:B+树的查询复杂度是多少?
答:和树的高度有关,一般是O(logₘN),M为树的阶数,即每个节点包含的子节点数

问:hash的查询复杂度呢?
答:O(1)

问:那为什么不用hash,而用B+树呢
答:请看。。。

二、引玉

java 复制代码
问:关于树都有哪些知识点呢?
答:前中后序遍历、二叉树、平衡二叉树、B树、B+树、红黑树等等。

问:二叉树的排序特点知道吗
答:左节点比根节点小,右节点比根节点大;且左右子树都是二叉排序树。

问:但是极端情况下,会退化成链表(比如节点是倒序插入)
答:了解,所以要用平衡树,插入时调整这棵树,尽可能的保持节点均匀分布。

问:没错,红黑树其实也是平衡树的一种,它的各种复杂规则都是为了保持平衡。但是为什么保持平衡呢?
答:因为树的查询性能取决于树的高度,保持平衡是为了降低树的高度。

问:没错,Java中用一个数据结构就是采用的红黑树,你知道吗
答:TreeSet、TreeMap、以及HashMap(数组长度大于64且链表长度大于8)

问:B树了解多少呢?
答:
	1、多路平衡查找树,所有叶子节点位于同一层(深度相同),且通过插入、删除时的 "分裂""合并" 操作维持平衡性,确保查询效率稳定在 O (logₘn)(m 为阶数)。
	2、每个节点可以包含多个关键字和多个子节点,且子节点数受阶数(m)限制

问:那为什么要设计成多路呢?
答:是为了降低树的高度,提高查询效率

问:那是否可以设计成无限路?
答:可以吧,但是会退化成有序数组

问:会有问题,你想一下B树的使用场景呢?
答:一般用在稳健系统的索引上。

问:那么为什么文件系统不用有序数组或者红黑树呢?
答:文件系统和数据库索引都是在硬盘上的,如果数据量大的话不一定能一次性加载到内存中。

问:没毛病,那一棵树无法完全加载的话,你该怎么查找呢
答:可以一个节点一个节点的查找,层级递进,这时候多路的好处就体现出来了。

问:没错,如果在内存中,红黑树比B树效率更好,但是涉及到磁盘,B树就更好了。下面你能讲讲B+树吗?
答:B+树在B树的基础上做了改造,数据都存在叶子结点,且叶子结点之间用指针链接成链表。

问:那为什么要这么设计呢?
1、这种设计让非叶子节点可以容纳更多关键字(因为不需要预留空间存储数据),从而降低树的高度,减少 IO 次数,提升查询效率
2、当数据更新时,只需修改叶子节点,无需同步非叶子节点,减少了一致性维护的成本
3、叶子节点用指针链接成链表:高效支持范围查询
4、适配外存的 "块读取" 特性,外存的IO操作以 "块" 为单位(如4KB/块),一次 IO 可读取整个叶子节点的数据。

相关推荐
bkspiderx13 小时前
C++经典的数据结构与算法之经典算法思想:贪心算法(Greedy)
数据结构·c++·算法·贪心算法
中华小当家呐14 小时前
算法之常见八大排序
数据结构·算法·排序算法
tju新生代魔迷15 小时前
数据结构:双向链表
数据结构·链表
songx_9917 小时前
leetcode9(跳跃游戏)
数据结构·算法·游戏
学c语言的枫子17 小时前
数据结构——双向链表
c语言·数据结构·链表
Boop_wu18 小时前
[数据结构] 栈 · Stack
数据结构
kk”18 小时前
C语言快速排序
数据结构·算法·排序算法
3壹18 小时前
数据结构精讲:栈与队列实战指南
c语言·开发语言·数据结构·c++·算法
papership19 小时前
【入门级-算法-6、排序算法:选择排序】
数据结构·算法·排序算法
YS_Geo1 天前
Redis 深度解析:数据结构、持久化与集群
数据结构·数据库·redis