红黑树、B树、B+树


文章目录


前言

通过问答的方式来了解一下树的演变。


一、抛砖

java 复制代码
问:mysql 存储索引用的什么数据结构
答:B+树

问:B+树的查询复杂度是多少?
答:和树的高度有关,一般是O(logₘN),M为树的阶数,即每个节点包含的子节点数

问:hash的查询复杂度呢?
答:O(1)

问:那为什么不用hash,而用B+树呢
答:请看。。。

二、引玉

java 复制代码
问:关于树都有哪些知识点呢?
答:前中后序遍历、二叉树、平衡二叉树、B树、B+树、红黑树等等。

问:二叉树的排序特点知道吗
答:左节点比根节点小,右节点比根节点大;且左右子树都是二叉排序树。

问:但是极端情况下,会退化成链表(比如节点是倒序插入)
答:了解,所以要用平衡树,插入时调整这棵树,尽可能的保持节点均匀分布。

问:没错,红黑树其实也是平衡树的一种,它的各种复杂规则都是为了保持平衡。但是为什么保持平衡呢?
答:因为树的查询性能取决于树的高度,保持平衡是为了降低树的高度。

问:没错,Java中用一个数据结构就是采用的红黑树,你知道吗
答:TreeSet、TreeMap、以及HashMap(数组长度大于64且链表长度大于8)

问:B树了解多少呢?
答:
	1、多路平衡查找树,所有叶子节点位于同一层(深度相同),且通过插入、删除时的 "分裂""合并" 操作维持平衡性,确保查询效率稳定在 O (logₘn)(m 为阶数)。
	2、每个节点可以包含多个关键字和多个子节点,且子节点数受阶数(m)限制

问:那为什么要设计成多路呢?
答:是为了降低树的高度,提高查询效率

问:那是否可以设计成无限路?
答:可以吧,但是会退化成有序数组

问:会有问题,你想一下B树的使用场景呢?
答:一般用在稳健系统的索引上。

问:那么为什么文件系统不用有序数组或者红黑树呢?
答:文件系统和数据库索引都是在硬盘上的,如果数据量大的话不一定能一次性加载到内存中。

问:没毛病,那一棵树无法完全加载的话,你该怎么查找呢
答:可以一个节点一个节点的查找,层级递进,这时候多路的好处就体现出来了。

问:没错,如果在内存中,红黑树比B树效率更好,但是涉及到磁盘,B树就更好了。下面你能讲讲B+树吗?
答:B+树在B树的基础上做了改造,数据都存在叶子结点,且叶子结点之间用指针链接成链表。

问:那为什么要这么设计呢?
1、这种设计让非叶子节点可以容纳更多关键字(因为不需要预留空间存储数据),从而降低树的高度,减少 IO 次数,提升查询效率
2、当数据更新时,只需修改叶子节点,无需同步非叶子节点,减少了一致性维护的成本
3、叶子节点用指针链接成链表:高效支持范围查询
4、适配外存的 "块读取" 特性,外存的IO操作以 "块" 为单位(如4KB/块),一次 IO 可读取整个叶子节点的数据。

相关推荐
啊阿狸不会拉杆42 分钟前
《算法导论》第 24 章 - 单源最短路径
开发语言·数据结构·c++·算法·php
23遇见43 分钟前
顺序表插入删除
数据结构
热爱生活的猴子1 小时前
算法148. 排序链表
数据结构·算法·链表
浩浩测试一下2 小时前
02高级语言逻辑结构到汇编语言之逻辑结构转换 if (...) {...} else {...} 结构
汇编·数据结构·数据库·redis·安全·网络安全·缓存
暮乘白帝过重山2 小时前
负载因子(Load Factor) :哈希表(Hash Table)中的一个关键性能指标
开发语言·数据结构·哈希算法·散列表·负载因子·暮乘白帝过重山
Python智慧行囊3 小时前
排序算法总结
数据结构·算法
zyd09154 小时前
代码随想录Day50:图论(图论理论、深度搜索理论、所有可达路径、广度搜索理论)
java·数据结构·算法·leetcode·图论
码达拉15 小时前
顺序表的总结及模拟实现
数据结构·c++
Boop_wu16 小时前
[ 数据结构 ] 时间和空间复杂度
数据结构
紫洋葱hh17 小时前
【数据结构】二叉搜索树
数据结构