B树与B+树:数据库索引背后的秘密

B-tree(B树)和B+tree(B+树)是两种高效的多叉树数据结构,专为磁盘存储系统优化设计,广泛应用于数据库和文件系统的索引。以下是两者的核心特点及区别:


⚙️ 一、B-tree(B树)

  1. 结构特性

    • 多路平衡 :每个节点可包含多个子节点(通常称为阶数 m ),非叶子节点存储 键值(Key)关联数据(Data)
    • 平衡规则
      • 根节点至少有 2 个子节点(除非为叶子节点);
      • 非根节点至少有 ⌈m/2⌉ 个子节点;
      • 所有叶子节点位于同一层。
  2. 数据存储

    • 键值+数据共存:非叶子节点既存储索引键,也存储实际数据记录。
    • 搜索灵活性:搜索可能在非叶子节点终止(若命中键值)。
  3. 适用场景

    • 实时查询系统:如 MongoDB 的默认索引,适合单点查询。

🚀 二、B+tree(B+树)

  1. 结构优化

    • 数据分离 :非叶子节点 仅存储键值 (不存实际数据),所有数据记录存放在 叶子节点
    • 叶子节点链表:叶子节点通过指针串联为有序链表,支持高效范围查询。
  2. 性能优势

    • 更高扇出:非叶子节点仅存键值,可容纳更多子节点,降低树高,减少 I/O 次数。
    • 顺序访问优化 :范围查询(如 WHERE id BETWEEN 10 AND 100)直接遍历叶子链表,无需回溯树。
  3. 适用场景

    • 数据库索引:如 MySQL InnoDB 引擎,尤其适合范围扫描和排序操作。

🔍 三、核心区别总结

特性 B-tree B+tree
非叶子节点数据 存储键值+数据 仅存储键值(无数据)
叶子节点结构 独立无链接 通过指针形成有序链表
查询终止位置 可能在任何非叶子节点命中 必须到达叶子节点
范围查询效率 低效(需回溯树) 高效(直接遍历叶子链表)

💡 四、典型应用

  • B-tree:文件系统(NTFS/Ext4)、MongoDB 索引。
  • B+tree:关系型数据库(MySQL、Oracle)、大型数据仓库索引。

两种结构均通过 多路平衡动态调整节点(分裂/合并)保持低树高,显著减少磁盘 I/O。B+tree 因数据分离和链表设计,在大数据量下综合性能更优,成为数据库索引的主流选择。

相关推荐
咖丨喱16 分钟前
【Action帧简要分析】
服务器·数据库·asp.net
没饭吃!17 分钟前
NHibernate案例
数据库·hibernate
泷羽Sec-静安39 分钟前
OSCP官方靶场-Solstice WP
服务器·网络·数据库
IvanCodes1 小时前
Oracle 视图
大数据·数据库·sql·oracle
<但凡.1 小时前
数据结构与算法之美:广义表
数据结构·c++·算法
德育处主任Pro1 小时前
「py数据分析」04如何将 Python 爬取的数据保存为 CSV 文件
数据库·python·数据分析
许白掰2 小时前
Linux入门篇学习——Linux 编写第一个自己的命令
linux·运维·数据库·嵌入式硬件·学习
打不了嗝 ᥬ᭄2 小时前
文件系统----底层架构
linux·运维·数据库
偷偷的卷2 小时前
【算法笔记 day three】滑动窗口(其他类型)
数据结构·笔记·python·学习·算法·leetcode
亲爱的非洲野猪3 小时前
Oracle与MySQL详细对比
数据库·mysql·oracle