B树与B+树:数据库索引背后的秘密

B-tree(B树)和B+tree(B+树)是两种高效的多叉树数据结构,专为磁盘存储系统优化设计,广泛应用于数据库和文件系统的索引。以下是两者的核心特点及区别:


⚙️ 一、B-tree(B树)

  1. 结构特性

    • 多路平衡 :每个节点可包含多个子节点(通常称为阶数 m ),非叶子节点存储 键值(Key)关联数据(Data)
    • 平衡规则
      • 根节点至少有 2 个子节点(除非为叶子节点);
      • 非根节点至少有 ⌈m/2⌉ 个子节点;
      • 所有叶子节点位于同一层。
  2. 数据存储

    • 键值+数据共存:非叶子节点既存储索引键,也存储实际数据记录。
    • 搜索灵活性:搜索可能在非叶子节点终止(若命中键值)。
  3. 适用场景

    • 实时查询系统:如 MongoDB 的默认索引,适合单点查询。

🚀 二、B+tree(B+树)

  1. 结构优化

    • 数据分离 :非叶子节点 仅存储键值 (不存实际数据),所有数据记录存放在 叶子节点
    • 叶子节点链表:叶子节点通过指针串联为有序链表,支持高效范围查询。
  2. 性能优势

    • 更高扇出:非叶子节点仅存键值,可容纳更多子节点,降低树高,减少 I/O 次数。
    • 顺序访问优化 :范围查询(如 WHERE id BETWEEN 10 AND 100)直接遍历叶子链表,无需回溯树。
  3. 适用场景

    • 数据库索引:如 MySQL InnoDB 引擎,尤其适合范围扫描和排序操作。

🔍 三、核心区别总结

特性 B-tree B+tree
非叶子节点数据 存储键值+数据 仅存储键值(无数据)
叶子节点结构 独立无链接 通过指针形成有序链表
查询终止位置 可能在任何非叶子节点命中 必须到达叶子节点
范围查询效率 低效(需回溯树) 高效(直接遍历叶子链表)

💡 四、典型应用

  • B-tree:文件系统(NTFS/Ext4)、MongoDB 索引。
  • B+tree:关系型数据库(MySQL、Oracle)、大型数据仓库索引。

两种结构均通过 多路平衡动态调整节点(分裂/合并)保持低树高,显著减少磁盘 I/O。B+tree 因数据分离和链表设计,在大数据量下综合性能更优,成为数据库索引的主流选择。

相关推荐
im_AMBER1 天前
Leetcode 74 K 和数对的最大数目
数据结构·笔记·学习·算法·leetcode
DBA小马哥1 天前
Oracle迁移实战:如何轻松跨越异构数据库的学习与技术壁垒
数据库·学习·oracle·信创·国产化平替
暮乘白帝过重山1 天前
ArkTS ForEach 参数解析:组件与键值生成器
开发语言·数据库
长安er1 天前
LeetCode 206/92/25 链表翻转问题-“盒子-标签-纸条模型”
java·数据结构·算法·leetcode·链表·链表翻转
菜鸟plus+1 天前
N+1查询
java·服务器·数据库
子夜江寒1 天前
MySQL 表创建与数据导入导出
数据库·mysql
菜鸟小九1 天前
redis基础(安装配置redis)
数据库·redis·缓存
lxh01131 天前
最长递增子序列
前端·数据结构·算法
保定公民1 天前
达梦数据库使用cp备份集恢复报错分析与解决
数据库
菜鸟233号1 天前
力扣513 找树左下角的值 java实现
java·数据结构·算法·leetcode