Mysql--基础知识点--112--聚簇索引和非聚簇索引

你问的应该是 B 树B+ 树 的区别("B数"是笔误)。这两种都是平衡多路搜索树,广泛用于数据库和文件系统,但结构上有几个关键不同。

核心区别一览

特性 B 树 B+ 树
数据存储位置 所有节点(内部节点 + 叶子节点)都存储数据 只有叶子节点存储数据,内部节点只存键(及指针)
叶子节点结构 独立,无相互链接 所有叶子节点通过双向链表串联
查询稳定性 不同数据查询的 I/O 次数可能不同(数据可能在根节点) 每次查询都必须走到叶子节点,I/O 次数稳定(等于树高)
范围查询 效率较低,需要反复回溯父节点 效率极高,从叶子链表直接遍历
空间利用率 每个节点都存数据,节点容纳的键数量少 内部节点不存数据,可容纳更多键 → 树更矮 → I/O 更少

详细解释

1. 数据分布不同

  • B 树:每个节点既存放索引键,也存放对应的数据行地址(或完整数据)。查找时,如果命中某个内部节点,直接返回数据,不一定到叶子层。
  • B+ 树 :内部节点只存放键和指向子节点的指针,数据全在叶子节点。所以查找任何数据都必须走到叶子节点。

2. 叶子节点链表

  • B 树:叶子节点之间没有指针连接。
  • B+ 树 :所有叶子节点按键大小顺序,用双向链表相连。这使得范围查询 (如 WHERE id BETWEEN 10 AND 100)极其高效:找到起始叶子后,沿着链表向后扫描即可,无需反复回溯树结构。

3. 查询性能特征

  • B 树 :最好情况(命中根节点)只需 1 次 I/O,最坏情况需要树高次 I/O。因此查询时间不稳定
  • B+ 树 :任何查询都需要树高次 I/O(比如 3 次),时间稳定。对于数据库而言,稳定意味着可预测性高,对事务处理更友好。

4. 节点存储能力

  • 假设磁盘页大小为 16KB,键占 8 字节,指针占 6 字节,数据行占 200 字节。
  • B 树:每个节点因为存数据,能放的键数量少 → 树更高 → 查找 I/O 次数多。
  • B+ 树:内部节点只存键和指针,可放几千个键 → 树通常只有 2-4 层 → I/O 次数少且稳定。

为什么 MySQL InnoDB 使用 B+ 树?

  • 更适合范围查询:叶子链表支持高效区间扫描和分页。
  • 更高的扇出(fanout):内部节点不存数据,可大幅降低树高,减少磁盘 I/O。
  • 缓存友好:内部节点可以全部缓存在内存中,查询只需要很少的磁盘读取。
  • 查询性能稳定:避免"好运气"和"坏运气"的巨大差异。

一个直观的例子

假设有一棵高度为 3 的树:

  • B 树:可能根节点就存了数据,查它只要 1 次读盘;但也可能数据在叶子,需要 3 次。
  • B+ 树:任何数据都在第 3 层,永远需要 3 次读盘(根节点常驻内存的话实际 2 次)。虽然看起来"最坏"和 B 树一样,但没有波动,并且范围扫描时 B+ 树完胜。

总结:B+ 树 = B 树 + 叶子链表 + 内部节点不存数据。数据库索引几乎都选 B+ 树,正是因为它对磁盘 I/O 和范围查询做了极致优化。

相关推荐
东风破13726 分钟前
达梦数据库实战:备份恢复与数据迁移全攻略(实例初始化、服务注册、路径迁移)
数据库·chrome
SelectDB技术团队41 分钟前
2026 SelectDB AI 产品发布会:Agent Native 数据基础设施能力全景发布
数据库·人工智能·agent·apache doris·selectdb
爱吃羊的老虎1 小时前
【数据库】模块一:数据库基础与关系代数
数据库
dishugj1 小时前
iSCSI + Multipath + ASM:Oracle RAC 共享存储技术链详解
数据库·oracle
yoothey2 小时前
MySQL事务机制解析 - 面试高分知识点
数据库·mysql·面试
Lkstar2 小时前
万字长文Query改写与多路召回实战|从HyDE到RRF融合,召回率提升22%的完整方案
数据库·人工智能·llm
IT新视界3 小时前
星环科技ArgoDB:基于一体化架构构建数据全生命周期安全底座
数据库·科技·安全·架构
峥无3 小时前
MySQL DML 操作(CRUD)总结
数据库·mysql
数据库小学妹3 小时前
SQL Server数据库同步工具怎么选?6款方案对比+信创迁移避坑清单
数据库·经验分享·sqlserver·dba
不剪发的Tony老师3 小时前
国产数据库之GaussDB:固若金汤
数据库·gaussdb