B + 树索引的工作原理？

B+树索引的基本结构

B+树是一种多路平衡搜索树，专为磁盘或其他直接存取辅助设备设计。所有关键字都出现在叶子节点中，非叶子节点仅作为索引使用。叶子节点通过指针链接形成有序链表，便于范围查询。

节点分裂与合并机制

每个节点包含最多m个关键字和m+1个指针。当插入导致节点关键字超过m时，会发生分裂：中间关键字上升到父节点，剩余关键字分成两个新节点。删除操作可能导致节点关键字过少，此时会触发合并或重新分配操作。

查询过程分析

对于等值查询，从根节点开始逐层比较关键字，直到找到目标叶子节点。范围查询时，先定位范围下限所在的叶子节点，然后通过链表指针顺序遍历后续节点，直到超过范围上限。

与B树的区别特征

B+树非叶子节点不存储数据记录指针，仅存储索引信息。所有数据记录都存储在叶子节点中，且叶子节点形成有序链表。这种结构使得B+树更适合范围查询，且能保持更稳定的查询性能。

磁盘I/O优化原理

B+树通过增加节点分支因子（即每个节点的子节点数）来降低树高。典型设计中，一个节点大小与磁盘块大小匹配，使得每次磁盘读取能获取更多索引信息。三层B+树即可索引数百万条记录。

插入删除操作示例

插入新记录时，先查找合适的叶子节点。若该节点未满则直接插入；若已满则分裂节点并调整父节点索引。删除记录时，若导致节点关键字数低于阈值，可能需从兄弟节点借关键字或合并节点。

伪代码示例：

python 复制代码

def b_plus_tree_insert(root, key, value):
    leaf = find_leaf(root, key)
    if leaf.has_space():
        leaf.insert(key, value)
    else:
        new_leaf = leaf.split()
        insert_into_parent(leaf, new_leaf.first_key(), new_leaf)

实际应用场景

数据库系统中常用B+树实现索引，如MySQL的InnoDB引擎。文件系统也使用类似结构管理元数据。其优势在于：稳定的查询时间复杂度（O(log n)）、高效的范围查询、良好的磁盘读写性能。