B树的分裂与合并操作详解

B树的分裂与合并操作详解

引言

B树是一种自平衡的树数据结构,广泛应用于数据库和文件系统中,以维持有序数据并允许高效的插入、删除和搜索操作。作为一种多路搜索树,B树的每个节点可以有多个子节点和多个键值。B树的关键特性在于其通过分裂和合并操作来保持平衡。本文将详细介绍B树的分裂与合并操作,并提供具体的源码示例。

B树基础知识

在讨论B树的分裂与合并操作之前,先简要回顾一下B树的基本概念和性质。

B树的定义

B树是一种平衡的多路搜索树,满足以下性质:

  1. 每个节点最多有m个子节点(称为m阶B树)。
  2. 除根节点外,每个节点至少有⌈m/2⌉个子节点。
  3. 根节点至少有两个子节点(如果非叶子节点)。
  4. 每个节点包含k-1个键值和k个子节点指针,其中⌈m/2⌉ ≤ k ≤ m
  5. 所有叶子节点都位于同一层。
B树的结构

B树节点的结构如下所示:

复制代码
Node:
    keys: [k1, k2, ..., kn]
    children: [c0, c1, ..., cn]
    n: 当前节点中的键值数量
    leaf: 是否为叶子节点

B树的分裂操作

分裂操作是B树在插入过程中用于保持平衡的关键操作。当一个节点中的键值数量达到最大值m-1时,该节点需要分裂为两个节点,并将中间键提升到父节点中。

分裂操作的步骤
  1. 创建一个新的节点,作为分裂后的一半。
  2. 将中间键及其左侧的键值和子节点保留在原节点中。
  3. 将中间键右侧的键值和子节点移动到新节点中。
  4. 将中间键提升到父节点中。如果父节点也满了,递归执行分裂操作。
分裂操作的示例

假设我们有一个B树节点,包含以下键值:

复制代码
Node:
    keys: [10, 20, 30, 40, 50]
    children: [c0, c1, c2, c3, c4, c5]
    n: 5
    leaf: False

在插入新键值60时,节点已满,需要进行分裂操作:

  1. 创建一个新节点:

    New Node:
    keys: []
    children: []
    n: 0
    leaf: False

  2. 将中间键及其左侧键值保留在原节点中:

    Original Node (after split):
    keys: [10, 20]
    children: [c0, c1, c2]
    n: 2
    leaf: False

  3. 将中间键右侧的键值和子节点移动到新节点中:

    New Node (after split):
    keys: [40, 50, 60]
    children: [c3, c4, c5, c6]
    n: 3
    leaf: False

  4. 将中间键30提升到父节点中:

    Parent Node (after split):
    keys: [30]
    children: [Original Node, New Node]
    n: 1
    leaf: False

B树的合并操作

合并操作是B树在删除过程中用于保持平衡的关键操作。当一个节点中的键值数量低于最小值⌈m/2⌉-1时,该节点需要与其相邻的兄弟节点合并,或者从父节点借一个键值。

合并操作的步骤
  1. 检查节点的左兄弟和右兄弟,选择一个键值数量大于最小值的兄弟节点。
  2. 将父节点中的键值下移到当前节点中。
  3. 将兄弟节点中的键值上移到父节点中。
  4. 如果兄弟节点的键值数量也低于最小值,合并当前节点和兄弟节点,并递归执行合并操作。
合并操作的示例

假设我们有一个B树节点,包含以下键值:

复制代码
Parent Node:
    keys: [20, 40]
    children: [Node1, Node2, Node3]
    n: 2
    leaf: False

删除节点Node2中的键值30后,节点中的键值数量低于最小值,需要进行合并操作:

  1. 检查左兄弟Node1和右兄弟Node3,选择一个键值数量大于最小值的兄弟节点。假设选择右兄弟Node3:

    Node3:
    keys: [50, 60]
    children: [c5, c6, c7]
    n: 2
    leaf: False

  2. 将父节点中的键值40下移到当前节点Node2中:

    Node2 (after borrow):
    keys: [40]
    children: [c3, c4]
    n: 1
    leaf: False

  3. 将右兄弟Node3中的键值50上移到父节点中:

    Parent Node (after borrow):
    keys: [20, 50]
    children: [Node1, Node2, Node3]
    n: 2
    leaf: False

如果右兄弟Node3的键值数量也低于最小值,则需要进行合并操作:

  1. 将当前节点Node2与右兄弟Node3合并:

    Node2 (after merge):
    keys: [40, 50, 60]
    children: [c3, c4, c5, c6, c7]
    n: 3
    leaf: False

  2. 将父节点中的键值50下移到当前节点Node2中,删除右兄弟Node3:

    Parent Node (after merge):
    keys: [20]
    children: [Node1, Node2]
    n: 1
    leaf: False

源码示例

以下是B树的分裂与合并操作的完整源码示例,使用Python语言实现。

python 复制代码
class BTreeNode:
    def __init__(self, t, leaf=False):
        self.t = t  # B树的最小度数
        self.keys = []
        self.children = []
        self.leaf = leaf

class BTree:
    def __init__(self, t):
        self.root = BTreeNode(t, True)
        self.t = t

    def insert(self, k):
        root = self.root
        if len(root.keys) == 2 * self.t - 1:
            s = BTreeNode(self.t, False)
            s.children.append(self.root)
            self.split_child(s, 0)
            self.root = s
            self.insert_non_full(s, k)
        else:
            self.insert_non_full(root, k)

    def insert_non_full(self, x, k):
        i = len(x.keys) - 1
        if x.leaf:
            x.keys.append(None)
            while i >= 0 and k < x.keys[i]:
                x.keys[i + 1] = x.keys[i]
                i -= 1
            x.keys[i + 1] = k
        else:
            while i >= 0 and k < x.keys[i]:
                i -= 1
            i += 1
            if len(x.children[i].keys) == 2 * self.t - 1:
                self.split_child(x, i)
                if k > x.keys[i]:
                    i += 1
            self.insert_non_full(x.children[i], k)

    def split_child(self, x, i):
        t = self.t
        y = x.children[i]
        z = BTreeNode(t, y.leaf)
        x.children.insert(i + 1, z)
        x.keys.insert(i, y.keys[t - 1])

        z.keys = y.keys[t:]
        y.keys = y.keys[:t - 1]

        if not y.leaf:
            z.children = y.children[t:]
            y.children = y.children[:t]

    def delete(self, k):
        self._delete(self.root, k)
        if len(self.root.keys) == 0 and not self.root.leaf:
            self.root = self.root.children[0]

    def _delete(self, x, k):
        t = self.t
        if k in x.keys:
            if x.leaf:
                x.keys.remove(k)
            else:
                idx = x.keys.index(k)
                if len(x.children[idx].keys) >= t:
                    predecessor = self.get_predecessor(x, idx)
                    x.keys[idx] = predecessor
                    self._delete(x.children[idx], predecessor)
                elif len(x.children[idx + 1].keys) >= t:
                    successor = self.get_successor(x, idx)
                    x.keys[idx] = successor


                    self._delete(x.children[idx + 1], successor)
                else:
                    self.merge(x, idx)
                    self._delete(x.children[idx], k)
        else:
            if x.leaf:
                return

            idx = self.find_key(x, k)
            if len(x.children[idx].keys) < t:
                if idx > 0 and len(x.children[idx - 1].keys) >= t:
                    self.borrow_from_prev(x, idx)
                elif idx < len(x.children) - 1 and len(x.children[idx + 1].keys) >= t:
                    self.borrow_from_next(x, idx)
                else:
                    if idx != len(x.children) - 1:
                        self.merge(x, idx)
                    else:
                        self.merge(x, idx - 1)

            self._delete(x.children[idx], k)

    def get_predecessor(self, x, idx):
        current = x.children[idx]
        while not current.leaf:
            current = current.children[-1]
        return current.keys[-1]

    def get_successor(self, x, idx):
        current = x.children[idx + 1]
        while not current.leaf:
            current = current.children[0]
        return current.keys[0]

    def merge(self, x, idx):
        t = self.t
        child = x.children[idx]
        sibling = x.children[idx + 1]

        child.keys.append(x.keys[idx])
        child.keys.extend(sibling.keys)

        if not child.leaf:
            child.children.extend(sibling.children)

        x.keys.pop(idx)
        x.children.pop(idx + 1)

    def borrow_from_prev(self, x, idx):
        child = x.children[idx]
        sibling = x.children[idx - 1]

        child.keys.insert(0, x.keys[idx - 1])
        x.keys[idx - 1] = sibling.keys.pop()

        if not child.leaf:
            child.children.insert(0, sibling.children.pop())

    def borrow_from_next(self, x, idx):
        child = x.children[idx]
        sibling = x.children[idx + 1]

        child.keys.append(x.keys[idx])
        x.keys[idx] = sibling.keys.pop(0)

        if not child.leaf:
            child.children.append(sibling.children.pop(0))

    def find_key(self, x, k):
        idx = 0
        while idx < len(x.keys) and x.keys[idx] < k:
            idx += 1
        return idx

    def traverse(self, x=None, depth=0):
        if x is None:
            x = self.root
        print(" " * depth, x.keys)
        if not x.leaf:
            for child in x.children:
                self.traverse(child, depth + 4)

    def search(self, k, x=None):
        if x is None:
            x = self.root
        i = 0
        while i < len(x.keys) and k > x.keys[i]:
            i += 1
        if i < len(x.keys) and k == x.keys[i]:
            return True
        if x.leaf:
            return False
        return self.search(k, x.children[i])

# 测试B树
btree = BTree(3)

for i in range(10):
    btree.insert(i)

print("Initial tree:")
btree.traverse()

btree.delete(3)
print("\nTree after deleting 3:")
btree.traverse()

btree.delete(6)
print("\nTree after deleting 6:")
btree.traverse()

结论

通过本文的详细介绍,我们理解了B树的分裂与合并操作的原理和实现方式。分裂操作在插入过程中用于保持B树的平衡,而合并操作在删除过程中用于保持B树的平衡。这些操作确保了B树能够高效地执行插入、删除和搜索操作。通过源码示例,我们展示了如何在实际编程中实现这些操作,并测试了它们的正确性。希望本文对读者深入理解B树的工作机制有所帮助,并能够在实际项目中应用B树。

相关推荐
树上有只程序猿16 分钟前
后端思维之高并发处理方案
前端
庸俗今天不摸鱼1 小时前
【万字总结】前端全方位性能优化指南(十)——自适应优化系统、遗传算法调参、Service Worker智能降级方案
前端·性能优化·webassembly
黄毛火烧雪下1 小时前
React Context API 用于在组件树中共享全局状态
前端·javascript·react.js
Apifox1 小时前
如何在 Apifox 中通过 CLI 运行包含云端数据库连接配置的测试场景
前端·后端·程序员
一张假钞1 小时前
Firefox默认在新标签页打开收藏栏链接
前端·firefox
高达可以过山车不行1 小时前
Firefox账号同步书签不一致(火狐浏览器书签同步不一致)
前端·firefox
m0_593758101 小时前
firefox 136.0.4版本离线安装MarkDown插件
前端·firefox
掘金一周1 小时前
金石焕新程 >> 瓜分万元现金大奖征文活动即将回归 | 掘金一周 4.3
前端·人工智能·后端
三翼鸟数字化技术团队2 小时前
Vue自定义指令最佳实践教程
前端·vue.js
Jasmin Tin Wei2 小时前
蓝桥杯 web 学海无涯(axios、ecahrts)版本二
前端·蓝桥杯