25考研数据结构复习·7.4B树和B+树7.5散列（Hash）表

Annabelle.022024-08-05 10:16

目录

m阶B树的核心特性

非终端结点关键字

终端结点关键字

散列（Hash）表

散列函数的构造

[👩‍💻 除留余数法](#👩‍💻 除留余数法)

直接定址法

数字分析法

平方取中法

处理冲突的方法------拉链法

处理冲突的方法------开放定址法

元素的操作

[👩‍💻 删除](#👩‍💻 删除)

四种常用的"探测序列"

四种增量序列的"覆盖率

B树和B+树

B树

含n个关键字的m叉B树

m阶B树的核心特性

👩‍💻 （尽可能"满"）根节点的子树∈ $2,m$ ，关键字数∈ $1,m-1$ 。其他结点的子树数∈ $**⌈m/2⌉** ,m$ ；关键字∈ $**⌈m/2⌉-1,m-1**$
👩‍💻（尽可能"平衡"）对任一结点，其所有子树高度都相同
关键字的值：子树0<关键字1<子树1<关键字2<子树2<......（类比二叉查找树左<中<右）

B树的插入

通过"查找"确定插入位置（一定是在终端结点）
若插入后结点关键字个数未超过上限，则无需做其他处理
若插入后关键字个数超过上限，则需要将当前结点的中间元素放到父节点中，当前节点分裂为两个部分：该操作会导致父节点关键字个数+！，若父节点关键字个数也超过了上限，则需要再向上分裂；根节点的分裂会导致B树高度+1

B树的删除

非终端结点关键字

用其直接前驱或直接后继替代其位置，转化为对"终端结点"的删除
直接前驱：当前关键字左边指针所指子树中"最右下"的元素
直接后继：当前关键字右边指针所指子树中"最坐下"的元素

终端结点关键字

删除后结点关键字个数未低于下限，无需任何处理

低于下限

右兄弟够借，则用当前结点的后继、后继的后继依次顶替空缺
左兄弟够借，则用当前结点的前驱，前驱的前驱依次顶替空缺
左（右）兄弟不够借，则需要与父节点内的关键字、左（右）兄弟进行合并。合并后导致父节点关键字数量-1，可能需要继续合并。

B+树

	m阶B树	m阶B+树
类比	二叉查找树的进化 → m叉查找树	分块查找的进化 → 多级分块查找
关键字与分叉	n个关键字对应n+1个分叉（子树）	n个关键字对应n个分叉
结点包含的信息	所有结点中都包含记录的信息	只有最下层叶子节点才包含记录的信息（可使树更矮）
查找方式	不支持顺序查找。查找成功时，可能停在任何一层结点，查找速度"不稳定"	支持顺序查找。查找成功或失败都会到达最下一层结点，查找速度"稳定"
相同点	除根节点外，最少⌈m/2⌉个分叉（确保结点不能太"空"）任何一个结点的子树都要一样高（确保"绝对平衡"）

散列（Hash）表

基本概念

散列表：又称哈希表，可以根据数据元素的关键字计算出它在散列表中的存储地址
散列函数：建立了"关键字"→"存储地址"的映射关系
同义词：若不同的关键字通过散列函数映射到同一个存储地址，则称它们为"同义词"
冲突（碰撞）：在散列表中插入一个数据元素时，若插入的位置已经存储了其他元素，则这种情况视为"冲突（碰撞）"

散列函数的构造

👩‍💻 除留余数法

散列地址：H(key) = key % p 其中，p通常是不大于散列表表长的最大质数
适用场景：较为通用，只要关键字是整数即可

直接定址法

散列地址：H(key) = a * key + b 其中，a和b是常数
适用场景：关键字分布基本连续

数字分析法

选取数码分布较为均匀的若干位作为散列地址
适用场景：关键字集合已知，且关键字的某几个数码位分布均匀

平方取中法

计算关键字的平方，取中间几位作为散列地址
适用场景：关键字的每位取值都不够均匀

处理冲突的方法------拉链法

拉链法（又称链接法、链地址法）：把所有"同义词"存储在一个链表中

插入操作

根据散列函数计算新元素的散列地址
将新元素插入散列地址对应的链表（可用头插法或尾插法）

查找操作

根据散列函数计算新元素的散列地址
顺序查找散列列表对应的链表，直到查找成功或查找失败
在分析查找长度时，通常只统计"关键字的对比次数"，而链表"空指针的对比次数"不计入查找长度

删除操作

根据散列函数计算新元素的散列地址
顺序查找散列地址对应的链表，若查找成功，将目标元素从链表中删除

处理冲突的方法------开放定址法

基本原理

当初始散列地址发生冲突时，根据"探测序列"探测下一个地址Hi=(H(key)+di)%m

元素的操作

插入

根据散列函数算出初始散列地址，若发生冲突，就"探测"下一个地址，直到找到一个空闲地址，即可插入元素

查找

根据散列函数算出初始散列地址，对比关键字，若关键字不匹配，就"探测"下一个地址，直到关键字匹配（成功）或探测到一个空位置（失败）

👩‍💻 删除

先按照"查找操作"的规则找到目标元素，若查找成功，就把目标元素"逻辑删除"。注意不能"物理删除"。

四种常用的"探测序列"

👩‍💻 线性探测法**：**
平方探测法：,.其中k≤m/2
双散列法：.其中hash_2(key)是另一散列函数
伪随机序列法：是一个伪随机序列，如

四种增量序列的"覆盖率"

线性探测率：经过m-1次冲突，一定能探测到散列表的所有单元。
平方探测法：一般来说，探测序列至少能覆盖到散列表的一半单元。若能保证表长m是一个可以表示成4x+3的素数，则可以探测到散列表的所有单元
双散列法：若能保证hash2(key)的值和表长m互质，则经过m-1次冲突，一定能探测到散列表的所有单元
伪随机序列法：只要伪随机序列设计和理论，就能探测到全部单元

上一篇：YOLOv8添加注意力模块并测试和训练

下一篇：一直让 PHP 程序员懵逼的同步阻塞异步非阻塞，终于搞明白了

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新