数据结构(7):查找

Oasis of the World2024-08-03 14:12

1 查找的基本概念

概念

常见操作

评价指标

平均查找长度！！！！

✖前面表示长度后边表示个数!

处于的是总共的紫色的个数

总结

2 顺序查找、折半查找、分块查找

2.1 顺序查找

适用于线性表！

正常代码

哨兵！代码

查找效率分析

成功的话是求的平均值

失败的话就是查找到0都没有对应相等的，所以就是查找了n+1次！

顺序查找的优化（对有序表）

有序表：查找表中的元素有序存放(递增/递减！)

写出查找判定树写出失败的那些框！

注意最后的两个n

有查找判别数分析ASL

顺序查找的优化2(被查概率不相等)

把概率大的放前面！

总结

时间复杂度都是o(n)

2.2 折半查找

实现思想

适用于有序的顺序表！就是二分法！

mid的值算出来如果是小数就向下取整！

查找成功

在右边的时候更新时：low = mid+1

在左边的时候 high = mid-1

low = mid+1

这个时候high = low，如果所指和目标相等则查找结束！

查找失败

全面的都一样到到low=high时，

mid = low = hight 此时mid的小于目标值一次low = mid+1

这是会出现low>height的矛盾所以！算法结束！

代码实现

这个判断逻辑是按照元素是升序排列的！降序类似但不一样哦注意辨别！

查找效率分析【具体计算】

关键词对比！--擦护照效率

折半查找的判定树【时间复杂度】

用到的结论

左子树的结点个数一定小于等于右！！！

右子树比左子树只可能多一个结点！！！！！！

所以这种就不可能存在

折半查找的判定树一定是平衡二叉树！

树高公式和完全二叉树的计算方法一样

向上取整！

失败结点的个数等于总结点+1

时间复杂度

总结

思考：

大多时候是高的但不是全部

2.3 分块查找

算法思想

low和high表示这个块的起始位置和结束位置！

例子

查找成功

查找失败

算法过程

在分块内顺序查找！

找在那个块是也可折半查找

eg1 :当目标在索引表关键字里时

eg2:当目标不在索引表关键字里时

最后会出现low>hight的结果折半查找结束，这是目标可能在 low所指的分块内！

low指向的比目标更大！！！！

上一步时low=high；这是如果所指关键字a<目标b: low = mid+1 这是low所指的关键字就比目标大了，所以在这个分块 // 如果所指关键字a>目标b：hight = mid-1 这时hight所指的块都比目标小所以目标只能在low分块

综上所述，一定在low分块里！！！

eg3:找不到分块low

特例的查找效率分析(ASL)

1、顺序查找

7有两次：对比10 对比7 然后结束yigongliangc

13有三次：对比10 对比20 然后进去对比13 结束一共3次！

2、折半查找

27：一定不是2！！！远远不够！！！很庞大的工程

查找失败更复杂！！！

通项的查找效率

顺序查找

求ASL最小的时候！！！

什么时候ASL最小呢？当分块有个，每个分块有个，可以得出此时的ASL等于

当

这与顺序查找的ASL相比已经好特别特别多了，

直接所有元素顺序查找当n = 10000时平均ASL是5000！

折半查找【有个小印象就可以了！】

总结

思考

插入一个元素8会导致所有的元素向后移动！代价太大所以可以用链式存储！

数据结构应该怎末设计？因该采取什么样的查找算法都是需要大家按照现实遇到的需求做下的决定！！！

3 树形查找

3.1 二叉排序树（BST）【缩写注意！】

定义

中序遍历就是左中右！可以写出递增的序列！

查找代码

普通代码

成功：

失败：

T = T->rchild会等于NULL 这是这个循环就结束了返回NULL

加入递归代码

两个代码的空间复杂度

递归要使用函数调用栈需要的大小是树的高度！

插入

当T为NULL时说明找到了应该插入的位置！

一定注意这个数BSTree是引用类型的！！！！

构造二叉排序树

删除

1、删除叶子结点

2、只有一个左子树或右子树

删完连起来就行

3、既有左子树又有右子树

！！！详情见数据结构(5):树和二叉树-CSDN博客中的6.2

50 的直接后驱是60 这个60肯定是右子树总最小的结点而且一定没有左子树（因为一旦有左子树说明还有一个比它小！）

让60代替50 然后删除60 这个结点因为原60 是在最左下的所以没有左子树，回到第二种情况了，删了之后连起来就行！

当有直接前驱也是一样的：直接前驱说明是左子树中最大的，一定没有右子树，替代50后还满足二叉排序树的原则，删原来的30 后后面右子树的话直接连上即可没有就算了

查找效率分析

查找长度

对比：就意味着一次循环或者递归

查找成功

对比的次数不会超过二叉树的高度！

所以

的效率是最高的

查找失败

失败的时候空时不要对比的，只有和关键字比较的时候加查找长度！！！！！

总结

3.2 平衡二叉树(AVL!)

上面的排序树的时候知道越胖胖的效率越高而平衡二叉树就是胖胖的！！！

平衡二叉树(AVL定义)

左右子树高度差不超过1！！

当保证是平衡二叉树是，二叉排序树的查找效率可以达到

插入

关键是如何插入一个结点还能保持平衡！

调整的对象是"最小不平衡子树！"

如何调整最小不平衡子树

1、LL

三个子树高度一定全是H

**这样才能保证LL插入后A变成最小不平衡子树！**why?可以假设：

AR是H+1时 LL插入 A 的左右子树只差1还是平衡；AR是H-1 A就不平衡了直接

当BR=H+1时 A 直接就是不平衡的；当BR=H-1时，LL插入后 BL和BR相差2 则里插入点最近的不平衡点B就变成了最小不平衡子树！！不是A了

调整目标

解决方法：右旋

2、RR

解决方法：左旋

12 代码

gf意思就是与前面连起来的那些树！

顺序：爹的左/后孩子的左/右孩子变爹！

3、LR

解决办法：左旋+右旋

4、RL

方法：右旋+左旋

汇总

练习：

1、

2、

3、

查找效率

递推公式！！！

得到最少的结点并且左右节点高度相差1

平均查找长度（ASL）

插入总结

删除

步骤

二叉排序树的删除满足了条件1！！！

例题

eg1 不需要调整

eg2

检查上面的结点是否因为这个而产生了不平衡的现象！！！

eg3

eg4 不平衡向上传导

eg5 删除时按照二叉排序

直接前驱和后继

前驱：从左孩子的右边一路向下！

删除之后：

删除总结：

3.3 红黑树(RBT)【no代码】（搜搜23年咋考的）

为什莫出现？

都在使用红黑树！！！！

所以重点就是定义、性质、手算插入！

定义

红黑树是二叉排序树！

5个要求

增加父节点指针！

顺口溜：

左<根<右

根叶黑：根节点和叶子结点是黑色的！

不红红：不存在相邻的红色结点！

黑路同：（一条路走到黑）从同一个顶点到任何一个叶子结点的过程中路过的黑结点的个数相同！

例子：

叶子节点是失败的那种节点

出题思路：

黑高

根节点黑高是2

与"黑高"相关的推论：

满树--黑路通；所以最小的情况就是全黑的满二叉树！

就可以证明下方的性质2：

性质!!!!!!!!!! $一定注意这个！$

2、

n个关键字！

红黑树的查找效率不会超过红黑树的高度所以反映了

时间复杂度

查找

插入！！

AVL（平衡二叉树的插入！）

找到位置---最小平衡子树---旋转--使其重新平衡

策略：

父亲的兄弟就是叔叔！

旋转是一样的！

插入的非根结点染红是为了满足黑路同这个特性！

动谁染谁往相反的方向染！

会破坏的只有"不红红"！！！

。。。。。。

。。。。

最后的结果：

插入总结：

红黑树对于左右子树的要求没有那麽严格！

删除

我真服了啊啊啊啊啊啊啊！没事哒没事哒没事哒！

时间复杂度！O(log_2(n))

3.4 B树

人如其名......

查找例子1【成功】

"走左边！"的感觉

当叉数比较多的时候！

查找例子2【失败】

如何保证查找效率

策略：

根节点是例外！！！！

策略2：

B树定义【满足两个策略】

高度都相同就是绝对的平衡。。。。

失败的结点还是叫叶子节点！

核心性质！！！！【选择】：

B树高度：

排除叶子节点！

最小高度：

最大高度：

高度越大说明每个结点半酣的关键字和分叉尽可能的小

下边这个好理解一点哦

总结：

插入的时候根节点全凭运气，所以不一定整整好在那个范围里！

B树的插入：

一直插插插到超过时进行：

在这个基础上插一定插到最底层：

再插插插超过的话：

中间的那个元素插入到父节点里！

再插插插：

提出去的那个元素应该插入父节点的位置是箭头链的那个位置！

再插插插：

父节点！超过！！

总结插入：

B树删除：

再非终端节点：

最左子树最右下的就是直接前驱，用这个替代！

把删除非终端转换成删除终端！

也可以使用直接后继：

用82顶替77

再删：

删38 之后低于下限了

兄弟够借的时候：

只有这样才能表示才能保证B树的特性不变（就是那个大小顺序！）

再删：

删90的时候

再删：

兄弟不宽裕就两个人合体删49

当兄弟没钱的时候总结：

插入和删除总结：

3.5 B+树【概念性的】

和分块查找很类似

保存每一层最大的关键字！

满足的条件

2）当根节点不是叶子的时候，那么他至少有 m/2 向上取整棵子树！

3）第3个和B树是很不一样的，容易出选择题：再B树中两个关键字就会有3个分支！而在B+树中分支【子树】树和关键字的个数相同！

4）叶子结点包含所有的关键字！！！还有指向记录的指针

B+树的查找

从根节点逐层向下

必须到最下面才查找结束！！！

但是B树就不用查找到最后一层！！

顺序查找

B树 vs B+树

不要求的内容：

只有放进内存里才有会进行读！

一个一个结点都存储在磁盘里，当这个关键字不存储对应的存储地址时，他的size就更小更方便，那么就会有更多的数据存储在磁盘里！

这就是B+和B最本质的区别！

总结：

4 散列查找

4.1 定义

4.2 处理冲突的方法-拉链法

小优化：

查找

对比关键词的次数才算到查找长度里！

平均查找长度ASL

成功：

失败：

装填因子

装的满不满的指标！

4.3 常见的散列函数【让冲突尽量减小提高查找效率！】

与质数相对的概念式合数！质数的因子只有1和自己

为什么一定要是质数？！

直接定址法：

不连续的话空位就很多

数字分析法：

平方取中法：

用空间换时间的算法

4.4 处理冲突方法2--开放定址法

线性探测法：

就是一个一个向后找直到有空的位置！

注意一个小细节！！！：

查找

同义词和非同义词都有可能发生冲突！！！ 68 不是27的同义词但也被扫描了

这里的空位置算作一次比较次数，但是在处理冲突的方法1-拉链法里没有把与空算作一次对比，是因为那里的空位置存储的是一个空指针不算；这里的空位置可以视为存储的是相同的数据类型的东西，因此算作一次次数！

删除

删除是要特别注意，要不然删了之后空了下次查找的时候就以为没有了，比如这个

解决方法：

删除的元素做一个标记可以是一个bool型的变量这样就可以让指针继续向下走了

查找效率分析(ASL)：

成功：

就一个一个算.......

失败：

为什么？

同义词和非同义词堆积！

平方探测法

查找也是按照这个散列的序列

非重点小坑【探测到所有位置！】：

伪随机序列法

总结

开放定址法删除结点时要特别注意哦！！！

4.5 处理冲突法3-再散列法

王道上可能是错了

4.6 大总结：

上一篇：第TR3周：Pytorch复现Transformer

下一篇：网络安全（黑客）——自学2024

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09Codex 下载安装指南：Windows 和 macOS 官方版下载 102026 年 AI 大模型 & AI 编程工具实战全总结