数据结构 -- 顺序查找和折半查找

查找的基本概念

基本概念

查找:在数据集合中寻找满足某种条件的数据元素的过程

查找表(查找结构):用于查找的数据集合称为查找表,它由同一类型的数据结构元素(或记录)组成

关键字:唯一标识该元素的某个数据项的值,使用基于关键字的查找,查找结果应该是唯一的

对查找表的常见操作

①查找符合条件的数据元素

②插入、删除某个数据元素

只需要进行操作①--静态查找表--著需要关注查找速度

也要进行操作②--动态查找表--还需要关注插入、删除操作是否方便实现

查找算法的评价指标

查找长度:查找运算中,需要对比关键字次数

平均查找长度(ASL):查找过程中进行关键字比较次数的平均值

通常考虑查找成功、查找失败两种情况下的ASL

顺序查找

算法思想

从头到尾/从尾到头依次查找

基本实现
c 复制代码
typedef struct{
    ElemType *elem;
    int TableLen;
}SSTable;

//顺序查找
int Search_Seq(SSTable ST,ElemType key){
    int i;
    for(i = 0;i<ST.TableLen && ST.elem[i] != key;++i);
    return i==ST.TableLen?-1:i;
}
实现(哨兵)
c 复制代码
typedef struct{
    ElemType *elem;
    int TableLen;
}SSTable;

//顺序查找
int Search_Seq(SSTable ST,ElemType key){
    ST.elem[0] = key;					//查找表中从1号位置开始存放数据,0号位置存放"哨兵"
    int i;
    for(i = ST.TableLen;ST.elem[i] != key;--i);
    return i;							//查找成功,返回元素下标;查找失败,返回0
}

优点:无需判断是否越界,执行效率更高(但是并没有质的提升)

效率分析

查找成功:ASL=(n+1)/2 时间复杂度:O(n)

查找失败:ASL=n+1 时间复杂度:O(n)

顺序查找的优化(对有序表)

以查找表中元素递增存放为例:

若查找到某个元素大于查找目标,则可判定为查找失败(后面的元素都大于查找目标)

ASL(失败) = (1+2+......+n+n)/n+1 = n/2+n/(n+1)

查找算法判定树分析ASL

一个成功节点的查找层数 = 自身所在的层数

一个失败节点的查找长度 = 其父节点所在的层数

默认情况下,各种成功情况或失败情况都等概率发生

折半查找(考察频率高)

算法思想

又称"二分查找",仅适用于有序的顺序表

每次将查找范围折半,逐步缩小查找区间,直到找到目标元素或查找区间为空。

前提 :数据必须是有序的(通常是升序)。

取中间元素:

  • 计算中间下标 mid = (low + high) // 2

比较中间元素和目标值:

  • target == arr[mid]:查找成功。
  • target < arr[mid]:继续在左半部分查找。
  • target > arr[mid]:继续在右半部分查找。

重复步骤 2-3,直到找到目标或范围为空(low > high)。

算法实现
c 复制代码
typedef struct{
    ElemType *elem;
    int TableLen;
}SSTable;

int Binary_Search(SSTable L,ElemType key){
    int low = 0,high = L.TableLen-1,mid;
    while(low<=high){
        mid = (low+high)/2;			//取中间位置
        if(L.elem[mid] == key)
            return mid;				//查找成功返回所在位置
        else if(L.elem[mid]<key)
            low = mid+1;			//从后半部分查找
        else
            high = mid-1;			//从前半部分查找
    }
    return -1;
}
查找效率分析

例:

ASL(成功) = (1*1 + 2*2 + 3*4 + 4*4)/11 = 3

ASL(失败) = (3*4+4*8)/12 = 11/3

查找判定树的构造

如果当前low和high之间有奇数个元素,则mid分割后,左右两部分元素个数相等

如果当前low和high之间有偶数个元素,则mid分割后,左半部分比右半部分少一个元素

折半查找的判定树中,若mid = [(low+high)/2] 则对于任何一个结点,必有:右子树个数-左子树个数 = 0或1

折半查找的判定树一定只有最下面一层是不满的

h = [log2(n+1)]

判定树结点关键字:左<中<右,满足二叉排序树的定义

失败节点:n+1(等于成功结点的空链域数量)

折半查找的查找效率

树高h = [log2(n+1)] 查找成功ASL ≤ h 查找失败ASL ≤ h

时间复杂度O(log2n)

!WARNING

折半查找的速度一定比顺序查找更快?

❌ 一般情况下,折半查找比顺序查找表现优秀,但不是所有情况下折半查找都更快

若mid = (low+high)/2(向上取整) ?

左子树结点数-右子树结点数 = 0或1

分块查找(手算模拟+平均查找长度)

分块查找的算法思想

eg. 第一个区间:≤10 第二个区间:≤20 ......

"索引表"中保存每个分块的最大关键字和存储的区间

特点:块内无序,块间有序

c 复制代码
typedef struct{
    ElemType maxValue;
    int low,high;
}Index;

//顺序表存储实际元素
ElemType List[100];

算法过程:

①在索引表中确定待查记录所属的分块(可顺序、可折半)

②在块内顺序查找

用折半查找查索引

若索引表中不包含目标关键字,则折半查找索引表最终停在low>high,要在low所指的分块中进行查找

low超出索引表的范围时,查找失败

查找效率分析(ASL)

共有14个元素可能被查找,各自被查找的概率为1/14

若索引表顺序查找

7(2)、10(3)、13(3)......

若索引表折半查找(一般不考、计算量大)

30(4)✔、27(2)❌

查找失败的情况(更复杂,一般不考)

【可能会考的情况】(顺序查找,效率和最优分块)


【拓展思考】

若查找表是"动态查找表",更好的实现方式 -- 使用链式存储

(否则在目标关键字插入时,需要大量元素的移动)

相关推荐
士别三日&&当刮目相看2 分钟前
数据结构*优先级队列(堆)
java·数据结构
QQ_43766431426 分钟前
单向循环链表C语言实现实现(全)
数据结构·windows·链表
ptu小鹏33 分钟前
list重点接口及模拟实现
数据结构·c++·list
冲帕Chompa2 小时前
图论part10 bellman_ford算法
数据结构·算法·图论
GG不是gg2 小时前
排序算法之基础排序:冒泡,选择,插入排序详解
数据结构·算法·青少年编程·排序算法
丶Darling.4 小时前
Day119 | 灵神 | 二叉树 | 二叉树的最近共公共祖先
数据结构·c++·算法·二叉树
int型码农6 小时前
数据结构第七章(四)-B树和B+树
数据结构·b树·算法·b+树
技术流浪者8 小时前
C/C++实践(十)C语言冒泡排序深度解析:发展历史、技术方法与应用场景
c语言·数据结构·c++·算法·排序算法
I AM_SUN8 小时前
98. 验证二叉搜索树
数据结构·c++·算法·leetcode
学习中的码虫9 小时前
数据结构基础排序算法
数据结构·算法·排序算法