数据结构-哈希表（C语言）

zheshiyangyang2023-11-21 12:01

哈希表的概念

哈希表就是：

"将记录的存储位置与它的关键字之间建立一个对应关系，使每个关键字和一个唯一的存储位置对

应。"

哈希表又称："散列法 "、"杂凑法 "、"关键字：地址法"。

哈希表思想

基本思想是在关键字和存储位置之间建立一个哈希函数hash，使每一个存储位置和关键字对应。

通常关键字的集合很大，因此经过哈希函数的变换后，可能会将不同的关键字映射到同一个地址

上。这种现象称作："冲突 "，具有相同函数值的关键字称作："同义词"。

哈希表属性

哈希函数的值域是可以使用的地址空间，称作基本区域。

基本区域的长度是哈希表的长度。

同义词可以存放在基本区域中未占用的单元，也可以放在另外开辟的地方。（溢出区）

哈希函数的构造

哈希函数的构造一般有下面几种方法：

1.直接定址法

hash(key) = key或hash(key) = a * key + b

直接定址法的构造有点像Python里面的字典。

优点:不会产生冲突

缺点:空间效率不高

2.取余法

hash(key) = key % p

p < m，m是哈希表长。

优点：计算简单，适用范围大

缺点：需要选择一个合适的p，p的选择很困难

一般来说，p是不大于m的最大素数：

3.平方取中法

先计算关键字的平方，然后取平方后数的中间几位作为地址。

key = 2587

key ** 2 = 6692569

若取三位，则hash(2587) = 925。

处理冲突的方法：

1.开放定址法

当发生冲突时，在冲突位置的前后寻找可以存放记录的空闲单元。

当用此法时，需要预先设置一个探测序列d，沿着序列d寻找空闲单元。

数学描述公式为：

H = (hash(key) + d) % m

其中探测序列d有下面三种取法：

1.d = 1,2,3,4,.....,n

2.d =

3.d = 随机数列

用的最多的是1和2。

但是使用1的时候，会导致原本不冲突的非同义词也会产生冲突，这种现象叫作："堆积"（聚

集）。

因此减少堆积可以使用2，但是2并不能保证可以全部使用表中空闲单元，容易造成浪费。

2.拉链法

将具有相同哈希地址的记录连接成一个单链表，然后用一个数组将n个单链表头指针存储起来。

3.再哈希法

当发生冲突时，再用另一个哈希函数计算地址。

4.溢出区法

建立一个额外的公共溢出区，用来存储冲突的记录

上一篇：【算法练习】数组操作

下一篇：使用Springboot框架手撸一个安全、可靠的本地缓存工具

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 10Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费