前言
哈希表是 C++ 面试最高频的数据结构,unordered_map / unordered_set 底层全部依赖哈希表。
很多同学只会调用 STL 接口,但完全不懂底层原理、哈希冲突、扩容机制、迭代器实现。
本文将从零讲解:哈希原理 → 冲突解决 → 底层结构 → 手撕哈希表 → 手撕 unordered_map/unordered_set → 面试题实战,彻底吃透哈希表。
一、哈希表是什么?(通俗易懂)
1.1 哈希表核心思想
通过哈希函数,把任意 key 映射到数组下标,实现 O(1) 查找。
数组:查找快、插入慢
链表:查找慢、插入快
哈希表:查找、插入、删除平均 O(1)
1.2 哈希函数作用
将任意类型 key(int/string)→ 映射为数组下标
1.3 什么是哈希冲突?
不同 key 经过哈希计算得到相同下标 → 哈希冲突(自动去重 不存放相同的key值)
1.4 负载因子
衡量哈希表拥挤程度的指标,公式为:负载因子(λ) = 存储的元素个数(N) / 哈希表大小(M)。
λ 越大:冲突概率越高,空间利用率越高;
λ 越小:冲突概率越低,空间利用率越低;
开放定址法 λ 通常控制在 0.7 ,链地址法 λ 控制在 1 。
二、常见哈希冲突解决方式
2.1 开放定址法(简单说明)
冲突就往后找空位,相当于去抢占往后走的最近的位置
缺点:删除复杂、容易堆积(存的key值不同也可能映射到同一个位置,冲突时就不断往后找空位,导致堆积)
2.2 拉链法(重点!STL 默认)
数组 + 链表结构

每个下标挂一条链表,冲突就挂在链表后面,避免了数据堆积
我们手写哈希表采用:拉链法
三、STL 哈希表底层结构剖析
3.1 unordered_map / unordered_set 区别
-
unordered_set:只存 key,无 value,去重
-
unordered_map:存 key-value 键值对,key 唯一
3.2 底层统一结构
底层都是:vector + 单链表 哈希桶结构
set/map 是红黑树(有序)
unordered_xxx 是哈希表(无序、更快)
3.3 哈希表核心机制
- 哈希函数映射下标(可以通过优化哈希函数减少开放寻址法的哈希冲突)
cpp
举一个哈希函数的例子(string专用)
size_t operator()(const string& key)
{
size_t hash = 0;
for (auto ch : key)
{
hash += ch;// 累加字符ASCII码
hash *= 131;// 乘质数131,减少冲突
}
return hash;
}
-
拉链法解决冲突
-
负载因子控制扩容
-
扩容重新哈希(哈希表进行扩容时,由于表长变了,因此每一个key映射的位置也改变了)
四、手写通用哈希表(核心重点)
实现一个可同时支持 map/set 的通用哈希表
4.1 模板设计思想
-
KeyOfT 仿函数:从数据中取出 key(存放的可能是键值对 因此需要KeyOfT从键值对取出key)
-
Hash 仿函数:通用哈希函数 + 类型特化
4.2 哈希节点设计
单链表节点:数据 + next 指针
4.3 迭代器实现(重难点)
-
普通迭代器
-
const 迭代器(const 正确性)
-
迭代器++ 逻辑(跨桶遍历)
4.4 哈希表核心接口实现
-
Insert 插入(去重)
-
Find 查找
-
Erase 删除(key / 迭代器)
-
size / empty / clear / count
-
扩容机制(负载因子判断)
五、基于哈希表封装 unordered_map
5.1 适配器模式讲解
unordered_map 不存数据,只是调用底层 HashTable
5.2 MapKeyOfT 取键仿函数
从 pair<K,V> 中取出 key
5.3 unordered_map 完整接口实现
-
insert 插入
-
find 查找
-
erase 删除
-
begin / end / const 迭代器
-
operator[] 核心重难点(不存在则插入默认值)
-
size / empty / clear / count
六、基于哈希表封装 unordered_set
6.1 SetKeyOfT 取键仿函数
6.2 unordered_set 特点
-
无 value,只存 key
-
无 operator[]
-
天然去重
6.3 unordered_set 全套接口
insert / find / erase / size / empty / clear / count / 迭代器
这一章节知识只是理论知识 用于复习和gou具体大纲思路 具体的代码实现请看下一章节