<<哈希表理论知识储备>>

前言

哈希表是 C++ 面试最高频的数据结构,unordered_map / unordered_set 底层全部依赖哈希表。

很多同学只会调用 STL 接口,但完全不懂底层原理、哈希冲突、扩容机制、迭代器实现。

本文将从零讲解:哈希原理 → 冲突解决 → 底层结构 → 手撕哈希表 → 手撕 unordered_map/unordered_set → 面试题实战,彻底吃透哈希表。

一、哈希表是什么?(通俗易懂)

1.1 哈希表核心思想

通过哈希函数,把任意 key 映射到数组下标,实现 O(1) 查找。

数组:查找快、插入慢

链表:查找慢、插入快

哈希表:查找、插入、删除平均 O(1)

1.2 哈希函数作用

将任意类型 key(int/string)→ 映射为数组下标

1.3 什么是哈希冲突?

不同 key 经过哈希计算得到相同下标 → 哈希冲突(自动去重 不存放相同的key值)

1.4 负载因子

衡量哈希表拥挤程度的指标,公式为:负载因子(λ) = 存储的元素个数(N) / 哈希表大小(M)。

λ 越大:冲突概率越高,空间利用率越高;

λ 越小:冲突概率越低,空间利用率越低;

开放定址法 λ 通常控制在 0.7 ,链地址法 λ 控制在 1 。

二、常见哈希冲突解决方式

2.1 开放定址法(简单说明)

冲突就往后找空位,相当于去抢占往后走的最近的位置

缺点:删除复杂、容易堆积(存的key值不同也可能映射到同一个位置,冲突时就不断往后找空位,导致堆积)

2.2 拉链法(重点!STL 默认)

数组 + 链表结构

每个下标挂一条链表,冲突就挂在链表后面,避免了数据堆积

我们手写哈希表采用:拉链法

三、STL 哈希表底层结构剖析

3.1 unordered_map / unordered_set 区别

  • unordered_set:只存 key,无 value,去重

  • unordered_map:存 key-value 键值对,key 唯一

3.2 底层统一结构

底层都是:vector + 单链表 哈希桶结构

set/map 是红黑树(有序)

unordered_xxx 是哈希表(无序、更快)

3.3 哈希表核心机制

  • 哈希函数映射下标(可以通过优化哈希函数减少开放寻址法的哈希冲突)
cpp 复制代码
举一个哈希函数的例子(string专用)
size_t operator()(const string& key)
	{
		size_t hash = 0;
		for (auto ch : key)
		{
			hash += ch;// 累加字符ASCII码
			hash *= 131;// 乘质数131,减少冲突
		}
		return hash;
	}
  • 拉链法解决冲突

  • 负载因子控制扩容

  • 扩容重新哈希(哈希表进行扩容时,由于表长变了,因此每一个key映射的位置也改变了)

四、手写通用哈希表(核心重点)

实现一个可同时支持 map/set 的通用哈希表

4.1 模板设计思想

  • KeyOfT 仿函数:从数据中取出 key(存放的可能是键值对 因此需要KeyOfT从键值对取出key)

  • Hash 仿函数:通用哈希函数 + 类型特化

4.2 哈希节点设计

单链表节点:数据 + next 指针

4.3 迭代器实现(重难点)

  • 普通迭代器

  • const 迭代器(const 正确性)

  • 迭代器++ 逻辑(跨桶遍历)

4.4 哈希表核心接口实现

  • Insert 插入(去重)

  • Find 查找

  • Erase 删除(key / 迭代器)

  • size / empty / clear / count

  • 扩容机制(负载因子判断)

五、基于哈希表封装 unordered_map

5.1 适配器模式讲解

unordered_map 不存数据,只是调用底层 HashTable

5.2 MapKeyOfT 取键仿函数

从 pair<K,V> 中取出 key

5.3 unordered_map 完整接口实现

  • insert 插入

  • find 查找

  • erase 删除

  • begin / end / const 迭代器

  • operator\[\] 核心重难点(不存在则插入默认值)

  • size / empty / clear / count

六、基于哈希表封装 unordered_set

6.1 SetKeyOfT 取键仿函数

6.2 unordered_set 特点

  • 无 value,只存 key

  • 无 operator\[\]

  • 天然去重

6.3 unordered_set 全套接口

insert / find / erase / size / empty / clear / count / 迭代器


这一章节知识只是理论知识 用于复习和gou具体大纲思路 具体的代码实现请看下一章节

相关推荐
Darling噜啦啦1 天前
列表转树算法深度解析:从 Map 到 Reduce 的两种实现,面试高频考点
数据结构·算法·面试
小小工匠2 天前
Redis - 事务机制:能实现 ACID 属性吗
数据结构·redis·性能优化·并发·持久化
玖玥拾3 天前
C/C++ 数据结构(七)栈、容器适配器
c语言·数据结构·c++··容器适配器
Qres8213 天前
算法复键——树状数组
数据结构·算法
牛油果子哥q3 天前
并查集(DSU)超精讲,路径压缩、按秩合并、万能模板、连通性判定、最小生成树与刷题实战全解
数据结构·c++·最小生成树·并查集
凌波粒3 天前
LeetCode--491.递增子序列(回溯算法)
数据结构·算法·leetcode
WL学习笔记3 天前
单项不带头不循环链表
数据结构·链表
小糯米6013 天前
JS 数组
数据结构·算法·排序算法
小欣加油3 天前
leetcode3612 用特殊操作处理字符串I
数据结构·c++·算法·leetcode·职场和发展
凌波粒3 天前
LeetCode--90.子集II(回溯算法)
数据结构·算法·leetcode