<<哈希表理论知识储备>>

前言

哈希表是 C++ 面试最高频的数据结构,unordered_map / unordered_set 底层全部依赖哈希表。

很多同学只会调用 STL 接口,但完全不懂底层原理、哈希冲突、扩容机制、迭代器实现。

本文将从零讲解:哈希原理 → 冲突解决 → 底层结构 → 手撕哈希表 → 手撕 unordered_map/unordered_set → 面试题实战,彻底吃透哈希表。

一、哈希表是什么?(通俗易懂)

1.1 哈希表核心思想

通过哈希函数,把任意 key 映射到数组下标,实现 O(1) 查找。

数组:查找快、插入慢

链表:查找慢、插入快

哈希表:查找、插入、删除平均 O(1)

1.2 哈希函数作用

将任意类型 key(int/string)→ 映射为数组下标

1.3 什么是哈希冲突?

不同 key 经过哈希计算得到相同下标 → 哈希冲突(自动去重 不存放相同的key值)

1.4 负载因子

衡量哈希表拥挤程度的指标,公式为:负载因子(λ) = 存储的元素个数(N) / 哈希表大小(M)。

λ 越大:冲突概率越高,空间利用率越高;

λ 越小:冲突概率越低,空间利用率越低;

开放定址法 λ 通常控制在 0.7 ,链地址法 λ 控制在 1 。

二、常见哈希冲突解决方式

2.1 开放定址法(简单说明)

冲突就往后找空位,相当于去抢占往后走的最近的位置

缺点:删除复杂、容易堆积(存的key值不同也可能映射到同一个位置,冲突时就不断往后找空位,导致堆积)

2.2 拉链法(重点!STL 默认)

数组 + 链表结构

每个下标挂一条链表,冲突就挂在链表后面,避免了数据堆积

我们手写哈希表采用:拉链法

三、STL 哈希表底层结构剖析

3.1 unordered_map / unordered_set 区别

  • unordered_set:只存 key,无 value,去重

  • unordered_map:存 key-value 键值对,key 唯一

3.2 底层统一结构

底层都是:vector + 单链表 哈希桶结构

set/map 是红黑树(有序)

unordered_xxx 是哈希表(无序、更快)

3.3 哈希表核心机制

  • 哈希函数映射下标(可以通过优化哈希函数减少开放寻址法的哈希冲突)
cpp 复制代码
举一个哈希函数的例子(string专用)
size_t operator()(const string& key)
	{
		size_t hash = 0;
		for (auto ch : key)
		{
			hash += ch;// 累加字符ASCII码
			hash *= 131;// 乘质数131,减少冲突
		}
		return hash;
	}
  • 拉链法解决冲突

  • 负载因子控制扩容

  • 扩容重新哈希(哈希表进行扩容时,由于表长变了,因此每一个key映射的位置也改变了)

四、手写通用哈希表(核心重点)

实现一个可同时支持 map/set 的通用哈希表

4.1 模板设计思想

  • KeyOfT 仿函数:从数据中取出 key(存放的可能是键值对 因此需要KeyOfT从键值对取出key)

  • Hash 仿函数:通用哈希函数 + 类型特化

4.2 哈希节点设计

单链表节点:数据 + next 指针

4.3 迭代器实现(重难点)

  • 普通迭代器

  • const 迭代器(const 正确性)

  • 迭代器++ 逻辑(跨桶遍历)

4.4 哈希表核心接口实现

  • Insert 插入(去重)

  • Find 查找

  • Erase 删除(key / 迭代器)

  • size / empty / clear / count

  • 扩容机制(负载因子判断)

五、基于哈希表封装 unordered_map

5.1 适配器模式讲解

unordered_map 不存数据,只是调用底层 HashTable

5.2 MapKeyOfT 取键仿函数

从 pair<K,V> 中取出 key

5.3 unordered_map 完整接口实现

  • insert 插入

  • find 查找

  • erase 删除

  • begin / end / const 迭代器

  • operator[] 核心重难点(不存在则插入默认值)

  • size / empty / clear / count

六、基于哈希表封装 unordered_set

6.1 SetKeyOfT 取键仿函数

6.2 unordered_set 特点

  • 无 value,只存 key

  • 无 operator[]

  • 天然去重

6.3 unordered_set 全套接口

insert / find / erase / size / empty / clear / count / 迭代器


这一章节知识只是理论知识 用于复习和gou具体大纲思路 具体的代码实现请看下一章节

相关推荐
玖釉-2 小时前
下一个排列:从字典序到原地算法的完整推导
数据结构·c++·windows·算法
枕星而眠3 小时前
数据结构八大排序详解(一):四大简单排序
c语言·数据结构·c++·后端
过期动态3 小时前
【LeetCode 热题 100】移动零
java·数据结构·算法·leetcode·职场和发展·rabbitmq
努力努力再努力wz3 小时前
【Qt入门系列】:按钮组件全解析:从 QAbstractButton 到快捷键事件、单选与复选机制
c语言·开发语言·数据结构·c++·git·qt·github
Dlrb12114 小时前
数据结构-栈
数据结构··内核栈·满栈空栈·增栈减栈
菜菜的顾清寒5 小时前
力扣HOT100(32)二叉树的中序遍历
数据结构·算法·leetcode
Shan12056 小时前
线段树入门:更新数组后处理求和查询
数据结构·算法
澈2078 小时前
图论天花板:Dijkstra最短路径算法详解
数据结构·算法·图论
AllData公司负责人9 小时前
亲测丝滑,体验跃迁|AllData通过集成开源项目DataVines,一站式解决数据质量难题
java·大数据·数据结构·数据库·人工智能·算法·云原生
CQU_JIAKE9 小时前
5.25【A】
java·数据结构·算法