详解哈希表

哈希表概念

哈希表是一种基于数组 + 哈希函数实现的数据结构,用于快速存储和查找数据。它的核心思想是:

通过 key 来快速找到对应的 value

查找操作在理想情况下可以达到 O(1) 的时间复杂度。

哈希表也叫散列表,核心组成部分包括:

  1. 哈希函数 (Hash Function)

    • 将 key 映射成数组的索引 (0 到 N-1)

    • 公式:

      index=hash(key)%table_size

  2. 数组

    • 存放数据的容器,每个索引称为一个
  3. 冲突解决策略

    • 不同 key 可能映射到相同的索引 → 哈希冲突

    • 常见策略:

      • 拉链法:每个桶用链表存储所有冲突元素

      • 开放地址法:冲突元素在表内寻找下一个空位置(线性探测、二次探测、双重哈希)

哈希函数设计

哈希函数决定了哈希表性能的好坏。设计原则:

均匀分布:尽量让 key 均匀分布到各个桶

高效:计算要快,避免性能瓶颈

确定性:相同 key 必须映射到相同位置

常见哈希函数:

整型 key:直接取模

cpp 复制代码
int hash(int key) {
    return key % table_size;
}

字符串 key:常用多项式滚动哈希

cpp 复制代码
hash = s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
index = hash % table_size;

冲突解决策略详解

拉链法

每个桶存储一个链表或其他数据结构(如平衡树)。

插入时将元素加入链表尾部或头部。

查找时在链表中遍历。

优点:实现简单,删除方便。

缺点:最坏情况退化为链表,查找 O(n)。

开放地址法

所有元素存储在数组中,不用链表。

冲突时通过探测找到下一个空槽。

常用探测策略:

线性探测

index = (hash(key) + i) % table_size
i = 0,1,2,...

二次探测

index = (hash(key) + i^2) % table_size

哈希表操作复杂度

操作 理想情况 平均情况 最坏情况
插入 O(1) O(1) O(n)
查找 O(1) O(1) O(n)
删除 O(1) O(1) O(n)

哈希表的应用场景

字典/映射结构 :C++ unordered_map、Java HashMap

去重 :用 Set 保存唯一值计数统计:频率统计问题

缓存实现:如 LRU Cache 的快速访问

查找优化:通过 key 快速查找复杂对象

相关推荐
小羊在睡觉13 分钟前
力扣84. 柱状图中最大的矩形
后端·算法·leetcode·golang·go
3DVisionary28 分钟前
蓝光三维扫描:医疗制造的精度焦虑怎么解
人工智能·算法·制造·蓝光三维扫描·医疗制造·三维检测·义齿检测
好评笔记36 分钟前
机器学习面试八股——常用损失函数
人工智能·深度学习·算法·机器学习·校招
weixin_4684668538 分钟前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
_日拱一卒1 小时前
LeetCode:994腐烂的橘子
java·数据结构·算法·leetcode·深度优先
珂朵莉MM2 小时前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第3赛季优化题--束搜索
人工智能·算法
Omics Pro2 小时前
首个!外源天然产物综合性代谢图谱
数据库·人工智能·算法·机器学习·r语言
voidmort2 小时前
3. 微调(Fine-tuning)与强化学习(RL)的核心思想
python·深度学习·算法
人道领域3 小时前
【LeetCode刷题日记】669.修剪二叉搜索树
开发语言·python·算法
2401_868534783 小时前
【无标题】
数据结构·r语言