详解哈希表

哈希表概念

哈希表是一种基于数组 + 哈希函数实现的数据结构,用于快速存储和查找数据。它的核心思想是:

通过 key 来快速找到对应的 value

查找操作在理想情况下可以达到 O(1) 的时间复杂度。

哈希表也叫散列表,核心组成部分包括:

  1. 哈希函数 (Hash Function)

    • 将 key 映射成数组的索引 (0 到 N-1)

    • 公式:

      index=hash(key)%table_size

  2. 数组

    • 存放数据的容器,每个索引称为一个
  3. 冲突解决策略

    • 不同 key 可能映射到相同的索引 → 哈希冲突

    • 常见策略:

      • 拉链法:每个桶用链表存储所有冲突元素

      • 开放地址法:冲突元素在表内寻找下一个空位置(线性探测、二次探测、双重哈希)

哈希函数设计

哈希函数决定了哈希表性能的好坏。设计原则:

均匀分布:尽量让 key 均匀分布到各个桶

高效:计算要快,避免性能瓶颈

确定性:相同 key 必须映射到相同位置

常见哈希函数:

整型 key:直接取模

cpp 复制代码
int hash(int key) {
    return key % table_size;
}

字符串 key:常用多项式滚动哈希

cpp 复制代码
hash = s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
index = hash % table_size;

冲突解决策略详解

拉链法

每个桶存储一个链表或其他数据结构(如平衡树)。

插入时将元素加入链表尾部或头部。

查找时在链表中遍历。

优点:实现简单,删除方便。

缺点:最坏情况退化为链表,查找 O(n)。

开放地址法

所有元素存储在数组中,不用链表。

冲突时通过探测找到下一个空槽。

常用探测策略:

线性探测

index = (hash(key) + i) % table_size
i = 0,1,2,...

二次探测

index = (hash(key) + i^2) % table_size

哈希表操作复杂度

操作 理想情况 平均情况 最坏情况
插入 O(1) O(1) O(n)
查找 O(1) O(1) O(n)
删除 O(1) O(1) O(n)

哈希表的应用场景

字典/映射结构 :C++ unordered_map、Java HashMap

去重 :用 Set 保存唯一值计数统计:频率统计问题

缓存实现:如 LRU Cache 的快速访问

查找优化:通过 key 快速查找复杂对象

相关推荐
天天爱吃肉82185 小时前
【跨界封神|周杰伦×王传福(陶晶莹主持):音乐创作与新能源NVH测试,底层逻辑竟完全同源!(新人必看入行指南)】
python·嵌入式硬件·算法·汽车
im_AMBER5 小时前
Leetcode 114 链表中的下一个更大节点 | 删除排序链表中的重复元素 II
算法·leetcode
xhbaitxl5 小时前
算法学习day38-动态规划
学习·算法·动态规划
多恩Stone5 小时前
【3D AICG 系列-6】OmniPart 训练流程梳理
人工智能·pytorch·算法·3d·aigc
历程里程碑5 小时前
普通数组----轮转数组
java·数据结构·c++·算法·spring·leetcode·eclipse
pp起床5 小时前
贪心算法 | part02
算法·leetcode·贪心算法
sin_hielo5 小时前
leetcode 1653
数据结构·算法·leetcode
2501_901147835 小时前
面试必看:优势洗牌
笔记·学习·算法·面试·职场和发展
李日灐5 小时前
C++进阶必备:红黑树从 0 到 1: 手撕底层,带你搞懂平衡二叉树的平衡逻辑与黑高检验
开发语言·数据结构·c++·后端·面试·红黑树·自平衡二叉搜索树
熬夜有啥好5 小时前
数据结构——排序与查找
数据结构