针对哈希冲突的解决方法

了解哈希表和哈希冲突是什么

哈希表:是一种实现关联数组抽象数据类型的数据结构,这种结构可以将关键码映射到给定值。简单来说哈希表(key-value)之间存在一个映射关系,是键值对的关系,一个键对应一个值。

哈希冲突:当两个不同的数经过哈希函数计算后得到了同一个结果,即他们会被映射到哈希表的同一个位置时,即称为发生了哈希冲突。简单来说就是哈希函数算出来的地址被别的元素占用了。哈希冲突是不可避免的,因为哈希函数通常会将无限大小的输入域映射到有限大小的输出域,这就导致了多个不同的键可能映射到同一个桶上。

为了解决哈希冲突常用的方法

链地址法(Separate Chaining)
  • 在每个哈希桶上维护一个链表,当发生哈希冲突时,将新的键值对添加到链表中。
  • 这样,同一个桶上的多个键值对都可以存储在链表中,不同的键值对之间不会互相影响。
  • 当进行查找时,先通过哈希函数找到桶,然后在链表中查找具体的键值对。
开放地址法(Open Addressing)
  • 当发生哈希冲突时,通过一定的规则,将新的键值对存储在其他的哈希桶上,而不是在冲突的桶上。
  • 常见的开放地址法的策略包括线性探测、二次探测、双重散列等。
  • 线性探测:逐一检查下一个哈希桶,直到找到一个空桶为止。
  • 二次探测:使用二次探测公式逐步增加探测距离,直到找到一个空桶。
再哈希(Rehashing)
  • 当哈希表的负载因子达到一定阈值时,可以考虑对哈希表进行扩容,同时重新计算所有键的哈希值,将它们重新插入到新的哈希表中。
  • 当在哈希表中发生冲突时,再哈希会尝试使用另一种哈希函数来找到新的存储位置。这可以防止形成集中的聚集,提高散列的均匀性。

在重新哈希的过程中,旧的哈希表会被替换为一个更大的哈希表,然后已存在的元素会被重新散列到新的表中。这通常涉及到选择一个新的哈希函数,可能是与原始哈希函数不同的函数,以确保冲突在新的哈希表中得到解决。

建立公共溢出区且更好的哈希函数
  • 选择一个好的哈希函数可以降低冲突的概率。好的哈希函数应该能够尽可能均匀地将键分布在哈希表中。
  • 对于字符串键,通常使用字符串的每个字符的ASCII码值的加权和来作为哈希值。
  • 建立公共溢出区允许多个关键字映射到同一个哈希桶的情况。在使用公共溢出区的哈希表中,每个桶不仅可以存储一个关键字,而且可以存储一个关键字链表或其他数据结构,用于存储冲突的关键字。
  • 可以处理大量的冲突,因为每个桶都可以包含多个关键字。
  • 需要小心设计哈希函数,以确保关键字在哈希表中均匀分布,以减少溢出区的长度,从而提高性能。
相关推荐
进击的横打8 分钟前
【车载开发系列】安全算法与安全访问
算法·安全·车载系统
努力学算法的蒟蒻9 分钟前
day59(1.18)——leetcode面试经典150
算法·leetcode·职场和发展
666HZ66611 分钟前
数据结构3.0 栈、队列和数组
开发语言·数据结构·算法
知乎的哥廷根数学学派12 分钟前
基于物理引导和不确定性量化的轻量化神经网络机械退化预测算法(Python)
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
程序员-King.13 分钟前
day146—递归—验证二叉搜索树(LeetCode-98)
算法·leetcode·二叉树·递归
永远都不秃头的程序员(互关)14 分钟前
【K-Means深度探索(五)】不止欧氏距离:K-Means中距离度量那些事儿
算法·机器学习·kmeans
tobias.b18 分钟前
408真题解析-2009-41-数据结构-最短路径
数据结构·算法·计算机考研·408考研·408真题解析
王老师青少年编程19 分钟前
2024年9月GESP真题及题解(C++七级): 矩阵移动
c++·算法·题解·真题·gesp·七级·矩阵移动
棒棒的皮皮25 分钟前
【深度学习】YOLO 进阶提升之算法改进(新型骨干网络 / 特征融合方法 / 损失函数设计)
深度学习·算法·yolo·计算机视觉
pas13630 分钟前
33-mini-vue 更新element的children-双端对比diff算法
javascript·vue.js·算法