哈希的了解

首先让我们来看看哈希的具体例子。

计数统计:开了一个足够大的数组,以统计每个数的出现次数,再输出从小到大每个有出现的数。

这个就是直接映射的哈希,只适用数据范围比较集中的整数。

cpp 复制代码
#include<iostream>
using namespace std;
const int MAXN = 1000010; 
int a[MAXN]; 
int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    int n;
    if (!(cin >> n)) return 0;
    for(int i = 1; i <= n; i++){
        int x;
        cin >> x; // 简单的边界检查,防止数组越界(虽然题目保证了 0<x<1000010)
        if(x >= 0 && x < MAXN) {
            a[x]++;
        }
    }
    for(int i=1;i<MAXN;i++){
		if(a[i]!=0)
    	cout<<i<<":"<<a[i]<<endl; 
	}
    return 0;
}

哈希的本质就是建立一个**"键(Key)"到"值(Value)"**的映射关系。

哈希容器和普通容器的对比

|------|---------------|----------|
| 对比 | unordered_set | set |
| 底层 | 哈希桶 | 红黑树 |
| 迭代器 | 单向迭代器 | 双向迭代器 |
| 增删查 | O(1) | O(log n) |
| 存储顺序 | 无序 | 有序 |

哈希函数

对于比较大范围的数就要使用哈希函数来映射到对应的位置存放。

有以下比较常用的哈希函数:

方法 原理 适用场景
除留余数法 H(key)=key(modM)H(key)=key(modM) 最常用,适用于大多数整数键值。
平方取中法 先求 key2key2 ,再取中间几位 当不知道关键字的分布规律时,平方后的中间位受每一位影响较大,分布较均匀。
折叠法 将大数切分成几段相加 适用于关键字位数很多的情况(如身份证号、长数字串)。
乘法散列法 H(key)=⌊M×(key×A(mod1))⌋H(key)=⌊M×(key×A(mod1))⌋ 对 MM 没有特殊要求(可以是 2 的幂),利用常数 AA (如黄金分割率) 提取小数部分。

哈希冲突

只要是哈希的函数就会有哈希冲突

| 方法 | 问题 |
| 除留余数法 | 101%100=1,201%100=1 |
| 平方取中法 | 23*23=529取中间02,45*45=2025也是02; |
| 折叠法 | 123456和456123,截取相加相等 |

乘法散列法 4×0.25=1.00和8*0.25=2.00,小数位相同

有两种解决方法

1:开放定址法

|------|-----------|------------------------------------------------|-----------------------------|
| 方法 | 用法 | 优点 | 缺点 |
| 线性探测 | 往后找 | 最简单、最直观 | 一旦某个区域发生了冲突,这片区域就会被填满 |
| 二次探测 | 跳着找 | 减少了"一次聚集"现象,数据分布更散 | 可能会出现二次聚集,而且不能保证遍历到所有槽位 |
| 双重哈希 | 再使用哈希函数安放 | 步长是根据关键字本身计算出来的,不同的关键字会有不同的步长,极大地减少了聚集,分布非常均匀。 | 复杂 |

2:链地址法

把映射到相同位置的值,由特定的顺序链接起来。

对比

特性 开放定址法 链地址法
存储结构 纯数组,无指针 数组 + 链表/红黑树
内存占用 较省内存(无指针开销),但需预留空位 需要额外的指针空间
缓存性能 极好(数据连续,CPU 缓存命中率高) 一般(链表节点分散在堆内存中)
负载因子 必须小于 1(通常建议 < 0.7~0.8) 可以大于 1
适用场景 键值对较小、对性能极其敏感、内存紧凑的场景 通用场景(如 Java HashMap, C++ unordered_map)
相关推荐
水木流年追梦1 小时前
大模型入门-应用篇1-prompt技术
开发语言·python·算法·prompt
S1998_1997111609•X1 小时前
Phash的系统通信工程及恶意注入污染蜜罐轮替探测阻断正常通讯协议系统的dog 通用原理及行为阻击至联合国管理清理全栈
安全·百度·哈希算法·量子计算·开闭原则
WL_Aurora1 小时前
【每日一题】位运算
python·算法
多加点辣也没关系1 小时前
数据结构与算法总章
数据结构·算法
影sir1 小时前
STL容器——vector类
c++·算法·stl
Brilliantwxx1 小时前
【C++】stack_queue与deque模版(模拟实现+认识+对比)
开发语言·c++·笔记·算法·list
爱吃香芋派OvO1 小时前
ComfyUI 视频创作实战手册:节点搭建 + 性能优化 + 批量生成
人工智能·算法·机器学习
数智工坊1 小时前
【深度学习RL】A3C:异步强化学习的革命——用CPU打败GPU的深度RL算法
论文阅读·人工智能·深度学习·算法·transformer
灵智实验室1 小时前
PX4状态估计技术EKF2详解(三):EKF2 外部视觉融合——延迟后验状态与触发机制
算法·无人机·px 4