算法·字符串哈希

字符串哈希 (字符串前缀哈希法)

用法:查询任意子串的哈希值,哈希值近似认为唯一

基本思想

  • 将字符串的前缀看作一个p进制数 ,其中p一般为131左边为高位,右边为低位(不要搞反了!!!)
  • 为了避免数值过大使用Q= 2 64 2^{64} 264来当作余数,一般使用unsigned long long,使用上溢操作来近似这一步。

实现

动态规划法初始化hash数组和指数

注意:s = '0' + s;// 0,n+1

cpp 复制代码
	for (int i = 1; i <= n; i++) {
		h[i] = h[i - 1] * 131 + s[i];
		p[i] = p[i - 1] * 131;
	}

获得任意子串[i,j]的字符串哈希

cpp 复制代码
ll query(int l, int r) {
	return h[r] - h[l-1] * p[r - l+1];
}
  • h[i-1],h[j]分别为[0,i-1],[0,j]部分的字符串对应的哈希值
  • 很显然将h[i-1]左移动j-i+1位就能与h[j]对齐 ,这样就能完美消去前i-1位数字,得到的剩余结果就是子串的哈希值。

例题

cpp 复制代码
int n, m;
int P = 131;
ll p[1000006] = { 1 }, h[1000006] = { 0 };
string a, b;
ll query(int l, int r) {
	return h[r] - h[l - 1] * p[r - l + 1];
}
void solve() {
	cin >> n >> a >> m >> b;
	a = '0' + a;
	b = '0' + b;
	for (int i = 1; i <= m; i++) {
		h[i] = h[i - 1] * P + b[i];
		p[i] = P * p[i - 1];
	}
	//for (int i = 1; i <= m; i++) {
	//	cout << h[i] << " " << p[i] << endl;
	//}
	ll hasha = 0;
	for (int i = 1; i <= n; i++) {
		hasha = hasha * P + a[i];
	}
	//cout << hasha << endl;

	for (int i = 1; i <= m - n +1 ; i++) {
		if (query(i, i + n - 1) == hasha) {
			cout << i-1 << " ";
		}
	}
}
相关推荐
SongYuLong的博客2 小时前
Linux IPC进程通信几种方法
linux·运维·算法
像污秽一样2 小时前
算法设计与分析-习题6.1
数据结构·算法
北京地铁1号线2 小时前
8.2 对比学习的损失函数
算法·机器学习·损失函数·对比学习
样例过了就是过了2 小时前
LeetCode热题100 分割回文串
数据结构·c++·算法·leetcode·深度优先·dfs
带娃的IT创业者3 小时前
WeClaw 心跳与重连实战:指数退避算法如何让 WebSocket 在弱网环境下的连接成功率提升 67%?
python·websocket·网络协议·算法·fastapi·实时通信
Morwit3 小时前
【力扣hot100】 85. 最大矩形
c++·算法·leetcode·职场和发展
艾醒3 小时前
MiniMax M2.5:从黑马到全球顶流的"前世今生"与趣闻
算法
m0_528174453 小时前
C++中的代理模式变体
开发语言·c++·算法
2401_883035464 小时前
C++代码风格检查工具
开发语言·c++·算法