算法·字符串哈希

字符串哈希 (字符串前缀哈希法)

用法:查询任意子串的哈希值,哈希值近似认为唯一

基本思想

  • 将字符串的前缀看作一个p进制数 ,其中p一般为131左边为高位,右边为低位(不要搞反了!!!)
  • 为了避免数值过大使用Q= 2 64 2^{64} 264来当作余数,一般使用unsigned long long,使用上溢操作来近似这一步。

实现

动态规划法初始化hash数组和指数

注意:s = '0' + s;// 0,n+1

cpp 复制代码
	for (int i = 1; i <= n; i++) {
		h[i] = h[i - 1] * 131 + s[i];
		p[i] = p[i - 1] * 131;
	}

获得任意子串[i,j]的字符串哈希

cpp 复制代码
ll query(int l, int r) {
	return h[r] - h[l-1] * p[r - l+1];
}
  • h[i-1],h[j]分别为[0,i-1],[0,j]部分的字符串对应的哈希值
  • 很显然将h[i-1]左移动j-i+1位就能与h[j]对齐 ,这样就能完美消去前i-1位数字,得到的剩余结果就是子串的哈希值。

例题

cpp 复制代码
int n, m;
int P = 131;
ll p[1000006] = { 1 }, h[1000006] = { 0 };
string a, b;
ll query(int l, int r) {
	return h[r] - h[l - 1] * p[r - l + 1];
}
void solve() {
	cin >> n >> a >> m >> b;
	a = '0' + a;
	b = '0' + b;
	for (int i = 1; i <= m; i++) {
		h[i] = h[i - 1] * P + b[i];
		p[i] = P * p[i - 1];
	}
	//for (int i = 1; i <= m; i++) {
	//	cout << h[i] << " " << p[i] << endl;
	//}
	ll hasha = 0;
	for (int i = 1; i <= n; i++) {
		hasha = hasha * P + a[i];
	}
	//cout << hasha << endl;

	for (int i = 1; i <= m - n +1 ; i++) {
		if (query(i, i + n - 1) == hasha) {
			cout << i-1 << " ";
		}
	}
}
相关推荐
Dlrb12116 小时前
C语言-指针三
c语言·算法·指针·const·命令行参数
Tisfy7 小时前
LeetCode 2540.最小公共值:双指针(O(m+n))
算法·leetcode·题解·双指针
IronMurphy7 小时前
【算法四十七】152. 乘积最大子数组
算法
淘矿人8 小时前
Claude辅助DevOps实践
java·大数据·运维·人工智能·算法·bug·devops
Cosolar8 小时前
万字详解:RAG 向量索引算法与向量数据库架构及实战
数据库·人工智能·算法·数据库架构·milvus
落羽的落羽10 小时前
【算法札记】练习 | Week4
linux·服务器·数据结构·c++·人工智能·算法·动态规划
萑澈10 小时前
算法竞赛入门:C++ STL核心用法与时空复杂度速查手册
数据结构·c++·算法·stl
Godspeed Zhao11 小时前
从零开始学AI16——SVM
算法·机器学习·支持向量机
江屿风11 小时前
C++OJ题经验总结(竞赛)1
开发语言·c++·笔记·算法