P10474 [ICPC 2011 Beijing R] Matrix 矩阵哈希

题意分析

有一个01构成的大矩阵,还有一些小矩阵,问小矩阵在大矩阵中是否出现过。

求解思路

(1)暴力匹配 时间复杂度太高
(2)利用hash计算,大矩阵中每一个A*B的小矩阵的hash值,再与每一个小矩阵的hash值匹配,若有相等的,即证明找到了相同的。

原矩阵 (M×N) → 预处理所有 A×B 子矩阵的哈希值 → 存入map

查询矩阵 (A×B) → 计算查询矩阵的哈希值 → 在map中查找 → 输出结果

关键点:如何在大矩阵中计算每一个A*B的小矩阵的hash值?

这是一个二维hash的计算啊, 这时你想到了什么?是不是跟二位前缀和很像啊,借助二维前缀和的思想来解决这道题。

第一步:先计算行方向的hash值。

行方向哈希(一维前缀哈希)

cpp 复制代码
Hash[i][j] = Hash[i][j-1] × BASE1 + a[i][j]

Hashij 表示第 i 行前 j 个字符的哈希值。

第二步:再上一步的基础上,计算列方向的hash值。

这时 Hashij 表示从 (1,1) 到 (i,j) 的矩形哈希值

cpp 复制代码
Hash[i][j] = Hash[i-1][j] × BASE2 + Hash[i][j] (行哈希值)

这里为了避免冲突,行和列和BASE选择了不同的

第三步:计算A*B的子矩阵的hash值。

容斥原理

子矩阵的hash值 = Hashij - Hashi-Aj × Base2A - Hashij-B × Base1B + Hashi-Aj-B × Base2A × Base1B

BASE2a 的作用:将上面部分的权重"提升"到正确的位置

BASE1b 的作用:将左面部分的权重"提升"到正确的位置
记住: 哈希公式中的每个幂次都是为了"对齐权重",让减法和加法能够正确进行!

代码实现

cpp 复制代码
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ULL;
const unsigned long long p1=131,p2=139;
const int N=1009;
unsigned long long h[N][N],h1[N][N],pow1[N],pow2[N];
int c[N][N],d[N][N];
map<ULL,bool>mapp;
int main()
{
	int a,b,n,m;
	cin>>n>>m>>a>>b;
	for(int i=1;i<=n;i++)
	{
		for(int j=1;j<=m;j++)
		{
			scanf("%1d",&c[i][j]);
		}
	}
	//1.计算每行的hash值 
	for(int i=1;i<=n;i++)
	{
		for(int j=1;j<=m;j++)
		{
			h[i][j]=h[i][j-1]*p1+c[i][j];
             
		}
	}
	//2.计算(1,1)到(i,j)的hash值
	for(int i=1;i<=n;i++)
	{
		for(int j=1;j<=m;j++)
		{
			h[i][j]=h[i-1][j]*p2+h[i][j];
		}
	} 
	//3.预处理pow1,pow2的值。
	pow1[0]=pow2[0]=1; 
	for(int i=1;i<=n;i++)  pow1[i]=pow1[i-1]*p1;
	for(int i=1;i<=m;i++)  pow2[i]=pow2[i-1]*p2;
	//4.预处理出大矩阵中每一个A*B的小矩阵hash值,用map记录
	for(int i=a;i<=n;i++)
	{
		for(int j=b;j<=m;j++)
		{
			ULL res=h[i][j]-h[i-a][j]*pow2[a]-h[i][j-b]*pow1[b]+h[i-a][j-b]*pow2[a]*pow1[b];
		    mapp[res]=1;
		}
	 } 
	 //5.查询hash值是否存在
	 int q;
	 cin>>q;
	 while(q--)
	 {
	 	ULL ans=0;
	 	for(int i=1;i<=a;i++)
		{
			for(int j=1;j<=b;j++)
			{
				scanf("%1d",&d[i][j]);
			}
		}
		for(int i=1;i<=a;i++)
          for(int j=1;j<=b;j++)
            h1[i][j]=h1[i][j-1]*p1+d[i][j];
        for(int i=1;i<=a;i++)
          for(int j=1;j<=b;j++)
            h1[i][j]=h1[i-1][j]*p2+h1[i][j];
        
        ans=h1[a][b];
		if(mapp[ans])  cout<<"1"<<endl;
		else cout<<"0"<<endl;
	  } 
	 
 } 

我的bug

bug1:读入,01矩阵我用cin读的,读入错误

方法一:

cpp 复制代码
string s;
cin >> s;
c[i][j] = s[j-1] - '0';

方法二:

cpp 复制代码
scanf("%1d",&d[i][j]);

bug2:pow10没有初始化

cpp 复制代码
pow1[0]=pow2[0]=1; 
for(int i=1;i<=n;i++)  pow1[i]=pow1[i-1]*p1;
for(int i=1;i<=m;i++)  pow2[i]=pow2[i-1]*p2;
相关推荐
TDengine (老段)3 小时前
TDengine 连接算子 — Inner/Outer/ASOF/Window Join 的实现与使用
大数据·数据库·物联网·哈希算法·时序数据库·tdengine·涛思数据
青山木5 小时前
Hot 100 --- 缺失的第一个正数
算法·leetcode·哈希算法
阿泽·黑核8 小时前
05 keyflow 扩展设计方案:矩阵键盘/组合键/事件队列/中断驱动
线性代数·矩阵·计算机外设·嵌入式·agent·vibe coding
工头阿乐8 小时前
相机坐标系标定与外参矩阵求解
数码相机·线性代数·矩阵
牛油果子哥q11 小时前
unordered_set / unordered_map 底层哈希表精讲,哈希原理、哈希冲突、链地址法、源码结构、有序与无序容器终极选型全解
数据结构·算法·哈希算法·散列表
牛油果子哥q11 小时前
哈希表经典刷题模型与布隆过滤器精讲,哈希查重、哈希计数、双哈希映射、误判原理与工业级落地应用
数据结构·算法·哈希算法·散列表
金色熊族1 天前
QTransform使用心得(二)--仿射变换、非仿射变换、矩阵
qt·线性代数·矩阵
临沂堇1 天前
刷题日志 | Leetcode Hot 100 哈希
算法·leetcode·哈希算法
数据法师1 天前
视频文件重复检测工具:基于哈希与视频指纹的三级筛选机制
算法·音视频·哈希算法