【P2375 [NOI2014] 动物园】

P2375 [NOI2014] 动物园

题目描述

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

某天,园长给动物们讲解 KMP 算法。

园长:"对于一个字符串 S S S,它的长度为 L L L。我们可以在 O ( L ) O(L) O(L) 的时间内,求出一个名为 n e x t \mathrm{next} next 的数组。有谁预习了 n e x t \mathrm{next} next 数组的含义吗?"

熊猫:"对于字符串 S S S 的前 i i i 个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作 n e x t [ i ] \mathrm{next}[i] next[i]。"

园长:"非常好!那你能举个例子吗?"

熊猫:"例 S S S 为 abcababc \verb!abcababc! abcababc,则 n e x t [ 5 ] = 2 \mathrm{next}[5]=2 next[5]=2。因为 S S S 的前 5 5 5 个字符为 abcab \verb!abcab! abcab, ab \verb!ab! ab 既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 n e x t [ 1 ] = n e x t [ 2 ] = n e x t [ 3 ] = 0 \mathrm{next}[1] = \mathrm{next}[2] = \mathrm{next}[3] = 0 next[1]=next[2]=next[3]=0, n e x t [ 4 ] = n e x t [ 6 ] = 1 \mathrm{next}[4] = \mathrm{next}[6] = 1 next[4]=next[6]=1, n e x t [ 7 ] = 2 \mathrm{next}[7] = 2 next[7]=2, n e x t [ 8 ] = 3 \mathrm{next}[8] = 3 next[8]=3。"

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在 O ( L ) O(L) O(L) 的时间内求出 n e x t \mathrm{next} next 数组。

下课前,园长提出了一个问题:"KMP 算法只能求出 n e x t \mathrm{next} next 数组。我现在希望求出一个更强大 n u m \mathrm{num} num 数组一一对于字符串 S S S 的前 i i i 个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作 n u m [ i ] \mathrm{num}[i] num[i]。例如 S S S 为 aaaaa \verb!aaaaa! aaaaa,则 n u m [ 4 ] = 2 \mathrm{num}[4] = 2 num[4]=2。这是因为 S S S 的前 4 4 4 个字符为 aaaa \verb!aaaa! aaaa,其中 a \verb!a! a 和 aa \verb!aa! aa 都满足性质'既是后缀又是前缀',同时保证这个后缀与这个前缀不重叠。而 aaa \verb!aaa! aaa 虽然满足性质'既是后缀又是前缀',但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理, n u m [ 1 ] = 0 , n u m [ 2 ] = n u m [ 3 ] = 1 , n u m [ 5 ] = 2 \mathrm{num}[1] = 0,\mathrm{num}[2] = \mathrm{num}[3] = 1,\mathrm{num}[5] = 2 num[1]=0,num[2]=num[3]=1,num[5]=2。"

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出 n u m \mathrm{num} num 数组呢?

特别地,为了避免大量的输出,你不需要输出 n u m [ i ] \mathrm{num}[i] num[i] 分别是多少,你只需要输出所有 ( n u m [ i ] + 1 ) (\mathrm{num}[i]+1) (num[i]+1) 的乘积,对 10 9 + 7 10^9 + 7 109+7 取模的结果即可。

输入格式

第 1 1 1 行仅包含一个正整数 n n n,表示测试数据的组数。

随后 n n n 行,每行描述一组测试数据。每组测试数据仅含有一个字符串 S S S, S S S 的定义详见题目描述。数据保证 S S S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出格式

包含 n n n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 10 9 + 7 10^9+7 109+7 取模的结果。输出文件中不应包含多余的空行。

输入输出样例 #1

输入 #1

复制代码
3
aaaaa
ab
abcababc

输出 #1

复制代码
36
1
32

说明/提示

测试点编号 约定
1 n ≤ 5 , L ≤ 50 n \le 5, L \le 50 n≤5,L≤50
2 n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200
3 n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200
4 n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000
5 n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000
6 n ≤ 5 , L ≤ 100 , 000 n \le 5, L \le 100,000 n≤5,L≤100,000
7 n ≤ 5 , L ≤ 200 , 000 n \le 5, L \le 200,000 n≤5,L≤200,000
8 n ≤ 5 , L ≤ 500 , 000 n \le 5, L \le 500,000 n≤5,L≤500,000
9 n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000
10 n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000

50分代码

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度 
	mod=1e9+7;
int n,
	kmp[N],//公共前后缀长度,N个字符子串的最大前后缀子串(有相同的后缀子串,如abcab,前缀ab==后缀ab)长度(kmp[5]=2)
	tot[N];//合法公共前后缀总数(仅满足公共前后缀基本定义,允许重叠;空串也算一种合法项)
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数,组合数学的乘法原理 
int main(){
	//freopen("data.cpp","r",stdin);
	cin>>n;
	while(n--){
		memset(kmp,0,sizeof(kmp));
		memset(tot,0,sizeof(tot));
		tot[1]=1;//没有合法公共前后缀也是一种状态
		cnt=1;//不选也是一种方案 
		cin>>s;
		for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符(i从1开始),计算每个前缀的kmp和tot值;j初始为0(表示空前缀长度)
			/*
			如果
			i长子串后第一个位置------也就是第i个位置的字符s[i]
			不等于
			j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
			则需要回溯j,j长最长公共前后缀子串的最长公共前后缀长kmp[j] 
			*/
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符 
			kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j(若字符匹配则j是前序长度+1,不匹配则j不变)
			tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
			//这+1是新增当前前缀的独立合法项(可理解为计入空项/新增非空公共前后缀,确保计数完整)
		}
		for(int i=1,j=0;i<s.length();i++){
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;
			while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠,公共前后缀长度的2倍多于子串长度,则回溯最长公共前后缀的最长公共前后缀 
			cnt=cnt*(tot[j]+1)%mod;//总组合数 *(长度为j的前缀的合法公共前后缀总数 + 1),取模防止溢出
			//不选也是种状态 
		}
		cout<<cnt<<endl;
		/*
		第一个盒子有1个标签(空标签,对应 tot[j]=1):
		    状况数 = 选标签的情况(贴空标签) + 不贴任何标签 = 1 + 1 = 3 种
		第二个盒子有2个标签(空标签+1个非空标签,对应 tot[j]=2):
		    状况数 = 选标签的情况(贴空标签、贴非空标签1) + 不贴任何标签 = 2 + 1 = 4 种
		第三个盒子有3个标签(空标签+2个非空标签,对应 tot[j]=3):
		    状况数 = 选标签的情况(贴空标签、贴非空标签1、贴非空标签2) + 不贴任何标签 = 3 + 1 = 5 种
		总组合数 = 3*4*5(乘法原理,每个盒子的独立方案数相乘,结果正确)
		*/
	}
	return 0;
}

AC代码

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度 
	mod=1e9+7;
int n,
	kmp[N],//公共前后缀长度,N个字符子串的最大前后缀子串(有相同的后缀子串,如abcab,前缀ab==后缀ab)长度(kmp[5]=2)
	tot[N];//合法公共前后缀总数(仅满足公共前后缀基本定义,允许重叠;空串也算一种合法项)
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数,组合数学的乘法原理 
int main(){
	//freopen("data.cpp","r",stdin);
	cin>>n;
	while(n--){
		memset(kmp,0,sizeof(kmp));
		memset(tot,0,sizeof(tot));
		tot[1]=1;//没有合法公共前后缀也是一种状态
		cnt=1;//不选也是一种方案 
		cin>>s;
		for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符(i从1开始),计算每个前缀的kmp和tot值;j初始为0(表示空前缀长度)
			/*
			如果
			i长子串后第一个位置------也就是第i个位置的字符s[i]
			不等于
			j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
			则需要回溯j,j长最长公共前后缀子串的最长公共前后缀长kmp[j] 
			*/
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符 
			kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j(若字符匹配则j是前序长度+1,不匹配则j不变)
			tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
			//这+1是新增当前前缀的独立合法项(可理解为计入空项/新增非空公共前后缀,确保计数完整)
		}
		for(int i=1,j=0;i<s.length();i++){
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;
			while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠,公共前后缀长度的2倍多于子串长度,则回溯最长公共前后缀的最长公共前后缀 
			cnt=cnt*(tot[j]+1)%mod;//总组合数 *(长度为j的前缀的合法公共前后缀总数 + 1),取模防止溢出
			//不选也是种状态 
		}
		cout<<cnt<<endl;
	}
	return 0;
}

总结

1.KMP就是找i长字符串最长相同前后缀的长度j,而i字符串后的第一个字符位置就是i,要跟最长相同前后缀字符串的第一个字符就是j位置比较,从而扩充。

2.这个长度即使长度,又是下一个位置,挺有趣的。

相关推荐
heeheeai5 个月前
kotlin kmp 跨平台环境使用sqldelight
数据库·kotlin·kmp·start·sqldelight
_不会dp不改名_6 个月前
华为OD 最小循环子数组
算法·华为od·kmp
heeheeai7 个月前
kotlin kmp 副作用函数 effect
kotlin·effect·kmp·副作用函数
MZWeiei7 个月前
KMP 算法中 next 数组的构建函数 get_next
算法·kmp
陈旭金-小金子7 个月前
Kotlin MultiPlatform 跨平台版本的记账 App
kotlin·kmp
wangz768 个月前
kotlin的kmp编程中遇到Unresolved reference ‘java‘问题
kotlin·kmp
fundroid9 个月前
2025 跨平台技术如何选:KMP 与 Flutter 的核心差异
flutter·kotlin·kmp
丶Darling.9 个月前
26考研 | 王道 | 数据结构 | 第四章 串
数据结构·考研·kmp
滨HI010 个月前
1140:验证子串--next.data()、KMP和find
蓝桥杯·kmp