P2375 [NOI2014] 动物园
题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解 KMP 算法。
园长:"对于一个字符串 S S S,它的长度为 L L L。我们可以在 O ( L ) O(L) O(L) 的时间内,求出一个名为 n e x t \mathrm{next} next 的数组。有谁预习了 n e x t \mathrm{next} next 数组的含义吗?"
熊猫:"对于字符串 S S S 的前 i i i 个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作 n e x t [ i ] \mathrm{next}[i] next[i]。"
园长:"非常好!那你能举个例子吗?"
熊猫:"例 S S S 为 abcababc \verb!abcababc! abcababc,则 n e x t [ 5 ] = 2 \mathrm{next}[5]=2 next[5]=2。因为 S S S 的前 5 5 5 个字符为 abcab \verb!abcab! abcab, ab \verb!ab! ab 既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 n e x t [ 1 ] = n e x t [ 2 ] = n e x t [ 3 ] = 0 \mathrm{next}[1] = \mathrm{next}[2] = \mathrm{next}[3] = 0 next[1]=next[2]=next[3]=0, n e x t [ 4 ] = n e x t [ 6 ] = 1 \mathrm{next}[4] = \mathrm{next}[6] = 1 next[4]=next[6]=1, n e x t [ 7 ] = 2 \mathrm{next}[7] = 2 next[7]=2, n e x t [ 8 ] = 3 \mathrm{next}[8] = 3 next[8]=3。"
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在 O ( L ) O(L) O(L) 的时间内求出 n e x t \mathrm{next} next 数组。
下课前,园长提出了一个问题:"KMP 算法只能求出 n e x t \mathrm{next} next 数组。我现在希望求出一个更强大 n u m \mathrm{num} num 数组一一对于字符串 S S S 的前 i i i 个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作 n u m [ i ] \mathrm{num}[i] num[i]。例如 S S S 为 aaaaa \verb!aaaaa! aaaaa,则 n u m [ 4 ] = 2 \mathrm{num}[4] = 2 num[4]=2。这是因为 S S S 的前 4 4 4 个字符为 aaaa \verb!aaaa! aaaa,其中 a \verb!a! a 和 aa \verb!aa! aa 都满足性质'既是后缀又是前缀',同时保证这个后缀与这个前缀不重叠。而 aaa \verb!aaa! aaa 虽然满足性质'既是后缀又是前缀',但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理, n u m [ 1 ] = 0 , n u m [ 2 ] = n u m [ 3 ] = 1 , n u m [ 5 ] = 2 \mathrm{num}[1] = 0,\mathrm{num}[2] = \mathrm{num}[3] = 1,\mathrm{num}[5] = 2 num[1]=0,num[2]=num[3]=1,num[5]=2。"
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出 n u m \mathrm{num} num 数组呢?
特别地,为了避免大量的输出,你不需要输出 n u m [ i ] \mathrm{num}[i] num[i] 分别是多少,你只需要输出所有 ( n u m [ i ] + 1 ) (\mathrm{num}[i]+1) (num[i]+1) 的乘积,对 10 9 + 7 10^9 + 7 109+7 取模的结果即可。
输入格式
第 1 1 1 行仅包含一个正整数 n n n,表示测试数据的组数。
随后 n n n 行,每行描述一组测试数据。每组测试数据仅含有一个字符串 S S S, S S S 的定义详见题目描述。数据保证 S S S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出格式
包含 n n n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 10 9 + 7 10^9+7 109+7 取模的结果。输出文件中不应包含多余的空行。
输入输出样例 #1
输入 #1
3
aaaaa
ab
abcababc
输出 #1
36
1
32
说明/提示
| 测试点编号 | 约定 |
|---|---|
| 1 | n ≤ 5 , L ≤ 50 n \le 5, L \le 50 n≤5,L≤50 |
| 2 | n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200 |
| 3 | n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200 |
| 4 | n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000 |
| 5 | n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000 |
| 6 | n ≤ 5 , L ≤ 100 , 000 n \le 5, L \le 100,000 n≤5,L≤100,000 |
| 7 | n ≤ 5 , L ≤ 200 , 000 n \le 5, L \le 200,000 n≤5,L≤200,000 |
| 8 | n ≤ 5 , L ≤ 500 , 000 n \le 5, L \le 500,000 n≤5,L≤500,000 |
| 9 | n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000 |
| 10 | n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000 |
50分代码
cpp
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度
mod=1e9+7;
int n,
kmp[N],//公共前后缀长度,N个字符子串的最大前后缀子串(有相同的后缀子串,如abcab,前缀ab==后缀ab)长度(kmp[5]=2)
tot[N];//合法公共前后缀总数(仅满足公共前后缀基本定义,允许重叠;空串也算一种合法项)
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数,组合数学的乘法原理
int main(){
//freopen("data.cpp","r",stdin);
cin>>n;
while(n--){
memset(kmp,0,sizeof(kmp));
memset(tot,0,sizeof(tot));
tot[1]=1;//没有合法公共前后缀也是一种状态
cnt=1;//不选也是一种方案
cin>>s;
for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符(i从1开始),计算每个前缀的kmp和tot值;j初始为0(表示空前缀长度)
/*
如果
i长子串后第一个位置------也就是第i个位置的字符s[i]
不等于
j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
则需要回溯j,j长最长公共前后缀子串的最长公共前后缀长kmp[j]
*/
while(j&&s[j]!=s[i])j=kmp[j];
if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符
kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j(若字符匹配则j是前序长度+1,不匹配则j不变)
tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
//这+1是新增当前前缀的独立合法项(可理解为计入空项/新增非空公共前后缀,确保计数完整)
}
for(int i=1,j=0;i<s.length();i++){
while(j&&s[j]!=s[i])j=kmp[j];
if(s[j]==s[i])j++;
while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠,公共前后缀长度的2倍多于子串长度,则回溯最长公共前后缀的最长公共前后缀
cnt=cnt*(tot[j]+1)%mod;//总组合数 *(长度为j的前缀的合法公共前后缀总数 + 1),取模防止溢出
//不选也是种状态
}
cout<<cnt<<endl;
/*
第一个盒子有1个标签(空标签,对应 tot[j]=1):
状况数 = 选标签的情况(贴空标签) + 不贴任何标签 = 1 + 1 = 3 种
第二个盒子有2个标签(空标签+1个非空标签,对应 tot[j]=2):
状况数 = 选标签的情况(贴空标签、贴非空标签1) + 不贴任何标签 = 2 + 1 = 4 种
第三个盒子有3个标签(空标签+2个非空标签,对应 tot[j]=3):
状况数 = 选标签的情况(贴空标签、贴非空标签1、贴非空标签2) + 不贴任何标签 = 3 + 1 = 5 种
总组合数 = 3*4*5(乘法原理,每个盒子的独立方案数相乘,结果正确)
*/
}
return 0;
}
AC代码
cpp
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度
mod=1e9+7;
int n,
kmp[N],//公共前后缀长度,N个字符子串的最大前后缀子串(有相同的后缀子串,如abcab,前缀ab==后缀ab)长度(kmp[5]=2)
tot[N];//合法公共前后缀总数(仅满足公共前后缀基本定义,允许重叠;空串也算一种合法项)
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数,组合数学的乘法原理
int main(){
//freopen("data.cpp","r",stdin);
cin>>n;
while(n--){
memset(kmp,0,sizeof(kmp));
memset(tot,0,sizeof(tot));
tot[1]=1;//没有合法公共前后缀也是一种状态
cnt=1;//不选也是一种方案
cin>>s;
for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符(i从1开始),计算每个前缀的kmp和tot值;j初始为0(表示空前缀长度)
/*
如果
i长子串后第一个位置------也就是第i个位置的字符s[i]
不等于
j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
则需要回溯j,j长最长公共前后缀子串的最长公共前后缀长kmp[j]
*/
while(j&&s[j]!=s[i])j=kmp[j];
if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符
kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j(若字符匹配则j是前序长度+1,不匹配则j不变)
tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
//这+1是新增当前前缀的独立合法项(可理解为计入空项/新增非空公共前后缀,确保计数完整)
}
for(int i=1,j=0;i<s.length();i++){
while(j&&s[j]!=s[i])j=kmp[j];
if(s[j]==s[i])j++;
while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠,公共前后缀长度的2倍多于子串长度,则回溯最长公共前后缀的最长公共前后缀
cnt=cnt*(tot[j]+1)%mod;//总组合数 *(长度为j的前缀的合法公共前后缀总数 + 1),取模防止溢出
//不选也是种状态
}
cout<<cnt<<endl;
}
return 0;
}
总结
1.KMP就是找i长字符串最长相同前后缀的长度j,而i字符串后的第一个字符位置就是i,要跟最长相同前后缀字符串的第一个字符就是j位置比较,从而扩充。
2.这个长度即使长度,又是下一个位置,挺有趣的。