【P2375 [NOI2014] 动物园】

P2375 [NOI2014] 动物园

题目描述

近日，园长发现动物园中好吃懒做的动物越来越多了。例如企鹅，只会卖萌向游客要吃的。为了整治动物园的不良风气，让动物们凭自己的真才实学向游客要吃的，园长决定开设算法班，让动物们学习算法。

某天，园长给动物们讲解 KMP 算法。

园长："对于一个字符串 S S S，它的长度为 L L L。我们可以在 O ( L ) O(L) O(L) 的时间内，求出一个名为 n e x t \mathrm{next} next 的数组。有谁预习了 n e x t \mathrm{next} next 数组的含义吗？"

熊猫："对于字符串 S S S 的前 i i i 个字符构成的子串，既是它的后缀又是它的前缀的字符串中（它本身除外），最长的长度记作 n e x t [ i ] \mathrm{next}[i] next[i]。"

园长："非常好！那你能举个例子吗？"

熊猫："例 S S S 为 abcababc \verb!abcababc! abcababc，则 n e x t [ 5 ] = 2 \mathrm{next}[5]=2 next[5]=2。因为 S S S 的前 5 5 5 个字符为 abcab \verb!abcab! abcab， ab \verb!ab! ab 既是它的后缀又是它的前缀，并且找不到一个更长的字符串满足这个性质。同理，还可得出 n e x t [ 1 ] = n e x t [ 2 ] = n e x t [ 3 ] = 0 \mathrm{next}[1] = \mathrm{next}[2] = \mathrm{next}[3] = 0 next[1]=next[2]=next[3]=0， n e x t [ 4 ] = n e x t [ 6 ] = 1 \mathrm{next}[4] = \mathrm{next}[6] = 1 next[4]=next[6]=1， n e x t [ 7 ] = 2 \mathrm{next}[7] = 2 next[7]=2， n e x t [ 8 ] = 3 \mathrm{next}[8] = 3 next[8]=3。"

园长表扬了认真预习的熊猫同学。随后，他详细讲解了如何在 O ( L ) O(L) O(L) 的时间内求出 n e x t \mathrm{next} next 数组。

下课前，园长提出了一个问题："KMP 算法只能求出 n e x t \mathrm{next} next 数组。我现在希望求出一个更强大 n u m \mathrm{num} num 数组一一对于字符串 S S S 的前 i i i 个字符构成的子串，既是它的后缀同时又是它的前缀，并且该后缀与该前缀不重叠，将这种字符串的数量记作 n u m [ i ] \mathrm{num}[i] num[i]。例如 S S S 为 aaaaa \verb!aaaaa! aaaaa，则 n u m [ 4 ] = 2 \mathrm{num}[4] = 2 num[4]=2。这是因为 S S S 的前 4 4 4 个字符为 aaaa \verb!aaaa! aaaa，其中 a \verb!a! a 和 aa \verb!aa! aa 都满足性质'既是后缀又是前缀'，同时保证这个后缀与这个前缀不重叠。而 aaa \verb!aaa! aaa 虽然满足性质'既是后缀又是前缀'，但遗憾的是这个后缀与这个前缀重叠了，所以不能计算在内。同理， n u m [ 1 ] = 0 , n u m [ 2 ] = n u m [ 3 ] = 1 , n u m [ 5 ] = 2 \mathrm{num}[1] = 0,\mathrm{num}[2] = \mathrm{num}[3] = 1,\mathrm{num}[5] = 2 num[1]=0,num[2]=num[3]=1,num[5]=2。"

最后，园长给出了奖励条件，第一个做对的同学奖励巧克力一盒。听了这句话，睡了一节课的企鹅立刻就醒过来了！但企鹅并不会做这道题，于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出 n u m \mathrm{num} num 数组呢？

特别地，为了避免大量的输出，你不需要输出 n u m [ i ] \mathrm{num}[i] num[i] 分别是多少，你只需要输出所有 ( n u m [ i ] + 1 ) (\mathrm{num}[i]+1) (num[i]+1) 的乘积，对 10 9 + 7 10^9 + 7 109+7 取模的结果即可。

输入格式

第 1 1 1 行仅包含一个正整数 n n n，表示测试数据的组数。

随后 n n n 行，每行描述一组测试数据。每组测试数据仅含有一个字符串 S S S， S S S 的定义详见题目描述。数据保证 S S S 中仅含小写字母。输入文件中不会包含多余的空行，行末不会存在多余的空格。

输出格式

包含 n n n 行，每行描述一组测试数据的答案，答案的顺序应与输入数据的顺序保持一致。对于每组测试数据，仅需要输出一个整数，表示这组测试数据的答案对 10 9 + 7 10^9+7 109+7 取模的结果。输出文件中不应包含多余的空行。

输入输出样例 #1

输入 #1

复制代码

3
aaaaa
ab
abcababc

输出 #1

复制代码

36
1
32

说明/提示

测试点编号	约定
1	n ≤ 5 , L ≤ 50 n \le 5, L \le 50 n≤5,L≤50
2	n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200
3	n ≤ 5 , L ≤ 200 n \le 5, L \le 200 n≤5,L≤200
4	n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000
5	n ≤ 5 , L ≤ 10 , 000 n \le 5, L \le 10,000 n≤5,L≤10,000
6	n ≤ 5 , L ≤ 100 , 000 n \le 5, L \le 100,000 n≤5,L≤100,000
7	n ≤ 5 , L ≤ 200 , 000 n \le 5, L \le 200,000 n≤5,L≤200,000
8	n ≤ 5 , L ≤ 500 , 000 n \le 5, L \le 500,000 n≤5,L≤500,000
9	n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000
10	n ≤ 5 , L ≤ 1 , 000 , 000 n \le 5, L \le 1,000,000 n≤5,L≤1,000,000

50分代码

cpp 复制代码

#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度 
	mod=1e9+7;
int n,
	kmp[N],//公共前后缀长度，N个字符子串的最大前后缀子串(有相同的后缀子串，如abcab，前缀ab==后缀ab)长度(kmp[5]=2)
	tot[N];//合法公共前后缀总数（仅满足公共前后缀基本定义，允许重叠；空串也算一种合法项）
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数，组合数学的乘法原理 
int main(){
	//freopen("data.cpp","r",stdin);
	cin>>n;
	while(n--){
		memset(kmp,0,sizeof(kmp));
		memset(tot,0,sizeof(tot));
		tot[1]=1;//没有合法公共前后缀也是一种状态
		cnt=1;//不选也是一种方案 
		cin>>s;
		for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符（i从1开始），计算每个前缀的kmp和tot值；j初始为0（表示空前缀长度）
			/*
			如果
			i长子串后第一个位置------也就是第i个位置的字符s[i]
			不等于
			j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
			则需要回溯j，j长最长公共前后缀子串的最长公共前后缀长kmp[j] 
			*/
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符 
			kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j（若字符匹配则j是前序长度+1，不匹配则j不变）
			tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
			//这+1是新增当前前缀的独立合法项（可理解为计入空项/新增非空公共前后缀，确保计数完整）
		}
		for(int i=1,j=0;i<s.length();i++){
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;
			while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠，公共前后缀长度的2倍多于子串长度，则回溯最长公共前后缀的最长公共前后缀 
			cnt=cnt*(tot[j]+1)%mod;//总组合数 *（长度为j的前缀的合法公共前后缀总数 + 1），取模防止溢出
			//不选也是种状态 
		}
		cout<<cnt<<endl;
		/*
		第一个盒子有1个标签（空标签，对应 tot[j]=1）：
		    状况数 = 选标签的情况（贴空标签） + 不贴任何标签 = 1 + 1 = 3 种
		第二个盒子有2个标签（空标签+1个非空标签，对应 tot[j]=2）：
		    状况数 = 选标签的情况（贴空标签、贴非空标签1） + 不贴任何标签 = 2 + 1 = 4 种
		第三个盒子有3个标签（空标签+2个非空标签，对应 tot[j]=3）：
		    状况数 = 选标签的情况（贴空标签、贴非空标签1、贴非空标签2） + 不贴任何标签 = 3 + 1 = 5 种
		总组合数 = 3*4*5（乘法原理，每个盒子的独立方案数相乘，结果正确）
		*/
	}
	return 0;
}

AC代码

cpp 复制代码

#include <bits/stdc++.h>
using namespace std;
const int N=1e6+1,//字符串最大长度 
	mod=1e9+7;
int n,
	kmp[N],//公共前后缀长度，N个字符子串的最大前后缀子串(有相同的后缀子串，如abcab，前缀ab==后缀ab)长度(kmp[5]=2)
	tot[N];//合法公共前后缀总数（仅满足公共前后缀基本定义，允许重叠；空串也算一种合法项）
string s;
long long int cnt;//所有前缀子串的合法公共前后缀(空串也是一种)的组合数，组合数学的乘法原理 
int main(){
	//freopen("data.cpp","r",stdin);
	cin>>n;
	while(n--){
		memset(kmp,0,sizeof(kmp));
		memset(tot,0,sizeof(tot));
		tot[1]=1;//没有合法公共前后缀也是一种状态
		cnt=1;//不选也是一种方案 
		cin>>s;
		for(int i=1,j=0;i<s.length();i++){//遍历字符串s的字符（i从1开始），计算每个前缀的kmp和tot值；j初始为0（表示空前缀长度）
			/*
			如果
			i长子串后第一个位置------也就是第i个位置的字符s[i]
			不等于
			j长公共前后缀后第一个位置------也就是第j个位置的字符s[j]
			则需要回溯j，j长最长公共前后缀子串的最长公共前后缀长kmp[j] 
			*/
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;//公共前后缀j后第1字符(也就是第j位置)字符==i长字符串后第1字符(也就是第i位置)字符 
			kmp[i+1]=j;//i+1长子串的最长公共前后缀长度为j（若字符匹配则j是前序长度+1，不匹配则j不变）
			tot[i+1]=tot[j]+1;//i+1长子串的公共前后缀总数=i+1长子串的最长公共前后缀------j长子串的公共前后缀数+1
			//这+1是新增当前前缀的独立合法项（可理解为计入空项/新增非空公共前后缀，确保计数完整）
		}
		for(int i=1,j=0;i<s.length();i++){
			while(j&&s[j]!=s[i])j=kmp[j];
			if(s[j]==s[i])j++;
			while(j*2>i+1)j=kmp[j];//如果公共前后缀重叠，公共前后缀长度的2倍多于子串长度，则回溯最长公共前后缀的最长公共前后缀 
			cnt=cnt*(tot[j]+1)%mod;//总组合数 *（长度为j的前缀的合法公共前后缀总数 + 1），取模防止溢出
			//不选也是种状态 
		}
		cout<<cnt<<endl;
	}
	return 0;
}

总结

1.KMP就是找i长字符串最长相同前后缀的长度j，而i字符串后的第一个字符位置就是i，要跟最长相同前后缀字符串的第一个字符就是j位置比较，从而扩充。

2.这个长度即使长度，又是下一个位置，挺有趣的。