字符串(题解)
题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
一句话题意 :我们会处理kmp算法中的fail[]数组,来记录[1, i ]的真前后缀的最大值。现要求求解num[]数组,用来记录[1,i ]的不重合(长度<=½)的前后缀个数。需要输出(num[1]+1)(num[2]+1)(num[3]+1)......(num[l]+1).
输入格式
第 1 行仅包含一个正整数 n,表示测试数据的组数。
随后 n行,每行描述一组测试数据。每组测试数据仅含有一个字符串 S,S 的定义详见题目描述。
数据保证 S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出格式
包含 n 行,每行输出答案对1e9+7取模的结果。
样例
输入数据 1
3
aaaaa
ab
abcababc
Copy
输出数据 1
36
1
32
Copy
数据规模与约定
多组数据:t<=5,n<=1e6
思路
我想着先用普通的KMP算法求出fail[]数组,最后在每一位时向前跳fail[],只要跳到 ½·i 的位置就将
答案 +1 ,最后再将答案累乘。
然后觉得算法太劣了,所以就记录了sum[]数组,用来记录 [1, i ]的所有真前后缀的匹配个数,再求
fail[]就可以用:sum[i]=sum[j]+1 递推求出。
但是如果给你1e6个a,程序会被卡到接近n方,直接爆掉。所以想到 j 再跳 fail[] 时,可以限定 j 的
范围,让 j 一直保持在 ½·i 的位置,这样想计算时,每次 j 跳的次数不超过两次(均摊)。
AC代码
#include<bits/stdc++.h>
#define SIZE 100
#define mod 1000000007
#define ri register int
using namespace std;
char buf[SIZE],*p1=buf,*p2=buf;
inline int gc(){return (p1==p2)&&(p2=(p1=buf)+fread(buf,1,SIZE,stdin),p1==p2)?EOF:*p1++;}
const int N=1e6+2;
int n,ne[N],sum[N];
long long ans;
char a[N];
int main(){
cin>>n;
while(n--){
int l=0;char ch;
ans=1;sum[0]=0; sum[1]=1;
memset(ne,0,sizeof(ne));
while(!islower(ch=gc()));
while(islower(ch)){a[++l]=ch;ch=gc();}
for(ri i=2,j;i<=l;++i){
j=ne[i-1];
while(j&&a[j+1]!=a[i]) j=ne[j];
if(a[j+1]==a[i]) j++;
ne[i]=j;sum[i]=sum[j]+1;
}for(ri i=2,j=0;i<=l;++i){
while(j&&a[j+1]!=a[i]) j=ne[j];
if(a[j+1]==a[i]) j++;
while(j>(i>>1)) j=ne[j];
ans=(ans*1ll*(sum[j]+1))%mod;
}
printf("%lld\n",ans);
}
return 0;
}