CF 1200 E. Compress Words(扩展kmp)
大意:给出 n 个字符串 , 有一个结果串 , 依次合并第 i 个串和结果串 , 合并的过程中去除结果串的后缀和第i个串前缀的最长公共部分 , 求结果串。
思路:一个串的前缀和另一个串的后缀 , 很容易让人想到 扩展 kmp 算法。
对于 结果串 和 当前要合并的串 , 不难想出可以用扩展 kmp求出结果串后缀对于与合并串的LCP = 结果串后缀的最大长度 , 这就是我们要的答案。
但是这样显然会 T 飞 , 因为随着不断合并 , 结果串越来越长 ,时间复杂度会上升到 n方级别 。 考虑优化 , 我们要求的最长公共部分显然不会超过 min(结果串 , 当前串) , 所以当结果串很长的时候 , 我们只需要用结果串的有效后缀长度去做 扩展 kmp 即可 ,由于所有串总长不超过 1e6 , 所以这样优化之后跑得飞快。
cpp
#include<bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define IOS std::ios::sync_with_stdio(false),cin.tie(0),cout.tie(0);
#define int long long
const int N = 1e5 + 10;
const int M = 1e6 + 10;
const int mod = 1e9 + 7;
typedef pair<int,int>PII;
int n;
string s[N] , ans , now;
int z[M] , p[M];
void get_z(string s , string t){
int n = s.size();int m = t.size();
s = ' ' + s;t = ' ' + t;
z[1] = n;
for(int i = 2 , l = 1 , r = 0 ; i <= n ; i ++){
if(i <= r) z[i] = min(z[i - l + 1] , r - i + 1);
else z[i] = 0;
while(s[z[i] + 1] == s[i + z[i]]) z[i] += 1;
if(i + z[i] - 1 > r) l = i , r = i + z[i] - 1;
}
for(int i = 1 , l = 1 , r = 0 ; i <= m ; i ++){
if(i <= r) p[i] = min(z[i - l + 1] , r - i + 1);
else p[i] = 0;
while(p[i] + 1 <= n && i + p[i] - 1 <= m && s[p[i] + 1] == t[p[i] + i]) p[i] += 1;
if(i + p[i] - 1 > r) l = i , r = i + p[i] - 1;
}
}
signed main(){
IOS
cin >> n;
for(int i = 1 ; i <= n ; i ++) cin >> s[i];
ans += s[1];
for(int i = 1 ; i <= n - 1 ; i ++){
int x = ans.size();
int y = s[i + 1].size();
if(x > y) now = ans.substr(x - y);
else now = ans;
get_z(s[i + 1] , now);
int m = now.size();
int mx = 0;
for(int j = 1 ; j <= m ; j ++){
if(m - j + 1 == p[j]) mx = max(mx , p[j]);
}
ans += s[i + 1].substr(mx);
}
cout << ans << "\n";
return 0;
}
//freopen("文件名.in","r",stdin);
//freopen("文件名.out","w",stdout);