http://www.elijahqi.win/archives/391
题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出所有num[i]的乘积,对1,000,000,007取模的结果即可。
输入输出格式
输入格式:
第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出格式:
包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。
输入输出样例
输入样例#1:
3
aaaaa
ab
abcababc
输出样例#1:
36
1
32
说明
测试点编号 约定
1 N ≤ 5, L ≤ 50
2 N ≤ 5, L ≤ 200
3 N ≤ 5, L ≤ 200
4 N ≤ 5, L ≤ 10,000
5 N ≤ 5, L ≤ 10,000
6 N ≤ 5, L ≤ 100,000
7 N ≤ 5, L ≤ 200,000
8 N ≤ 5, L ≤ 500,000
9 N ≤ 5, L ≤ 1,000,000
10 N ≤ 5, L ≤ 1,000,000
这题思想真的挺复杂,这几天累了,下午一边写一边睡了,不过还好,醒了思维挺清醒的
自己看了下大概思路,竟然在原板子上改对了,很兴奋
首先 还是又复习一遍kmp
我是从0开始的 如果j==-1说明是头一个 那么我应该把i指针和j指针全部后移 并且给next填充值 很好 next[1]=0了
继续的过程建议手推 便于理解
abababababababab
比如i==4时 即a[4]==a (从0开始编号)
j=2 a[j]=a[i]所以同时后移,假设我们有一种不匹配的情况abab& 仍然是i==4时 将j=next[j]
增设数组cnt ,cnt[i]为满足既是前缀i 的前缀,又是前缀i 的后缀的子串个数(包括前缀i 本身),
cnt[i]=cnt[next[i]]+1(1<i<=len) //前缀i的最长匹配next[i]+他自身
然后随即想到朴素做法,即限定他别超过我们长度的一半
然后我们可以通过cnt[] 和next[] 数组求得num[] 数组。
具体做法是,对于每个i>=2 (i=1 时显然num[i]=0 ),
通过沿着next[] 指针向前走找到最大的j,(我们知道next数组现在是多少如长度为j,那么检查next[j]又可以得到类似的效果),因为我们之前做过匹配这样一定最优
j 满足前缀j 既是前缀i的前缀,也是它的后缀,且2j<=i (即题面中所限制的前缀和后缀不重叠),
那么num[i]=cnt[j] .
但是这样会超时,cnt和next数组计算都在o(n)内解决,那么问题只会在 计算最后的答案的时候出现
我们不妨仿照next数组的求法(我觉得出题人一定对Next理解特别透彻)
我们在循环到i 时当前的j 是不是可以重前一次的最长的不重叠的j 得到呢?
答案是肯定的要么小于等于上一次的j ,要么等于上一次的j+1
===== (证明贴一段别人的证明)
猜想:会不会是j+2 或更大呢?
不,可以用反证法
假设第i−1 次循环得到j 为j ,这次(第i 次)最终得到的为j+2
那么可以发现前缀i 的前缀j+2 =他长度为j+2 的后缀
那么前缀j+2 =前缀i 的长度为j+2 的后缀的长度为j+1 的前缀(结束为i−1 )
又因为我们得到的j+2 满足不重叠,那么j+1 自然也不会重叠
那么我们可以得到前缀i−1 的的最优j 为j+1
这样就冲突啦,于是这是不可能的
按照我这个kmp板子求出来的next,cnt数组都是从一走的,另外ans 要用long long
#include <cstdio>
#include <cstring>
#define ll long long
#define N 1000010
#define mod 1000000007
int tst,fail[N],cnt[N],m;
char s[N];
inline void getfail(){
//cnt[i]记录失配多少次到0,即前后缀相同的个数+1
//num[i]其实就是第一个匹配上的k的cnt[k]
int k=0;fail[1]=0;cnt[1]=1;
for(int i=2;i<=m;++i){
while(k&&s[k+1]!=s[i]) k=fail[k];
if(s[k+1]==s[i]) ++k;
fail[i]=k;
cnt[i]=cnt[k]+1;
}
// for (int i=1;i<=m;++i) printf("%d ",fail[i]);printf("\n");
// for (int i=1;i<=m;++i) printf("%d ",cnt[i]);printf("\n");
}
int main(){
// freopen("2375.in","r",stdin);
scanf("%d",&tst);
while(tst--){
scanf("%s",s+1);m=strlen(s+1);int ans=1;
getfail();int k=0;
for(int i=2;i<=m;++i){
while(k&&s[k+1]!=s[i]) k=fail[k];
if(s[k+1]==s[i]) ++k;
while((k<<1)>i) k=fail[k];//去重叠
ans=(ll)ans*(cnt[k]+1)%mod;
}
printf("%d\n",ans);
}
return 0;
}
因篇幅问题不能全部显示,请点此查看更多更全内容