您的当前位置：首页正文

bzoj3670&&luogu 2375 noi2014动物园 kmp

来源：独旅网

http://www.elijahqi.win/archives/391
题目描述
近日，园长发现动物园中好吃懒做的动物越来越多了。例如企鹅，只会卖萌向游客要吃的。为了整治动物园的不良风气，让动物们凭自己的真才实学向游客要吃的，园长决定开设算法班，让动物们学习算法。

某天，园长给动物们讲解KMP算法。

园长：“对于一个字符串S，它的长度为L。我们可以在O(L)的时间内，求出一个名为next的数组。有谁预习了next数组的含义吗？”

熊猫：“对于字符串S的前i个字符构成的子串，既是它的后缀又是它的前缀的字符串中（它本身除外），最长的长度记作next[i]。”

园长：“非常好！那你能举个例子吗？”

熊猫：“例S为abcababc，则next[5]=2。因为S的前5个字符为abcab，ab既是它的后缀又是它的前缀，并且找不到一个更长的字符串满足这个性质。同理，还可得出next[1] = next[2] = next[3] = 0，next[4] = next[6] = 1，next[7] = 2，next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后，他详细讲解了如何在O(L)的时间内求出next数组。

下课前，园长提出了一个问题：“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串，既是它的后缀同时又是它的前缀，并且该后缀与该前缀不重叠，将这种字符串的数量记作num[i]。例如S为aaaaa，则num[4] = 2。这是因为S的前4个字符为aaaa，其中a和aa都满足性质‘既是后缀又是前缀’，同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’，但遗憾的是这个后缀与这个前缀重叠了，所以不能计算在内。同理，num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最后，园长给出了奖励条件，第一个做对的同学奖励巧克力一盒。听了这句话，睡了一节课的企鹅立刻就醒过来了！但企鹅并不会做这道题，于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢？

特别地，为了避免大量的输出，你不需要输出num[i]分别是多少，你只需要输出所有num[i]的乘积，对1,000,000,007取模的结果即可。

输入输出格式
输入格式：

第1行仅包含一个正整数n ，表示测试数据的组数。随后n行，每行描述一组测试数据。每组测试数据仅含有一个字符串S，S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行，行末不会存在多余的空格。

输出格式：

包含 n 行，每行描述一组测试数据的答案，答案的顺序应与输入数据的顺序保持一致。对于每组测试数据，仅需要输出一个整数，表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

输入输出样例
输入样例#1：

3
aaaaa
ab
abcababc
输出样例#1：

36
1
32
说明
测试点编号约定

1 N ≤ 5, L ≤ 50

2 N ≤ 5, L ≤ 200

3 N ≤ 5, L ≤ 200

4 N ≤ 5, L ≤ 10,000

5 N ≤ 5, L ≤ 10,000

6 N ≤ 5, L ≤ 100,000

7 N ≤ 5, L ≤ 200,000

8 N ≤ 5, L ≤ 500,000

9 N ≤ 5, L ≤ 1,000,000

10 N ≤ 5, L ≤ 1,000,000

这题思想真的挺复杂，这几天累了，下午一边写一边睡了，不过还好，醒了思维挺清醒的

自己看了下大概思路，竟然在原板子上改对了，很兴奋

首先还是又复习一遍kmp

我是从0开始的如果j==-1说明是头一个那么我应该把i指针和j指针全部后移并且给next填充值很好 next[1]=0了

继续的过程建议手推便于理解

abababababababab

比如i==4时即a[4]==a (从0开始编号)

j=2 a[j]=a[i]所以同时后移，假设我们有一种不匹配的情况abab& 仍然是i==4时将j=next[j]

增设数组cnt ，cnt[i]为满足既是前缀i 的前缀，又是前缀i 的后缀的子串个数(包括前缀i 本身)，

cnt[i]=cnt[next[i]]+1(1<i<=len) //前缀i的最长匹配next[i]+他自身

然后随即想到朴素做法，即限定他别超过我们长度的一半

然后我们可以通过cnt[] 和next[] 数组求得num[] 数组。

具体做法是，对于每个i>=2 (i=1 时显然num[i]=0 )，

通过沿着next[] 指针向前走找到最大的j,（我们知道next数组现在是多少如长度为j，那么检查next[j]又可以得到类似的效果），因为我们之前做过匹配这样一定最优

j 满足前缀j 既是前缀i的前缀，也是它的后缀，且2j<=i (即题面中所限制的前缀和后缀不重叠)，

那么num[i]=cnt[j] .

但是这样会超时，cnt和next数组计算都在o(n)内解决，那么问题只会在计算最后的答案的时候出现

我们不妨仿照next数组的求法（我觉得出题人一定对Next理解特别透彻）

我们在循环到i 时当前的j 是不是可以重前一次的最长的不重叠的j 得到呢？

答案是肯定的要么小于等于上一次的j ，要么等于上一次的j+1

===== （证明贴一段别人的证明）

猜想：会不会是j+2 或更大呢？

不，可以用反证法

假设第i−1 次循环得到j 为j ,这次(第i 次)最终得到的为j+2

那么可以发现前缀i 的前缀j+2 =他长度为j+2 的后缀

那么前缀j+2 =前缀i 的长度为j+2 的后缀的长度为j+1 的前缀(结束为i−1 )

又因为我们得到的j+2 满足不重叠，那么j+1 自然也不会重叠

那么我们可以得到前缀i−1 的的最优j 为j+1

这样就冲突啦，于是这是不可能的

按照我这个kmp板子求出来的next,cnt数组都是从一走的，另外ans 要用long long

#include <cstdio>
#include <cstring>
#define ll long long
#define N 1000010
#define mod 1000000007
int tst,fail[N],cnt[N],m;
char s[N];
inline void getfail(){
	//cnt[i]记录失配多少次到0，即前后缀相同的个数+1
	//num[i]其实就是第一个匹配上的k的cnt[k] 
	int k=0;fail[1]=0;cnt[1]=1;
	for(int i=2;i<=m;++i){
		while(k&&s[k+1]!=s[i]) k=fail[k];
		if(s[k+1]==s[i]) ++k;
		fail[i]=k;
		cnt[i]=cnt[k]+1;
	}
//	for (int i=1;i<=m;++i) printf("%d ",fail[i]);printf("\n");
//	for (int i=1;i<=m;++i) printf("%d ",cnt[i]);printf("\n");
}
int main(){
//	freopen("2375.in","r",stdin);
	scanf("%d",&tst);
	while(tst--){
		scanf("%s",s+1);m=strlen(s+1);int ans=1; 
		getfail();int k=0;
		for(int i=2;i<=m;++i){
			while(k&&s[k+1]!=s[i]) k=fail[k];
			if(s[k+1]==s[i]) ++k;
			while((k<<1)>i) k=fail[k];//去重叠 
			ans=(ll)ans*(cnt[k]+1)%mod;
		}
		printf("%d\n",ans);
	}
	return 0;
}

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文