BZOJ 3670: [Noi2014]动物园 KMP题解

来源:互联网 发布:windows ndk下载 编辑:程序博客网 时间:2024/05/15 01:46

Time Limit: 10 Sec Memory Limit: 512 MB
Submit: 2781 Solved: 1502

Description

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

某天,园长给动物们讲解KMP算法。

园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”

熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”

园长:“非常好!那你能举个例子吗?”

熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。

下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?

特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出对1,000,000,007取模的结果即可。

Input

第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

Output

包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

Sample Input

3

aaaaa

ab

abcababc

Sample Output

36

1

32

HINT

n≤5,L≤1,000,000

Source


一看这道题,显然就要用KMP算法,下面是代码,题解在后面

#include<cstdio>#include<iostream>#include<cstring>const int MAXN=1001000;using namespace std;int T;char s[MAXN];long long fail[MAXN],num[MAXN];long long final;int main(){    scanf("%d",&T);    while(T--){        final=1;num[1]=1;        scanf("%s",s);        int len=strlen(s);        fail[0]=0;fail[1]=0;num[0]=0;num[1]=1;        int k=0;        for(register int i=1;i<len;i++){            int j=fail[i];            while(j&&s[i]!=s[j]) j=fail[j];            fail[i+1]=s[i]==s[j]?j+1:0;            num[i+1]=num[fail[i+1]]+1;            while(k&&s[i]!=s[k]) k=fail[k];            if(s[i]==s[k])k++;            while(k>((i+1)>>1))k=fail[k];            final=(final*(num[k]+1))%1000000007;            }        printf("%lld\n",final);    }    return 0;}

这里写图片描述

这里的fail用的是刘汝佳的fail,表示的是下一位,所以要注意,然后我们只需要用num来记录一个位置往前跳多少次可以跳到起点,一定要注意这里的num和题目中的num不同,然后我们研究这样一张图

这里写图片描述

显然,当在计算A点对答案的贡献的时候,我们需要持续跳fail,直到这个fail在mid的左边,那么我们要如何快速跳呢,显然可以倍增对吧,然而倍增好像很难写(有细节),所以我们考虑更优的解法,也就是O(n)的解法,显然我们只需要动态地用代码中的k来维护这个mid值就可以了,因为A的右边一个位置的fail往前跳啊跳啊,跳到现在的mid的,然而我们会发现,所有的A的右边那个点的fail指针往前指的位置,都只能是A这个位置的fail指针及其往前跳的fail指针指的位置+1,而且如果我们在A+1这个位置没有匹配上,或者说匹配到了mid的很左边,那么A+2这个位置还会匹配到之前的mid的右边吗?显然是不行的,所以我们只需要这样动态地维护就好啦,如果还有不懂的,欢迎联系qq:2632812444