【POJ 2406 】

来源:互联网 发布:qt多进程编程视频 编辑:程序博客网 时间:2024/06/05 07:16

题目链接:http://poj.org/problem?id=2406

设文本为T={t1,t2...tn},模式为P={p1,p2...pn},则KMP算法的大概思想就是提前计算出在字符处匹配中遇到前q个字符匹配而第q+1个字符不匹配时,模式P需要移动的位置数。在算法导论中,引入了一个数组π,用于保存这样的信息。π[m]的含义就是既是Pm的前缀又是Pm的真后缀的最大子串长度。之所以是“真”后缀,是因为如果非真后缀的话,此时已经匹配了。π的含义如下

i      1 2 3 4 5 6 7  8

pi    a b a b a b a b

π[i]  0 0 1 2 3  4 5 6

而需要特别注意的是算法导论中的下标是从1开始的,这是和π中元素的含义(即上面所说)相匹配的,这种情况下,如果遇到不匹配的字符时,移动量的计算公式为最后一个匹配字符的索引(设为q)-π[q]。如

1 2 3 4 5 6  7

a b a b a b c

a b a b a b d

那么此时需要移动的量为6-π[6]=6-4=2。而在具体的代码实现时,我们需要计算的是next数组,next数组的计算结果和π有一点点的不相同,因为在代码实现中,我们的下标都是从0开始的。仍以上面的例子为例:

i           0  1 2 3 4 5 6  7  8

pi         a  b a b a b a b

next[i]  -1  0 0 1 2 3  4 5 6//注意next中-1后有两个0,看了几个网上的答案,都是一个,需要特别注意。

此时,如果遇到不匹配的字符时,计算公式为第一个不匹配字符的索引(设为q)-next[q]。如:

0  1 2 3 4 5  6

a  b a b a b c

a  b a b a b d

-1 0 0 1 2 3 4

则需要移动的量为6-4=2。而此时的next数组的含义也不再是算法导论中真后缀的最大前缀子串的长度了。

 

 

目前还不太理解。。

问题是:如何快速找出S的最小循环周期(循环节)呢?
Len是s的长度

给出结论:如果len%(len-next[len-1])==0,则字符串中必存在最小循环节,且循环次数即为 len/(len-next[len-1])

 

 

#include<iostream>#include<cstdio>#include<cstring>using namespace std;char s[1000001];int next[1000001];void getnext(char *p,int *next){int len=strlen(p);int i=0,k=-1;next[0]=-1;while(i<len){if(k==-1 || p[i]==p[k]){i++;k++;next[i]=k;}elsek=next[k];}}int main(){while(1){scanf("%s",s);if(s[0]=='.')break;getnext(s,next);int len=strlen(s);if(len%(len-next[len])==0)printf("%d\n",len/(len-next[len]));elseprintf("1\n");}return 0;}

原创粉丝点击