KMP算法

来源:互联网 发布:淘宝美工摄影速成 编辑:程序博客网 时间:2024/05/18 00:16

KMP算法:

指一种字符串匹配的算法。

引子:

其实就是根据字符串本身的性质判断若当前位置不匹配,则最少右移几位可以开始匹配。
比如字符串为babba,若最后一位不匹配则显然右移一位,两位均不可,但右移三位可以。因为前两个字符,和后两个字符相等。这样就大大减少了移动速度,匹配次数。

算法具体实现过程:

实现其实是一种图论的方法实现。之前的例子最后一位不成功,就要再从第三位开始比较,我们将这样的一种关系,叫做失配边。
所以显然我们的任务有两个:

1.建立失配边

失配边的建立,靠递归,因为失配边其实就是自己去匹配自己。
不妨设a为被匹配字串,长度为n
b为匹配字串,长度为m
f数组即failure function是记录失配边的。即当前位置失败了,要从f[i]开始匹配当前位置。
注意不论字符串还是字符型数组都是从0开始的。

  f[0]=0;f[1]=0;  for(int i=1;i<m;i++){    int j=f[i];    while(j&&b[j]!=b[i])j=f[j];    f[i+1]= b[i]==b[j] ? j+1:0;  }
f[i]表示0~f[i]-1与i-f[i]-1~i-1相等

2.匹配

有了f[],匹配就很好完成了。

  int j=0;  for(int i=0;i<n;i++){    while(j&&b[j]!=a[i])j=f[j];    if(b[j]==a[i])j++;    if(j==m)printf("%d\n",i-m+1);  }

//如果不等就回溯
//如果相等就+1

简单例题

POJ3461 Oulipo
POJ2406 Power Strings
POJ1961 Period

简单性质:

判断循环节:
len%(len-f[len])==0

0 0
原创粉丝点击