KMP算法

来源:互联网 发布:淘宝限制购物怎么解除 编辑:程序博客网 时间:2024/06/11 04:09
#include <iostream>
#include <cstring>
using namespace std;
int next[20];//如果除首字符之外的字符只出现一次,那么next值就为0,如果出现的次数不为1,那么就求出第一次出现的位置
char text[20]="BBC ";
char p[20]="ABCDABD";
void getNext(char *p,int *next)  {
    int j,k;
    next[0]=-1;
    j=0;
    k=-1;
    while(j<strlen(p)-1)//当j等于strlen(p)-1时,我们已经全部赋完值了
    {

        if(k==-1 || p[j]==p[k])//匹配的情况下,p[j]==p[k],那么从p[0]~p[k-1]就和p[j-k]~p[j]完全相同

        {

            j++;
            k++;
            next[j]=k;//因为每次赋完值后还会再比较一次,如果不匹配的话,那么k值自然变为-1,那么next的值自然为0,如果匹配的话,因为next[j+1]=next[j]+1=k+1;所以j++了,k++了
        }
        else

            k=next[k];//不匹配,自然就让k=next[k],没必要再回溯

     }

}

int KMPMatch(char *s,char *p)
{
    int i,j;
    i=0;
    j=0;
    getNext(p,next);
    while(i<strlen(s))
    {
        if(j==-1 || s[i]==p[j])
        {
            i++;
            j++;
        }
        else
        {
            j=next[j];//避免了i的重新回溯,直接让j等于next[j],如果那个字符只出现了一次,那么直接就是让p重新从0开始比较,如果出现多次,那么next值为第一次出现的位置,因为s[i]和p[j]还是不相等,同样p重新从0开始比较
        }
        if(j==strlen(p))//如果j等于p的长度的话,意味着我们已经找到了,自然返回它所在的位置
            return i-strlen(p);
    }
    return -1;
}
int main()
{
    int q;
    getNext(p,next);
    for(int i=0;i<strlen(p);i++)
    {
        cout<<next[i]<<endl;
    }
    q=KMPMatch(text,p);
    //cout<<q<<endl;
    return 0;

}
 因此KMP算法的关键在于求算next[]数组的值,即求算模式串每个位置处的最长后缀与前缀相同的长度, 而求算next[]数组的值有两种思路,
第一种思路是用递推的思想去求算,还有一种就是直接去求解。

1.按照递推的思想:

   根据定义next[0]=-1,假设next[j]=k, 即P[0...k-1]==P[j-k,j-1]

   1)若P[j]==P[k],则有P[0..k]==P[j-k,j],很显然,next[j+1]=next[j]+1=k+1;

   2)若P[j]!=P[k],则可以把其看做模式匹配的问题,即匹配失败的时候,k值如何移动,显然k=next[k]。

   因此可以这样去实现:
void getNext(char *p,int *next)
{
    int j,k;
    next[0]=-1;
    j=0;
    k=-1;
    while(j<strlen(p)-1)
    {
        if(k==-1||p[j]==p[k])    //匹配的情况下,p[j]==p[k]
        {
            j++;
            k++;
            next[j]=k;
        }
        else                   //p[j]!=p[k]
            k=next[k];
    }
}
其实这个我自己也没有理解透彻,大概的意思能狗理解

0 0
原创粉丝点击