KMP详解

来源:互联网 发布:通联数据 公司怎样 编辑:程序博客网 时间:2024/06/06 02:47

首先,next数组是怎么得来的???

i 为指向字符串T的下标的变量, j 是指向以 i-1 位置为结束的字符的字符串的 相同的前后缀最长的 前缀的结束字符的下标。S代表主串,T代表模式串。

next数组实质上是,在 i 的位置之前的字符串的前缀(不包含本身)和后缀(不包含本身)的相同的字符的个数。

一、给next[0]赋值为-1,因为第一个字符之前没有任何的字符串,用-1来标志已经将 i 位置之前整个字符串比较完毕。

二、给next[1]赋值为0,因为在比较字符串的前缀和后缀的时候,不能比较字符串本身,所以,在只有一个字符的情况下,没有比的必要,直接为0。

三、进入循环:
1、若 T[i]==T[j] 的时候,将 ++j 填入 next[i] 的位置,之后 i++。
2、若 T[i]!=T[j] 并且 T[j]==-1 的时候,将next[i]=0的同时i++。
3、剩余的情况就是, T[i]!=T[j] 并且 T[j]!=-1 的时候,去寻找next[j]为下标的字符,比较是否与next[i]相等。

这里写图片描述

其次,KMP是怎么比较的呢???

一、若 S[i]==T[j] ,则 i++,j++。将主串与模式串的指向同时后移。

二、若 S[i]!=T[j] 并且 next[j]==-1 的时候,i++。与主串下一个的字符比较。这种情况代表将主串上的该字符与模式串的一个字符都不匹配。

三、若 S[i]!=T[j] 并且 next[j]!=-1 的时候,j=next[j]。将模式串向后移动 i-j 个位置,然后与主串进行比较。

#include<stdio.h>#include<stdlib.h>#include<string>void getnext(char *T,int *next){    next[0] = -1;    next[1] = 0;    int i = 2;    int j = 0;    while (i<strlen(T))    {        if (T[i-1] == T[j])//如果相等            next[i++] = ++j;//为其赋值        else if(next[j]==-1)//在前面这部分串没有与之匹配的,则赋值为0            next[i++] = 0;        else//若当前没有找到,则去当前next[j]的下标继续找            j = next[j];    }}int kmp(char *S,char *T){    int *next = new int[strlen(T)];    getnext(T,next);//获得next数组    int i = 0;    int j = 0;    while (i<strlen(S)&&j<strlen(T))//分别小于他们的长度    {        if (S[i] == T[j])        {            i++;            j++;        }        else if (next[j]==-1)        {            i++;        }        else        {            j = next[j];        }    }    return j == strlen(T)?i-j:-1;}int main(void){    char S[] = { "abababcababababababababac" };    char T[] = { "abcabab" };    printf("%d\n",kmp(S,T));    return 0;}
原创粉丝点击