KMP算法讲解

来源:互联网 发布:stc最高性能单片机 编辑:程序博客网 时间:2024/06/07 05:33

1.简单匹配算法(暴力法)
算法思想直截了当,将文本串S中从某个位置i起与模式串T相比较,从 j=0 起比较 S[i+j] 与 T[j],如果相等继续向后比较(j+1)如果不相等,模式串回溯至开始处(j=0)文本串从当前的位置的下一个位置进行匹配(i+1)。
算法函数如下:
void GeneralMatch(const char ssrc[],const char sdst[], int &index)
{

    int i = 0;    int j = 0;    while(ssrc[i + j] != '\0' && sdst[j] != '\0')    {        if (ssrc[i + j] == sdst[j])        {            j ++;        }        else         {            i ++;            j = 0;        }    }    if(sdst[j] == '\0')    {        index = i;                  }    else    {        index = -1;    }}

算法图解:
这里写图片描述
2.KMP匹配算法
与一般匹配算法有所不同的是,KMP算法在匹配失败时,不回溯文本串(主串),而是滑动模式串进行匹配,提高算法效率。
算法图解:
这里写图片描述
问题是发生匹配失败时,如何计算模式串的滑动位置,根据模式串本身计算(与主串无关),即模式值next[n],定义为:
(1) next[0]= -1 意义:任何串的第一个字符的模式值规定为-1。
(2) next[j]= -1 意义:模式串T中下标为j的字符,如果与首字符相同,且j的前面的k-1个字符与开头的k-1个字符不等(或者相等但T[k]==T[j])(1≤k)。
如:T=”abCabCad” 则 next[6]=-1,因T[3]=T[6]
(3) next[j]=k 意义:模式串T中下标为j的字符,如果j的前面k个字符与开头的k个字符相等,且T[j] != T[k] (1≤k)。即T[0]T[1]T[2]。。。T[k-1]==
T[j-k]T[j-k+1]T[j-k+2]…T[j-1]且T[j] != T[k].(1≤k);
(4) next[j]=0 意义:除(1)(2)(3)的其他情况。
void getNext(const char* pattern,int next[])
{

   next[0]=   -1;   int k=-1,j=0;   while(pattern[j] != '/0')   {          if(k!= -1 && pattern[k]!= pattern[j] )                 k=next[k];          ++j;++k;          if(pattern[k]== pattern[j])                 next[j]=next[k];          else                 next[j]=k;   }

}

0 0