KMP算法讲解

来源：互联网发布：stc最高性能单片机编辑：程序博客网时间：2024/06/07 05:33

1.简单匹配算法（暴力法）
算法思想直截了当，将文本串S中从某个位置i起与模式串T相比较，从 j=0 起比较 S[i+j] 与 T[j]，如果相等继续向后比较（j+1）如果不相等，模式串回溯至开始处（j=0）文本串从当前的位置的下一个位置进行匹配（i+1）。
算法函数如下：
void GeneralMatch(const char ssrc[],const char sdst[], int &index)
{

    int i = 0;    int j = 0;    while(ssrc[i + j] != '\0' && sdst[j] != '\0')    {        if (ssrc[i + j] == sdst[j])        {            j ++;        }        else         {            i ++;            j = 0;        }    }    if(sdst[j] == '\0')    {        index = i;                  }    else    {        index = -1;    }}

算法图解：
这里写图片描述
2.KMP匹配算法
与一般匹配算法有所不同的是，KMP算法在匹配失败时，不回溯文本串（主串），而是滑动模式串进行匹配，提高算法效率。
算法图解：

问题是发生匹配失败时，如何计算模式串的滑动位置，根据模式串本身计算（与主串无关），即模式值next[n],定义为：
（1） next[0]= -1 意义：任何串的第一个字符的模式值规定为-1。
（2） next[j]= -1 意义：模式串T中下标为j的字符，如果与首字符相同，且j的前面的k-1个字符与开头的k-1个字符不等（或者相等但T[k]==T[j]）（1≤k）。
如：T=”abCabCad” 则 next[6]=-1，因T[3]=T[6]
（3） next[j]=k 意义：模式串T中下标为j的字符，如果j的前面k个字符与开头的k个字符相等，且T[j] != T[k] （1≤k）。即T[0]T[1]T[2]。。。T[k-1]==
T[j-k]T[j-k+1]T[j-k+2]…T[j-1]且T[j] != T[k].（1≤k）;
(4) next[j]=0 意义：除（1）（2）（3）的其他情况。
void getNext(const char* pattern,int next[])
{

   next[0]=   -1;   int k=-1,j=0;   while(pattern[j] != '/0')   {          if(k!= -1 && pattern[k]!= pattern[j] )                 k=next[k];          ++j;++k;          if(pattern[k]== pattern[j])                 next[j]=next[k];          else                 next[j]=k;   }

}

0 0