KMP模板解释

来源:互联网 发布:英伟达610m显卡优化lol 编辑:程序博客网 时间:2024/05/14 05:19

KMP算法是一种改进的字符串匹配算法,KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。因此我们的的模板也就分为两部分;
1;实现next,求出各自部分匹配值
这里写图片描述
“部分匹配值”就是”前缀”和”后缀”的最长的共有元素的长度
“前缀”指除了最后一个字符以外,一个字符串的全部头部组合;
“后缀”指除了第一个字符以外,一个字符串的全部尾部组合;
代码实现;

void compute_prefix(int *next, char *p)  {      int i, n, k;      n = strlen(p);      next[1] = next[0] = 0;     //printf("0-----%d\n",0);     //printf("1-----%d\n",0);     k = 0;      /* 第i次迭代开始之前,k表示next[i-1]的值 */        for (i = 2; i <= n; i++) { //i可以达到n;         while(k != 0 && p[k] != p[i-1])            k = next[k];           if (p[k] == p[i-1]) k++;            next[i] = k;         ///printf("%d-----%d\n",i,k);     }  }

除开那个while其他的应该比较好理解;
while 循环只要考虑的是ABACBBBABAB这种情况;
A B A C B B B A B A B
0 0 1 0 0 0 0 1 2 3 ?;
进入while循环找到next[3]=1;再比较p【1】与B是否相同;
等到B的部分匹配值是2;而不是从0开始比较的;
while循环就是这种有相同的字符的;

2;还有一部分就是查找了;
这个容易理解;直接看代码;

void kmp_match(char *text, char *p, int *next){    int     l=0,m, n, s, q;    m = strlen(p);    n = strlen(text);    q = s = 0;  /* q表示上一次迭代匹配了多少个字符,                   s表示这次迭代从text的哪个字符开始比较 */     while (s < n) {        q = next[q];        while(q < m && p[q] == text[s]){            q++;             s++;        }        if (q == 0) s++;        else if (q == m) {            printf("移动多少单位 %d\n", s-m);            l++;         }    }    printf("有多少个字串%d\n",l);}

3看个例题;hdu2078
链接;http://acm.hdu.edu.cn/showproblem.php?pid=2087
代码

#include<stdio.h>#include<string.h> void compute_prefix(int *next, char *p)  {      int     i, n, k;      n = strlen(p);      next[1] = next[0] = 0;     //printf("0-----%d\n",0);     //printf("1-----%d\n",0);     k = 0;      /* 第i次迭代开始之前,k表示next[i-1]的值 */        for (i = 2; i <= n; i++) { //i可以达到n;         while(k != 0 && p[k] != p[i-1])            k = next[k];           if (p[k] == p[i-1]) k++;            next[i] = k;         ///printf("%d-----%d\n",i,k);     }  }  void kmp_match(char *text, char *p, int *next){    int     l=0,m, n, s, q;    m = strlen(p);    n = strlen(text);    q = s = 0;  /* q表示上一次迭代匹配了多少个字符,                   s表示这次迭代从text的哪个字符开始比较 */     while (s < n) {        q = next[q];        while(q < m && p[q] == text[s]){            q++;             s++;        }        if (q == 0) s++;        else if (q == m) {            l++;             s=s+m-1;        }    }    printf("%d\n",l);}int main()  {      int     next[1008]={0}, n;      char    p[1008]={0};      char    text[1008]={0};      while(scanf("%s",text) !=NULL&&strcmp(text,"#")!=0){        scanf("%s",p);        compute_prefix(next, p);          kmp_match(text, p, next);        memset(next,0,sizeof(next));    }    return 0;  }  
0 0
原创粉丝点击