字符串匹配神器----KMP算法

来源:互联网 发布:网络用户的行为分析 编辑:程序博客网 时间:2024/05/17 05:05

  记得之前在学校ACM月塞上曾经死于字符串匹配题目,因此去学习了KMP算法,前几天去面试一个嵌入式岗位又遇字符串匹配问题,当时想用KMP算法去解,结果憋了好久才憋出来,感觉还不一定正确,还好面试官没看就说他们板子没那么大空间,来个简单粗暴的节约空间的算法,代码要简洁明了,后来就用了朴素匹配算法通过。

  扯远了,KMP的介绍网上一大堆了,也都写得比我好,我就不重复造轮子了,直接上代码,顺带附上我觉得很不错的讲解链接:

 JULY大神的算法讲解:http://blog.csdn.net/v_JULY_v/archive/2011/01/01/6111565.aspx 

 当然如果你想快速使用的话,可以参考下我的代码,不过还是建议弄懂KMP的思想,直接上代码咯,简单粗暴:

#include <stdio.h>#include <string.h>#include <stdlib.h>//#define DEBUG 1/** next数组用于模式串和主串匹配失配时,模式串回退到特定的位置,* 而主串不必回退,大大提高匹配效率,其中特定位置由next数组保存。* 生成next数组,其中数组元素值的含义:* 下      标:  0  1  2  3  4  5  6  7  8  9* 字  符  串:  a  a  b  a  a  b  c  a  a  d* next数组值: -1  0 -1  0  1  2 -1  0  1 -1* next[m]表示,匹配到该字符pattern[m+1]失配时,模式串必须回退到next[m]+1的下标位置继续匹配;* next生成原理:next[m+1](m=0,1,2,...,patter_len - 1)的值为next[n] + 1,其中n使pattern[m + 1] == pattern[next[n]+1]成立,* n的取值next[m],next[next[m]],next[next[next[m]]]....,-1* 例子:* 在求next[5]时,next[4] = 1, pattern[1+1] = 'b', 刚好等于pattern[5],则next[5]=next[4]+1 = 2;* 在求next[6]时,next[5] = 2, 而pattern[2+1] = 'a', 不等于pattern[6],继续比较,next[2] = -1,由于next[2]的值已经为-1,则next[6] = -1*/void generate_next_array(const char *pattern, int *next, int len){int i, j;next[0] = -1;for (i = 1; i < len; ++i) {j = next[i - 1];while (j >= 0 && pattern[i] != pattern[j + 1])j = next[j];if (pattern[i] == pattern[j + 1])++j;next[i] = j;}#ifdef DEBUGfor (i = 0; i < len; ++i)printf("%d ", next[i]);putchar('\n');#endif}void kmp_find(const char *target, const char *pattern){if (NULL == target || NULL == pattern)return;int len_pattern = strlen(pattern);int *next = (int*) malloc(len_pattern * sizeof(int));generate_next_array(pattern, next, len_pattern);int i, j;int len_target = strlen(target);for (i = 0, j = -1; i < len_target; ++i) {while (j >= 0 && target[i] != pattern[j + 1])j = next[j];if (target[i] == pattern[j + 1])j++;//找到匹配的位置,可能有多个匹配位置,若要继续查找,让j=next[j],否则直接breakif (j == len_pattern - 1) {printf("pos: %d\n", i - len_pattern + 1);j = next[j];}}free(next);}int main(){char target[] = "aaaaaabbbaaaabaaaaaab";char pattern[] = "aab";kmp_find(target, pattern);return 0;}




0 0
原创粉丝点击