KMP模式匹配算法

来源:互联网 发布:java线程创建 编辑:程序博客网 时间:2024/06/05 12:45
KMP的算法核心,在于引入next值,在对待查串做增量之外,避免了对子串逐一增加并一一比较。对于子串有较多重复内容,提高了效率。


由于T="abcabx",此时分析x的next值,前缀的“ab”与最后“x”之前串的后缀“ab”是相等的。因此j就由6变成了3。因此,我们可以得出规律,j值的多少取决于当前字符之前的串的前后缀的相似度。


换言之,理解的关键,对于j位置的字符,观察最前面的字符,与j之前紧邻j最后的字符,其相同串的最大长度,即为相似度。


KMP模式算法的改进的关键在于,对于T串(待查找的串),如果T串的第二、三、四、五位置的字符都与首位相等,那么可以用首位的next值,即next[1]去取代后续next的值。


//KMP算法//T[i]表示后缀的单个字符,T[j]表示前缀的单个字符void get_next(String T, int *next){int i = 1, j = 0;next[1] = 0;while (i < T[0]){if (j == 0 || T[i]  == T[j]){i++;j++;next[i] = j;}elsej = next[j];}}int Index_KMP(String S, String T, int pos){int i = pos;int j = 1;int next[255];get_next(T, next);while (i <= S[0] && j <= T[0]){if (j == 0 || S[i] == T[j]){i++;j++;}elsej = next[j];}if (j > T[0])return i - S[0];elsereturn 0;}//改进的KMP算法计算next值void get_nextval(String T, int *nextval){int i = 1, j = 0;nextval[1] = 0;while (i < T[0]){if (j == 0 || T[i] == T[j]){i++;j++;if (T[i] != T[j])nextval[i] = j;elsenextval[i] = nextval[j];}elsej = nextval[j];}}


0 0
原创粉丝点击