KMP算法

来源:互联网 发布:软件公寓户型图 编辑:程序博客网 时间:2024/06/01 21:06

应用问题描述:
【题目】
给定两个字符串str和match,长度分别为N和M。实现一个算法,如果字符串str中含有字串match,则返回match在str中的开始位置,不含有则返回-1。
【举例】
str=“acbc”,match=“bc”。返回2。
str=“acbc”,match=“bcc”。返回-1。
【要求】
如果match的长度大于str长度(M>N),str必然不会含有match,可直接返回-1。但如果N>=M,要求算法复杂度O(N)。

解决思路:
- 介绍变量:next是一个整数数组,该数组的第i个位置记录的是match数组中i位置之前的所有元素的一个指标,该指标反映的是前缀和后缀相等的最大长度(前缀不包含最后一个元素,后缀不包含第一个元素)。
- next数组的构造方法:
初始化next[0]=-1; next[1]=0;如果我们已知next的i-1及之前位置的元素,计算next[i]的方法如下图:(时间复杂度为O(m),m为match字符串的长度)

构造next数组的思路

-匹配过程:
匹配思路如下:

匹配过程

a,b为str和match第一个不匹配的字符位置,根据next数组可以找到c位置的字符,将match右推,判断a位置和c位置的字符是否相等。如果相等,继续向下匹配,如果不等,用上述方法继续右推match。
-code如下

public int getIndexOf(String s, String m) {         if (s == null || m == null || m.length() < 1 || s.length() < m.length()) {         return -1;         }         char[] ss = s.toCharArray();         char[] ms = m.toCharArray();         int si = 0;         int mi = 0;         int[] next = getNextArray(ms);         while (si < ss.length && mi < ms.length) {         if (ss[si] == ms[mi]) {             si++;             mi++;         } else if (next[mi] == -1) {             si++;         } else {             mi = next[mi];         }         }         return mi == ms.length ? si - mi : -1;     }     public int[] getNextArray(char[] ms) {         if (ms.length == 1) {             return new int[] { -1 };         }         int[] next = new int[ms.length];         next[0] = -1;         next[1] = 0;         int pos = 2;         int cn = 0;         while (pos < next.length) {             if (ms[pos - 1] == ms[cn]) {                 next[pos++] = ++cn;             } else if (cn > 0) {                 cn = next[cn];             } else {                 next[pos++] = 0;             }         }         return next;     }
0 0
原创粉丝点击