KMP算法

来源:互联网 发布:云通信电话软件 编辑:程序博客网 时间:2024/05/20 14:43

寻找最大匹配串:

核心是找到next数组,next数组保存的是最长公共前后缀的长度,如果在A[i]处匹配失败,我们可以通过查找next[i]来寻找出已经匹配上的点,比如说:next[i]等于3,说明字符串前三个和从i向前数三个字符是一样的,这样就可以直接把匹配的字符串头定位到i前面三个的位置,就不用每次移动一个了,但是如果字符串直接没有公共前后缀的话,和一次比一个也没区别。

next数组的计算:KMP算法主要是找到next数组来计算下一次字符串应该要匹配的位置。假设0~i已经知道了,next[i+1]的值,如果i+1位置的字符和next[i]+1位置处的字符一样,就等于next[i]+1;如果不等,就应该分割长度为next[i]长度的公共前后缀字符串,比如next[i]等于5,i+1位置的字符与next[i]+1=6位相比,如果不等,就应该找小于5的公共前后缀在进行比较;也就是next[5]+1的位置,比如next[5]=3,说明前五个有3个是和后面一样的,比较3+1位置和i+1位置的字符,字符相等的话next[i+1]就等于4,也就是说最多匹配到三个,第四个能匹配i+1;也就是说找到前面最大能匹配的时候,每一次检查最大匹配后面能不能与i+1匹配,如果能就得到结果,不能就继续寻找。


下面的代码是copy的,原文的图我看不太董,他的数组下标和值分别以0,1开始,所以和我的定义不一样。

http://blog.csdn.net/yutianzuijin/article/details/11954939/

next数组计算:

public int[] getNext(String b)  {      int len=b.length();      int j=0;                int next[]=new int[len+1];//next表示长度为i的字符串前缀和后缀的最长公共部分,从1开始      next[0]=next[1]=0;                for(int i=1;i<len;i++)//i表示字符串的下标,从0开始      {//j在每次循环开始都表示next[i]的值,同时也表示需要比较的下一个位置          while(j>0&&b.charAt(i)!=b.charAt(j))j=next[j];          if(b.charAt(i)==b.charAt(j))j++;          next[i+1]=j;      }                return next;  } 

字符串匹配:

public void search(String original, String find, int next[]) {      int j = 0;      for (int i = 0; i < original.length(); i++) {          while (j > 0 && original.charAt(i) != find.charAt(j))              j = next[j];          if (original.charAt(i) == find.charAt(j))              j++;          if (j == find.length()) {              System.out.println("find at position " + (i - j));              System.out.println(original.subSequence(i - j + 1, i + 1));              j = next[j];          }      }  }  

原创粉丝点击