【字符串处理系列】最长重复子串

来源:互联网 发布:如何加入淘宝直通车 编辑:程序博客网 时间:2024/05/21 07:12

最长重复子串是指在字符串中中找出两个子串(可以覆盖),他们的公共前缀最长;所以可以采用后缀数组的解法,首先得到所有后缀数组并排序,然后找出所有相邻两个子串之间的最长前缀;由于字符串比较的时间复杂度是O(N),排序算法的时间复杂度是O(NlogN);所以该算法的时间复杂度是O(N*N*logN)

代码如下:

import java.util.Arrays;public class LongestRepSubSequence {public static void main(String[] args) {// TODO Auto-generated method stublongestRepSubSequence("abcdabcdef");}public static void longestRepSubSequence(String str){String[] strArray = new String[str.length()];for(int i = 0; i < str.length(); i++){strArray[i] = str.substring(i);}Arrays.sort(strArray);int maxCommonLen = 0;String maxCommonStr = new String();for(int i = 0; i < strArray.length-1; i++){int len = 0;for(int j = 0; j < strArray[i].length() && j < strArray[i+1].length(); j++){if(strArray[i].charAt(j) == strArray[i+1].charAt(j))len++;elsebreak;}if(len > maxCommonLen){maxCommonLen = len;maxCommonStr = strArray[i].substring(0, len);}}System.out.println("Max Common Length: " + maxCommonLen);System.out.println("Max Common Sequence: " + maxCommonStr);}}

第二种解法是采用动态规划的解法,创建一个二维数组t,假如字符串s的i和j位置的字符相等,则:t[i][j] = t[i-1][j-1] + 1(当i-1 >= 0 && j-1 >= 0时);当i为0或者j为0,且s[i] == s[j],则t[i][j] = 1;当s[i] 与s[j]不相等,则t[i][j] = 0;动态规划的时间复杂度是O(N*N);代码此处省略

0 0