最长公共子序列(LCS)
来源:互联网 发布:网络通信代维招聘 编辑:程序博客网 时间:2024/06/06 00:01
一个字符串S,去掉零个或者多个元素所剩下的子串称为S的子序列。最长公共子序列就是寻找两个给定序列的子序列,该子序列在两个序列中以相同的顺序出现,但是不必要是连续的。
例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一个公共子序列,但是不是X和Y的最长公共子序列,子序列BCBA是X和Y的一个LCS,序列BDAB也是。寻找LCS的一种方法是枚举X所有的子序列,然后注意检查是否是Y的子序列,并随时记录发现的最长子序列。假设X有m个元素,则X有2^m个子序列,指数级的时间,对长序列不实际。
使用动态规划求解这个问题,先寻找最优子结构。设X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>为两个序列,
LCS(X,Y)表示X和Y的一个最长公共子序列,可以看出
1、如果xm=yn,则LCS ( X,Y ) = xm + LCS ( Xm-1,Yn-1 )。
2、如果xm!=yn,则LCS( X,Y )= max{ LCS ( Xm-1, Y ), LCS ( X, Yn-1 ) }
LCS问题也具有重叠子问题性质:为找出X和Y的一个LCS,可能需要找X和Yn-1的一个LCS以及Xm-1和Y的一个LCS。但这两个子问题都包含着找Xm-1和Yn-1的一个LCS,等等.DP最终处理的还是数值(极值做最优解),找到了最优值,就找到了最优方案;为了找到最长的LCS,我们定义dp[i][j]记录序列LCS的长度,合法状态的初始值为当序列X的长度为0或Y的长度为0,公共子序列LCS长度为0,即dp[i][j]=0,所以用i和j分别表示序列X的长度和序列Y的长度,状态转移方程为
dp[i][j] = 0 如果i=0或j=0
dp[i][j] = dp[i-1][j-1] + 1 如果X[i-1] = Y[i-1]
dp[i][j] = max{ dp[i-1][j], dp[i][j-1] } 如果X[i-1] != Y[i-1]
求出了最长公共子序列的长度后,输出LCS就是输出dp的最优方案了,既可以用一个额外的矩阵存储路径,也可以直接根据状态转移矩阵倒推最优方案。
代码如下:
import java.util.Random;/* * 最长公共子序列 */public class LCS{ char[][] b; int[][] c; public static void main(String[] args){ //设置字符串长度 int substringLength1 = 10; int substringLength2 = 15; //具体大小可自行设置 // 随机生成字符串 String x = GetRandomStrings(substringLength1); String y = GetRandomStrings(substringLength2); Long startTime = System.nanoTime(); // 构造二维数组记录子问题x[i]和y[i]的LCS的长度 System.out.println("substring1:"+x); System.out.println("substring2:"+y); x=" "+x; y=" "+y; LCS lcs=new LCS(); lcs.lcsLength(x, y); lcs.printLcs(x, x.length()-1, y.length()-1); } public void lcsLength(String x,String y){ int m=x.length(); int n=y.length(); b=new char[m][n]; c=new int[m+1][n+1]; for(int i=1;i<m+1;i++){ c[i][0]=0; } for(int i=0;i<m+1;i++){ c[0][i]=0; } for(int i=1;i<m;i++){ for(int j=1;j<n;j++){ if(x.charAt(i)==y.charAt(j)){ c[i][j]=c[i-1][j-1]+1; b[i][j]='m'; }else if(c[i-1][j]>=c[i][j-1]){ c[i][j]=c[i-1][j]; b[i][j]='t'; }else { c[i][j]=c[i][j-1]; b[i][j]='r'; } } } } public void printLcs(String x,int i,int j){ if(i==0||j==0) return; if(b[i][j]=='m'){ printLcs(x, i-1, j-1); System.out.print(x.charAt(i)); }else if(b[i][j]=='t') printLcs(x, i-1, j); else printLcs(x, i, j-1); } //取得定长随机字符串 public static String GetRandomStrings(int length){ StringBuffer buffer = new StringBuffer("abcdefghijklmnopqrstuvwxyz"); StringBuffer sb = new StringBuffer(); Random r = new Random(); int range = buffer.length(); for (int i = 0; i < length; i++){ sb.append(buffer.charAt(r.nextInt(range))); } return sb.toString(); } }
- LCS:最长公共子序列
- LCS---最长公共子序列
- 最长公共子序列 LCS
- LCS -- 最长公共子序列
- LCS最长公共子序列
- 最长公共子序列LCS
- LCS-最长公共子序列
- 最长公共子序列 LCS
- 最长公共子序列(LCS)
- 最长公共子序列(LCS)
- 最长公共子序列LCS
- LCS最长公共子序列
- 最长公共子序列LCS
- 最长公共子序列 LCS
- LCS最长公共子序列
- 最长公共子序列(LCS)
- 最长公共子序列LCS
- 最长公共子序列LCS
- TableView分割线顶端对齐
- CentOS 6.5 NFS的安装配置、启动及mount挂载方法
- Java ArrayList toArray() 方法的正确使用
- 关于Spring整合Quartz,以及对quartz的理解
- spring mybatis 动态代理
- 最长公共子序列(LCS)
- javascript原型链
- Java读取txt文件编码格式
- 2016/5/11
- 浅析Alljoyn中设备的发现和连接
- Spark MLlib 机器学习算法与源码解析(网络课程—第一期)
- doxygen将头文件生成html文档
- 1.python基础学习__函数中的参数
- Android程序优化之对屏幕旋转的处理总结