最长公共子串【动态规划解法】
来源:互联网 发布:网络电视直播手机版 编辑:程序博客网 时间:2024/06/16 08:07
给定一个query和一个text,均由小写字母组成。要求在text中找出以同样的顺序连续出现在query中的最长连续字母序列的长度。
例如,query为“acbac”,text为“acaccbabb”,那么text中的“cba”为最长的连续出现在query中的字母序列,因此,返回结果应该为其长度3。
【说明:以下给出的算法时间复杂度为O(N^2),经大神指点,可以使用hash、后缀数据结构等高大上算法降低复杂度,正在潜心钻研中!】
参考:http://blog.csdn.net/lpshoucsd1/article/details/8976095
LCS(Longest Common Subsequence) 就是求两个字符串最长公共子串的问题。
比如:
String str1 = new String("adbccadebbca");
String str2 = new String("edabccadece");
str1与str2的公共子串就是bccade.
解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置.
下面是字符串21232523311324和字符串312123223445的匹配矩阵,前者为X方向的,后者为Y方向的。不难找到,红色部分是最长的匹配子串。通过查找位置我们得到最长的匹配子串为:21232
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
但是在0和1的矩阵中找最长的1对角线序列又要花去一定的时间。通过改进矩阵的生成方式和设置标记变量,可以省去这部分时间。下面是新的矩阵生成方式:
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 2 1 0 0 0 0
1 0 2 0 1 0 1 0 0 0 0 0 1 0 0
0 2 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 3 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 4 0 0 0 2 1 0 0 1 0 0 0
1 0 1 0 5 0 1 0 0 0 0 0 2 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 2 0 0 0 2 1 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
当字符匹配的时候,我们并不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断当前生成的元素的值是不是最大的,据此来改变标记变量的值,那么到矩阵完成的时候,最长匹配子串的位置和长度就已经出来了。
编写以下程序,偷懒一下,只计算出最大长度。
#include<stdio.h>#include<stdlib.h>#include<string.h>int lcs(char *text,char *query){int len1=strlen(text);int len2=strlen(query);int maxlen=0;int *p=(int *)malloc((len1+1)*sizeof(int));int i,j;for(i=0;i<len1+1;i++){p[i]=0;}for(i=0;i<len2;i++){for(j=len1;j>0;j--){if(query[i]==text[j-1]){p[j]=p[j-1]+1;if(p[j]>maxlen)maxlen=p[j];}else{p[j]=0;}}}return maxlen;}void main(){//获取字符串text和querychar text[500];char query[200];printf("please input the text string:");scanf(" %s",text);fflush(stdin);printf("please input the query string:");scanf(" %s",query);fflush(stdin);printf("%d\n",lcs(text,query));}
代码中,运用了一些小技巧,参考了博客:http://blog.csdn.net/steven30832/article/details/8260189
- 最长公共子串【动态规划解法】
- 最长公共子串的动态规划解法及其优化
- 最长公共子序列&&最长公共子串---[动态规划]
- 动态规划-最长公共子序列、最长公共子串
- 最长对称子串(动态规划解法)
- 动态规划 : 最长公共子串
- 动态规划-最长公共子串LCS
- 动态规划(6)最长公共子串
- 动态规划求解最长公共子串
- 【动态规划】最长公共子串问题
- 【动态规划】求最长公共子串
- 【动态规划】最长公共子串问题
- 动态规划:最长公共子串长度
- 动态规划之最长公共子串
- 动态规划之最长公共子串
- 动态规划--最长公共子串
- 最长公共子串(动态规划)
- 最长公共子串---动态规划
- 个人版机房收费系统总结
- hello
- MongoDB在java中的使用
- 黑马程序员 OC语言 - 9 NSDictionary、NSMutableDictionary、NSNumber、NSDate、NSValue
- ADF11g-022:ADF 文章收藏
- 最长公共子串【动态规划解法】
- 数据结构之希尔排序
- .net reflactor反编译以及依赖项处理——添加新表步骤
- 引用形参可以一个函数返回多个值
- Java中Interface的用法
- 中国剩余定理
- MySql按日期进行统计(前一天、本周、某一天)
- OC 打僵尸
- Ubuntu DNS server 设置