两字符串最长公共子序列--动态规划

来源:互联网 发布:司法淘宝拍卖网房产 编辑:程序博客网 时间:2024/06/16 05:48

首先碰到求两字符串最长公共连续子串的问题,然后想到原先做过的求两字符串最长公共子序列问题,所以又把算法导论上的解法看了一下。

这两个问题是不同的问题,求最长公共子序列不要求求得的子字符串时连续的,比如说ACB和AB的最长公共子序列就是AB。而最长公共连续子串,要求求得的子串在两个字符串中必须是连续出现的,还是ACB和AB他们的最长公共子串是A或者是B。这里说的是求两字符串的最长公共子序列,用的是动态规划。

动态规划求解最优化问题应该具备的两个要素:最优化子结构和子问题重叠。我的理解就是碰到问题先看看能不能把大问题化解为小问题解决,这就是我对最优子结构的理解。子问题重叠意思就是说,你在求子问题的时候一些工作是重复做了,看看能不能想办法避免以下。

对于动态规划的运用我还不是很熟练,但我在碰到问题时往往是这样做的:先判断原先的问题能不能化解为小问题,如果能化为小问题的话,怎么求解,试着写一下(递推)公式。如果递推公式写成功了的话,恰巧符合动态规划求解。自然而然就可以应用动态规划了。动态规划的应用最主要的就是写出递推公式。

下面言归正传,求两个字符串的最长公共子序列。借用算法导论上的表示方法,给定一个字符串X=<x_1,x_2,...,x_m>(下划线后面的数字表示下标),另一个字符串Y=<y_1,y_2,...,y_n>,求X和Y的最长公共子序列。同时我们用X_i表示X中前i个字符构成的字符串X_i = <x_1,...,x_i>,用Y_j表示Y红前j个字符构成的字符串Y_j = <y_1,y_2,...,y_j>。

现在就想怎么把问题变为为小问题呢?怎么解决这个问题呢?

关键要找到问题的突破口,先不要管最终解决,先想一想怎么吧问题花姐的规模小一些。我先分别拿两个字符串的最后一个字符“开刀”,先拿他们比较

1)我们可以首先比较x_m和y_n如果这两个字符相同,那么x_m = y_n一定是最长公共子序列中的一个字符。那么我们的问题就是求X_(m-1) = <x_1,...,x_(m-1)>和Y_(n-1) = <y_1,...,y_(n-1)>的最长公共子序列了。如果能求出X_(m-1)和Y_(n-1)的最长公共子序列,这个子序列在加上字符x_m = y_n就是我们所求问题的最长公共子序列了。

2)如果x_m != y_n,我们要求X和Y的最长公共最序列,就转为求两个子问题,一个是求X_m和Y_(n-1)的最长公共子序列,另一个是求X_(m-1)和Y_n的最长公共子序列。取两者中最长的那个就是问题的解。


至此,大问题就化为小问题的,具体我们可以写递推公式。

假如用c[i,j]表示X_i和Y_j序列的最大公共子序列的长度的话

c[i,j] = 0 如果i == 0或者j == 0

c[i,j] = c[i - 1][j - 1] 如果x_j == y_j

c[i,j] = max(c[i-1,j], c[i, j-1])   如果x_i != y_j

有了递推公式,定义对应递推公式的数组,就可以求得最终的答案。


#include<iostream>#include<string>#include<vector>using namespace std;int max(const int& a, const int& b) {return (a > b ? a : b);}//模板函数用来输出二维数组template<class Type>void print_vector(const vector<vector<Type> >& vec) {for(size_t i = 0; i != vec.size(); i++) {for(size_t j = 0; j != vec[i].size(); j++) {cout << vec[i][j] << " ";}cout << endl;}}//getLCS函数用来求两个字符串的最大公共子序列,并返回其长度int getLCS(const string& str1, const string& str2){if(str1.empty() || str2.empty()) {return 0;}size_t len1 = str1.size();size_t len2 = str2.size();//lcs用来保存两字符串str1[0,...,row]和str1[0,...,col]的最长公共序列的长度vector<vector<int> > lcs(len1 + 1, vector<int> (len2 + 1, 0));//index用来保存如何找到最长公共子序列vector<vector<char> > index(len1 + 1, vector<char> (len2 + 1, '-'));for(size_t row = 0; row != len1 + 1; row++) {for(size_t col = 0; col != len2 + 1; col++) {if(row == 0 || col == 0) {lcs[row][col] = 0;continue;}if(str1[row - 1] == str2[col - 1]) {lcs[row][col] = lcs[row - 1][col - 1] + 1;index[row][col] = '=';}if(str1[row - 1] != str2[col - 1]) {//lcs[row][col] = max(cls[row - 1][col], cls[row][col - 1]);if(lcs[row - 1][col] > lcs[row][col - 1]) {lcs[row][col] = lcs[row - 1][col];index[row][col] = 'u';}else {lcs[row][col] = lcs[row][col - 1];index[row][col] = 'l';}}}}cout << "lcs vector is " << endl;print_vector(lcs);cout << "index vector is " << endl;print_vector(index);return lcs[len1][len2];}int main(void){string str1, str2;cin >> str1 >> str2;int len = 0;len = getLCS(str1, str2);cout << "最长公共子序列的长度是:" << len << endl;return 0;}


0 0
原创粉丝点击