编辑距离

来源:互联网 发布:2017mac设置iphone铃声 编辑:程序博客网 时间:2024/06/16 05:06

题目:https://cn.vjudge.net/contest/178832#problem/A

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。


思路:这道题一看感觉很复杂的样子,慢慢的分析。首先它是两个字符串相互转换,联想到类似的最长公共子序列和最长上升子序列的题目;

最长公共子序列的状态方程为:dp[i][j]表示第一个字符串前i个和第二个字符串前j个的最大公共字符数;

dp[i+1][j+1]=dp[i][j]+1(a[i]==b[j]),   

 dp[i+1][j+1]=max(dp[i][j+1],dp[i+1][j])(a[i]!=b[j])表示把a字符的新字符放入或者把b的新字符放入

最长上升子序列为dp[len]表示长度为len取的最小的数,看最后len等于多少。if(a[i]>dp[len])dp[len++]=a[i],else

a[i]能插入的最小位置;


对比这道题,也应该是用dp.dp[i][j]表示第一个字符前i个和第二个字符前j个相互转化的最小操作数;

如果a[i]==b[j],不需要操作,dp[i][j]=dp[i-1][j-1];

else         可能是插入a(删除b),dp[i][j-1]+1,或者插入b(删除a)dp[i-1][j]+1,或者替换dp[i-1][j-1]+1.

#include<iostream>#include<algorithm>#include<string.h>#include<string>using namespace std;#define maxn 1000+5int dp[maxn][maxn];char a[maxn], b[maxn];int MIN(int x, int y, int z){return min(min(x, y),z);}int main(){int na, nb;while (cin >> a+1 >> b+1){int s;na = strlen(a+1);nb = strlen(b+1);memset(dp, 0, sizeof(dp));for (int i = 1; i <= na; i++)dp[i][0] = i;for (int j = 1; j <= nb; j++)dp[0][j] = j;for(int i=1;i<=na;i++)for (int j = 1; j <= nb; j++){if (a[i] == b[j])s = 0;elses = 1;dp[i][j] = MIN(dp[i - 1][j - 1] + s, dp[i - 1][j] + 1, dp[i][j - 1] + 1);}cout << dp[na][nb] << endl;}return 0;}

原创粉丝点击