编辑距离问题

来源:互联网 发布:足球数据app 编辑:程序博客网 时间:2024/05/19 01:30
编辑距离问题

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。

输入

第1行:字符串a(a的长度 <= 1000)。第2行:字符串b(b的长度 <= 1000)。

输出

输出a和b的编辑距离

输入示例

kittensitting

输出示例

3
递推式:f(i,j) = min(f(i – 1, j – 1) + same(i,j), f(i – 1,j ) + 1, f(i, j – 1) + 1);f(0, j) = j;
f(i, 0) = i;

伪代码:
for j = 0 to n do    f[j] = jendforfor i = 1 to m do    last = f[0]    f[0] = i    for j = 1 to n do         temp = f[i,j]        f[i,j] = min(last + same(i,j), temp + 1, f[j – 1] + 1)        last = temp    endforendfor
AC代码:
#include<cstdio>#include<algorithm>#include<iostream>#include<cstring>int dp[1001][1001];using namespace std;int main(){char a[1001],b[1001];while(scanf("%s %s",a+1,b+1)!=EOF){a[0]=b[0]='0';int n=strlen(a)-1,m=strlen(b)-1;memset(dp,0,sizeof(dp));for(int i=0;i<max(n,m);i++){dp[0][i]=dp[i][0]=i;}for(int i=1;i<=n;i++){for(int j=1;j<=m;j++){if(a[i]==b[j]){dp[i][j]=dp[i-1][j-1];}else{dp[i][j]=dp[i-1][j-1]+1;}dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i][j]);}}printf("%d\n",dp[n][m]);}return 0;}