字符串的相似度

来源:互联网 发布:网络真人赌博有猫腻吗 编辑:程序博客网 时间:2024/05/14 07:02

用最少的步骤将源字符串变成目标字符串,可选的操作可以是
1 加一个
2 减一个
3 修改
操作次数,叫做这两个字符串的编辑距离,即相似度。

动态规划:
设f(i, j) 为源字符串的前i个字符与目标字符串的前j个字符的子串距离,则
f(i, j) = min{
f(i, j-1) + 1, 加一个
f(i-1, j) + 1, 减一个
f(i-1, j-1) + g(i, j) 修改
}
其中,
g(i, j) = 1, if a[i] != b[j], 或者
g(i, j) = 0, if a[i] == b[j]
这里写图片描述

初始化二维数组时加上i=0和j=0。

    public int distance(char[] a, char[] b){        int n = a.length;        int m = b.length;        int[][] f = new int[n+1][m+1];        for(int k=1; k<=n; k++){            f[k][0] = k;        }        for(int k=1; k<=m; k++){            f[0][k] = k;        }        for(int i=1; i<=n; i++){//按行填充            for(int j=1; j<=m; j++){//向右填充                int x = f[i][j-1] > f[i-1][j] ? f[i-1][j] : f[i][j-1];                int y = f[i-1][j-1];                if(a[i-1] != b[j-1]){                    y++;                }                f[i][j] = x>y ? y : x;            }        }        return f[n][m];    }
0 0
原创粉丝点击