编辑距离算法的java实现
来源:互联网 发布:55开和淘宝权不联系了 编辑:程序博客网 时间:2024/05/01 15:24
编辑距离就是用来计算从原串(s)转换到目标串(t)所需要的最少的插入,删除和替换的数目,在NLP中应用比较广泛。以下是一个java实现的版本:
public class EditDistance {
/**
* 求三个数中的最小数Mar 1, 2007
*
* @param a
* @param b
* @param c
* @return
*/
private static int Minimum(int a, int b, int c) {
int mi;
mi = a;
if (b < mi) {
mi = b;
}
if (c < mi) {
mi = c;
}
return mi;
}
/**
* 计算两个字符串间的编辑距离Mar 1, 2007
* @param s
* @param t
* @return
*/
public static int getEditDistance(String s, String t) {
int d[][]; // matrix
int n; // length of s
int m; // length of t
int i; // iterates through s
int j; // iterates through t
char s_i; // ith character of s
char t_j; // jth character of t
int cost; // cost
// Step 1
n = s.length();
m = t.length();
if (n == 0) {
return m;
}
if (m == 0) {
return n;
}
d = new int[n + 1][m + 1];
// Step 2
for (i = 0; i <= n; i++) {
d[i][0] = i;
}
for (j = 0; j <= m; j++) {
d[0][j] = j;
}
// Step 3
for (i = 1; i <= n; i++) {
s_i = s.charAt(i - 1);
// Step 4
for (j = 1; j <= m; j++) {
t_j = t.charAt(j - 1);
// Step 5
if (s_i == t_j) {
cost = 0;
} else {
cost = 1;
}
// Step 6
d[i][j] = Minimum(d[i - 1][j] + 1, d[i][j - 1] + 1,
d[i - 1][j - 1] + cost);
}
}
// Step 7
return d[n][m];
}
}
public class EditDistance {
/**
* 求三个数中的最小数Mar 1, 2007
*
* @param a
* @param b
* @param c
* @return
*/
private static int Minimum(int a, int b, int c) {
int mi;
mi = a;
if (b < mi) {
mi = b;
}
if (c < mi) {
mi = c;
}
return mi;
}
/**
* 计算两个字符串间的编辑距离Mar 1, 2007
* @param s
* @param t
* @return
*/
public static int getEditDistance(String s, String t) {
int d[][]; // matrix
int n; // length of s
int m; // length of t
int i; // iterates through s
int j; // iterates through t
char s_i; // ith character of s
char t_j; // jth character of t
int cost; // cost
// Step 1
n = s.length();
m = t.length();
if (n == 0) {
return m;
}
if (m == 0) {
return n;
}
d = new int[n + 1][m + 1];
// Step 2
for (i = 0; i <= n; i++) {
d[i][0] = i;
}
for (j = 0; j <= m; j++) {
d[0][j] = j;
}
// Step 3
for (i = 1; i <= n; i++) {
s_i = s.charAt(i - 1);
// Step 4
for (j = 1; j <= m; j++) {
t_j = t.charAt(j - 1);
// Step 5
if (s_i == t_j) {
cost = 0;
} else {
cost = 1;
}
// Step 6
d[i][j] = Minimum(d[i - 1][j] + 1, d[i][j - 1] + 1,
d[i - 1][j - 1] + cost);
}
}
// Step 7
return d[n][m];
}
}
- 编辑距离算法的java实现
- 编辑距离算法的实现
- 相似度的算法(编辑距离法)(Java实现代码)
- 最小编辑距离算法JAVA实现
- 编辑距离算法实现
- 编辑距离算法-java
- 编辑距离算法(java)
- 编辑距离(LD)算法的python实现
- 编辑距离--java实现
- java实现的最小编辑距离
- java实现编辑距离算法,计算字符串相似度
- 计算编辑距离的算法
- LD 算法实现(编辑距离算法)
- LD 算法实现(编辑距离算法)
- 编辑距离的Ruby实现
- 编辑距离的php实现
- 字符串的编辑距离和编辑距离算法
- Levenshtein distance最小编辑距离算法实现
- 掌握AJAX, 第 9部分: 运用Google Ajax搜索API
- enet网络学院黑客教程
- 千里之行,始于足下。
- 接口和抽象类的区别
- cana的新浪blog
- 编辑距离算法的java实现
- pku题目分类
- 遇到的JDBC的一个问题
- 取有任意固定间隔符的String
- Java更新XML的四种常用方法简介
- DataGrid自定义排序
- 半年网络推广和个人站长的心得
- asp.net 文件夹
- 这两天