【编程马拉松】【027-最短编辑距离】
来源:互联网 发布:java 参数null 编辑:程序博客网 时间:2024/05/29 04:46
【编程马拉松算法目录】
【027-最短编辑距离】【工程下载>>>】
1 题目描述
1.1 输入描述:
UNIX系统下有一个行编辑器ed,它每次只对一行文本做删除一个字符、插入一个字符或替换一个字符三种操作。例如某一行的内容是“ABC”,经过把第二个字符替换成“D”、删除第一个字符、末尾插入一个字符“B”,这三步操作后,内容就变成了“DCB”。即“ABC”变成“DCB”需要经过3步操作,我们称它们的编辑距离为3。
现在给你两个任意字符串(不包含空格),请帮忙计算它们的最短编辑距离。
1.2 输出描述:
输入包含多组数据。每组数据包含两个字符串m和n,它们仅包含字母,并且长度不超过1024。
1.3 输入例子:
ABC CBCDABC DCB
1.4 输出例子:
23
2 解题思路
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:
(1) 删除一个字符;
(2) 插入一个字符;
(3) 将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离。设A的长度为m,B的长度为n创建一个二维数组d,大小为(m+1)*(n+1),来记录a1-am与b1-bn之间的编辑距离,要递推时,需要考虑对其中一个字符串的删除操作、插入操作和替换操作分别花费的开销,从中找出一个最小的开销即为所求结果。
操作步骤:
(一) 情况一:当A的长度为0,B的长度为j时,最小编辑距离就是j。
(二) 情况二:当A的长度为i,B的长度为0时,最小编辑距离就是i。
(三) 情况三:当A的长度为i,B的长度为j时,d[i][j]=min{d[i-1][j]+1,d[i][j-1]+1, d[i-1][j-1]+(A[i]==B[j]?0:1)}
其中:
● d[i][j]表示A的前i个字符和B的前j个字符相同后的最短距离。
● d[i][j]来自于三种状态
■ 删除,d[i-1][j]+1,A1,…,Ai-1经过操作可以变成了B1,…,Bj,那么A1,…,Ai-1Ai变为B1,…,Bj一定要删除Ai。
■ 插入,d[i][j-1]+1,A1,…,Ai经过操作可以变成了B1,…,Bj-1Bj,那么A1,…,Ai-1Ai变为B1,…,Bj-1Bj一定要添加一个字符。
■ 替换,如果A[i]=B[j],可以不进行额外的操作,那么有d[i][j]=d[i-1][j-1],如果不A[i]≠B[j],那么就要进行一次替换操作,有d[i][j]=d[i-1][j-1]+1。
注意:此处字符串中字符开始的下标从1开始计算
根据分析可以得到递推方程:
3 算法实现
import java.util.Scanner;/** * Author: 王俊超 * Time: 2016-05-13 20:12 * CSDN: http://blog.csdn.net/derrantcm * Github: https://github.com/Wang-Jun-Chao * Declaration: All Rights Reserved !!! */public class Main { public static void main(String[] args) { Scanner scanner = new Scanner(System.in);// Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt")); while (scanner.hasNext()) { String s = scanner.next(); String t = scanner.next(); System.out.println(shortest(s, t)); } scanner.close(); } /** * 最短编辑距离 * * @param s 字符串 * @param t 字符串 * @return 最短编辑距离 */ private static int shortest(String s, String t) { int row = s.length() + 1; int col = t.length() + 1; // 初始化 int[][] d = new int[row][col]; for (int i = 0; i < row; i++) { d[i] = new int[col]; } // 设置第一列 for (int i = 0; i < row; i++) { d[i][0] = i; } // 设置第一行 for (int j = 0; j < col; j++) { d[0][j] = j; } for (int i = 1; i < row; i++) { for (int j = 1; j < col; j++) { int u = d[i - 1][j] + 1; int v = d[i][j - 1] + 1; int w = d[i - 1][j - 1]; if (s.charAt(i - 1) != t.charAt(j - 1)) { w++; } d[i][j] = Math.min(u, Math.min(v, w)); } } return d[row - 1][col - 1]; }}
4 测试结果
5 其它信息
因为markddow不好编辑,因此将文档的图片上传以供阅读。Pdf和Word文档可以在Github上进行【下载>>>】。
- 【编程马拉松】【027-最短编辑距离】
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离
- 最短编辑距离算法
- HDU3356AGTC(最短编辑距离)
- 最短编辑距离算法
- 最短编辑距离 poj3356
- poj4323 最短编辑距离
- Number of 1 Bits
- 拉格朗日乘子法
- 哪种编程语言最值得花时间学习?
- opencv中的开运算,闭运算,形态学梯度,顶帽和黑帽
- 第44课:Spark Streaming之Spark内核回顾思考
- 【编程马拉松】【027-最短编辑距离】
- ubuntu下安装PostgreSQL笔记
- 对于文本与字符串之间的区别?
- 菜鸟之判断输入的是不是qq号的方法!
- [阶段一]Java基础类库(2)
- open-ble.org开源蓝牙ble-1_DA14580初级入门教程4:官方SDK教程
- Ubuntu 14.04/14.10下安装VMware Workstation 11图文教程
- 【NOIP2016提高组A组7.16】第三条跑道
- ubuntu14.04安装http代理squid并设置用户名和密码