Edit Distance @leetcode

来源:互联网 发布:怎样导出数据库 编辑:程序博客网 时间:2024/06/07 20:00

转载自:http://blog.csdn.net/linhuanmars/article/details/24213795

这道题求一个字符串编辑成为另一个字符串的最少操作数,操作包括添加,删除或者替换一个字符。这道题难度是比较大的,用常规思路出来的方法一般都是brute force,而且还不一定正确。这其实是一道二维动态规划的题目,模型上确实不容易看出来,下面我们来说说递推式。 

我们维护的变量res[i][j]表示的是word1的前i个字符和word2的前j个字符编辑的最少操作数是多少。假设我们拥有res[i][j]前的所有历史信息,看看如何在常量时间内得到当前的res[i][j],我们讨论两种情况: 
1)如果word1[i-1]=word2[j-1],也就是当前两个字符相同,也就是不需要编辑,那么很容易得到res[i][j]=res[i-1][j-1],因为新加入的字符不用编辑; 
2)如果word1[i-1]!=word2[j-1],那么我们就考虑三种操作,如果是插入word1,那么res[i][j]=res[i-1][j]+1,也就是取word1前i-1个字符和word2前j个字符的最好结果,然后添加一个插入操作;如果是插入word2,那么res[i][j]=res[i][j-1]+1,道理同上面一种操作;如果是替换操作,那么类似于上面第一种情况,但是要加一个替换操作(因为word1[i-1]和word2[j-1]不相等),所以递推式是res[i][j]=res[i-1][j-1]+1。上面列举的情况包含了所有可能性,有朋友可能会说为什么没有删除操作,其实这里添加一个插入操作永远能得到与一个删除操作相同的效果,所以删除不会使最少操作数变得更好,因此如果我们是正向考虑,则不需要删除操作。取上面几种情况最小的操作数,即为第二种情况的结果,即res[i][j] = min(res[i-1][j], res[i][j-1], res[i-1][j-1])+1。 

接下来就是分析复杂度,算法时间上就是两层循环,所以时间复杂度是O(m*n),空间上每一行只需要上一行信息,所以可以只用一维数组即可,我们取m, n中小的放入内层循环,则复杂度是O(min(m,n))。代码如下:

class Solution {public:    int minDistance(string word1, string word2) {        int isz1 = word1.size();        int isz2 = word2.size();        if(isz1 <= 0) return isz2;        if(isz2 <= 0) return isz1;        vector <vector<int> > dp = vector<vector<int> > (isz1+1,vector<int>(isz2+1,0));       for(int i = 0;i <= isz1;i ++)       {           dp[i][0] = i;       }       for (int i = 0;i <= isz2;i ++)       {           dp[0][i] = i;       }       dp[0][0] = 0;       // dp[0] = isz2;        for(int i = 1;i <= isz1;i ++)        {            for (int j = 1;j <= isz2;j ++)            {                if(word1[i-1] == word2[j-1])                {                    dp[i][j] = dp[i-1][j-1];                }                else                {                    dp[i][j] = mymin(dp[i-1][j],dp[i-1][j-1],dp[i][j-1])+1;                }            }        }        return dp[isz1][isz2];    }    int mymin (int a,int b ,int c)    {        int min = a;        min = min<b? min:b;        min = min < c? min: c;        return min;    }};

这道题目算是难度比较大的题目,所以在短时间的面试可能时间太紧了,所以也有变体。我自己在面试Google的时候,问的是如何判断edit distance是不是在1以内,返回true或false就可以了。这样一改其实就没有必要动态规划了,只需要利用距离只有1这一点进行判断就可以,大概思路就是只要有一个不同,接下来就不能再有不同了,有兴趣的朋友可以想想哈。


0 0