10. Regular Expression Matching

来源:互联网 发布:七龙珠战斗力官方数据 编辑:程序博客网 时间:2024/04/25 21:42

这道题,难度很大,而且边界条件比较复杂,需要小心谨慎考虑。此题的突破口在于"*"这个符号,无论解法是DFS递归,还是DP,之所以可行性的原因无非都利用了A*或者.*可以表示0个或者无数个A或者.的原因,而我DP可以使用的一个重要条件就是问题中存在子结构。切记切记。另外再吐槽一下网络上的解题报告,有的质量差劲得不行,如果要看别人的解法的话,一定要找到高质量的解题报告。否则会浪费太多时间。

Solution 1

DFS,递归。

  • p匹配完后,如果s还没匹配完,则匹配失败,否则成功。
  • 如果p当前字符的下一个字符为*,则考虑*的0次匹配isMatchRecur(s, p + 2)和其多次匹配(利用递归)。
  • 否则如果s匹配完了,p未匹配完,失败。
  • 判断sp当前字符是否匹配,成功则匹配下一个字符,否则失败。

代码中使用const char *而不直接使用string作为参数递归。使用const char *只用20ms,而使用string需要800ms

class Solution {  public:      bool isMatch(string s, string p) {        const char *ss = s.c_str();        const char *pp = p.c_str();        return isMatchRecur(ss, pp);    }    bool isMatchRecur(const char *s, const char *p) {        if (!*p)    return (!*s);<span style="white-space:pre"></span><span style="color:#ff0000;">(1)</span>        if ('*' == *(p + 1)) <span style="color:#ff0000;">(2) // 在整个算法中,需要注意的一点是p匹配的永远是除*以外的字符。</span>            return (isMatchRecur(s, p + 2) || (*s && (*s == *p || '.' == *p) && isMatchRecur(s + 1, p))); // 参看模式a*, 字符串aa        if (!*s)    return false; // 之所以不将此判断条件放在位置(1)处,是因为假如p=‘.*’,s='\0',则此函数将返回false,而事实上,在判断条件(2)中的<span style="font-family: Arial, Helvetica, sans-serif;">isMatchRecur(s, p + 2)为真,函数应该返回true。</span>        return (*s == *p || '.' == *p) ? isMatchRecur(s + 1, p + 1) : false; // 参照模式a., 字符串ab    }};

Solution 2

动态规划法。动态方程数组格式为:

[i,j-1]       [i,j]      [i,j+1]

[i+1,j-1]  [i+1, j]    [i+1,j+1]

dp[i+1][j+1]表示s[0..i]是否匹配p[0..j]。状态转移方程如下:

  • p[j] != '*'dp[i+1][j+1] = (s[i] == p[j] || p[j] == '*') && dp[i][j]
  • p[j] == '*'
    1. *匹配了0个字符。dp[i+1][j+1] = dp[i+1][j-1](跳过p[j]**前面的p[j-1]
    2. *匹配了1个字符。dp[i+1][j+1] = dp[i+1][j](跳过p[j]*)
    3. *匹配了2个或2个以上的字符。dp[i+1][j+1] = dp[i][j+1] && (p[j-1] == s[i] || p[j-1] == '.')s[0..i-1]p[0..j]匹配,并且p[j-1]s[i]匹配)
<pre name="code" class="cpp">class Solution {public:    bool isMatch(string s, string p) {        bool dp[s.size() + 1][p.size() + 1];        dp[0][0] = true; // 空的模式与空的字符串,应该为true        for (int i = 1; i <= s.size(); i++) // 字符串还有,模式为空            dp[i][0] = false;                for (int j = 1; j <= p.size(); j++) // 对照模式a*b*c*, a*或者.*可以匹配空字符串            dp[0][j] = j > 1 && p[j-1] == '*' && dp[0][j-2];                for (int i = 0; i < s.size(); i++) {            for (int j = 0; j < p.size(); j++) {// 注意在dp中,p[j]为*或者其他                if (p[j] != '*') {                    dp[i+1][j+1] = (p[j] == '.' || s[i] == p[j]) && dp[i][j];                } else {                    // 下面的三种情况分别为p[j-1]*匹配s[0...i]中0个, 1个, 或者多个字符。                    dp[i+1][j+1] = j > 0&&dp[i+1][j-1] || dp[i+1][j] || j > 0 && (p[j-1] == '.' || s[i] == p[j-1]) && dp[i][j+1];                }            }        }        return dp[s.size()][p.size()];    }};







0 0
原创粉丝点击