【转载】leetcode中的backtracking

来源：互联网发布：卖py什么意思网络用语编辑：程序博客网时间：2024/06/10 01:49

1. backtracking

Sudoku是典型的backtracking问题，有关backtracking的问题《The Algorithm Design Manual》 7.1章解释的最详细易懂。Backtracking的定义如下：

Backtracking is a systemic way to iterate through all the possible configurations of a search space.

简而言之，backtracking就是通过遍历所有组合，并从中找出符合条件的结果集的一种方法。因此，一种非常直观的backtracking算法可以描述如下：

[cpp] view plaincopy
<span style="font-family:Microsoft YaHei;">// array: 保存了[0, step-1]每一步的选择  
// step: 当前是第几步  
  
backtracking(array, step)  
{  
    // 判断前step步的选择是否可以构成一个结果  
    if (is_a_solution(array, step)) {  
        process_solution(array, step);  
    } else {  
        step++;  
        // 获取下一步的所有选择  
        condidates = construct_candidates(array, step);  
        foreach c in condidates {  
            // 对每一种选择，继续递归下去  
            array[step] = c;  
            make_move(array, step);  
            backtracking(array, step);  
            unmake_move(array, step);  
        }  
    }  
}</span>  

其中重要函数有这样几个：

is_a_solution：判断当前组合是否是一个期望的结果
process_solution：处理结果，例如打印出来
construct_candidates：获取下一步的所有选择。注意，这里并没有说明如何选择下一步该如何进行，大多数情况下，这个函数还应当有选择下一步的功能
make_move：向前进一步。通常这意味着在array中填充这一步的所选择的的值
unmake_move：向后退一步。通常这意味着在array中将这一步的值清空

对于数独问题，套用上面的算法，大概步骤如下：

[cpp] view plaincopy
<span style="font-family:Microsoft YaHei;">#define DIMENSION 3;  
bool solve(vector<vector<char> > &board, int step) {  
    // 1. is_a_solution  
    if (step == DIMENSION*DIMENSION*9) return true;  
  
    // 2. get next square and its all candidates  
    int row = 0, col = 0;   // position to move next, start from 0;  
    set<char> possible_values;  
    get_next_square(board, row, col, possible_values, step);  
  
    for (set<char>::iterator it = possible_values.begin();   
            it != possible_values.end(); ++it) {  
        board[row][col] = *it;              // make_move  
        if (solve(board, step+1)) return true;  
        board[row][col] = EMPTY;            // unmake_move  
    }  
  
    return false;  
}</span>  

2. 如何选择下一步

backtracking主要有两种应用：

获取所有组合。典型问题：

Letter Combinations of a Phone Number：给出电话号码，求电话号码对应的所有字符串
Generate Parentheses：求所有n对括号"()"组成的字符串
Combination Sum：给定一组数字和一个target值，求所有和等于target的组合（组合中每个数字可以出现多次）
Combination Sum2：和Combination Sum问题一样，区别是组合中每个数字只能出现一次
Permutations：求一组数字的全排列
Permutations2：和Permutations问题一样，区别是给定的一组数字有重复，并且要求结果集中不能有重复的组合

从所有的组合中找出符合条件的结果集。典型问题：
- Sudoku Solver：数独解

第一类问题需要遍历所有解，有些特殊的情况无非是结果集中需要去重，这些都可以通过精细地选择”下一步的值“来做到。例如，在每一步中，可以对”这一步可选的值“做排序，相同的值只选一次，这样可以解决绝大多数”结果集去重“问题（例如Combination Sum2和Permutations2）

第二类问题与第一类问题有着根本不同。第二类问题可以在遍历一组组合的过程中，如果发现当前的组合已经不可能满足条件，则无需遍历完，即可在中途丢提当前的组合，直接跳到下一种组合。

考虑数独问题，首先，如果我们在构造一个组合的过程中，发现某个格子填入任何值都不可能满足条件，那么当前的组合无需再计算下去，必然是之前某些步出错。无需再计算当前还没有填充的其他格子的值，直接丢弃当前解，跳到上一步尝试其他值即可。

说道这里，其实还有一个最关键的问题没有细说，那就是如何选择下一步？

例如sudoku问题，最直观的做法是随机选择一个还是空白的格子，还能再优化吗？考虑这样的情况：假设当前空白的格子中，有一个格子有5种可能的值，有一个格子只有1个可能的值，那么应当先选择哪个格子？显然，选择只有1个可能值的格子更好。填充了这个格子，能够减少其他未填充格子的可选择值，也就降低了unmake_move的次数。

但是这样一定比随机选择更快吗？细心的读者能够发现，这样的选择方式，在每次选择下一步的时候，会花费相当的时间去查找”可选择值最少“的空白格子。每一步，我们对所有空白格子，计算它们的可选择值；计算可选择值的过程是查看当前行、当前列、当前9格。其实，这和随机选择一样，最后都会得到时间代价O(n^4)的算法。

3. 更多的优化

其实这里还有继续优化的空间，这里不详细展开，只说一下大概的思路。

使用数组保留每个空白格子的可选值。每当有空白格被填入了数字，重新计算受影响的空白格的可选值（当前行、当前列、当前9格）
不那么严格的选择。例如，我们可以只计算每个9格中的空白格的数量，从空白格最少的9格中，随机选出一个空白格，作为下一步要填充的格子。这是一种不那么严格的选择，好处是每个9格的空白格数量可以快速地计算出，同时保证了unmake_move的次数比随机选择要大大减少。

4. 暴力破解 VS 精细选择

每一步随机选择一个空白格，这其实就是一种暴力破解的方法，这里还有另一种暴力破解的方法，经过计算就会发现，其实两者的算法复杂度基本相当。前文提到的精细选择，如果精细选择的过程没有优化，算法的复杂度其实没有变化，有兴趣的同学可以自己证明和验证。