区间问题三部曲(1) : 在线区间最值算法

来源：互联网发布：淘宝详情页思路编辑：程序博客网时间：2024/05/29 16:25

区间问题是常见的统计问题之一，广泛应用于各类问题之中。主要形式有区间最值问题，区间和问题等。而区间最值问题可以分为静态区间最值和动态区间最值。我们先看一个情景：

描述

老管家是一个聪明能干的人。他为财主工作了整整10年，财主为了让自已账目更加清楚。要求管家每天记k次账，由于管家聪明能干，因而管家总是让财主十分满意。但是由于一些人的挑拨，财主还是对管家产生了怀疑。于是他决定用一种特别的方法来判断管家的忠诚，他把每次的账目按1，2，3…编号，然后不定时的问管家问题，问题是这样的：在a到b号账中最少的一笔是多少？为了让管家没时间作假他总是一次问多个问题。

输入格式

输入中第一行有两个数m,n表示有m(m<=100000)笔账,n表示有n个问题，n<=100000。
第二行为m个数,分别是账目的钱数
后面n行分别是n个问题,每行有2个数字说明开始结束的账目编号。

输出格式

输出文件中为每个问题的答案。具体查看样例。

测试样例1

输入

10 3 1 2 3 4 5 6 7 8 9 10 2 7 3 9 1 10

输出

2 3 1

最好想的方法就是暴力法，每次询问就过一遍区间找最小值，复杂度O(n^2)，对于100000数据量显然难以胜任。而如果开一个100000*100000的数组做优化空间又吃不消。所以我们需要ST算法来解决这个问题。
我们用这道题来解释ST算法的运行。

(1) 预处理’

预处理使用一个数组dp[0..n][log(n)+1]的数组，使dp[i][j]为从i开始(包括i)之后2^j个数字中的最小值。具体方法使用动态规划。

首先 dp[i][0] = a[i]，即从i开始后一个中的最小值为第i个数(自己嘛)
对于样例就是这样的
这里写图片描述

然后对于dp[j][i]，一定有dp[j][i] = min(dp[j][i-1],dp[j+2^(j-1)][i-1])

我们来证明他：dp[j][i-1]记录着j..j+2^(i-1)-1中的最小值, dp[j+2^(j-1)][i-1]则记录了j+2^(i-1)..j+2^(i-1)+2^(i-1)-1。合起来就是j..j+2^(i-1)+2^(i-1)-1即j..j+2^i-1为所求。

这里写图片描述

//无视excel公式纯属偷懒

最后搞dp顺序：因为计算dp[j][i] 需要 dp[j][i-1]和dp[j+2^(j-1)][i-1]。不难看出i计算dp[j][i]需要所有的dp[j][i-1]，即i是单调递增的。

dp要素都齐了，给一个程序片段吧(对于原题)

void init(){    for (int i = 1; i <= 18; i++)        for (int j = 1; j <= n; j++)            if (j+TwoPow(i) <= n)                 dp[j][i] = min(dp[j][i-1],dp[j+TwoPow(i-1)][i-1]);}

其中计算2^x使用了一个小技巧：

#define TwoPow(x) ((1)<<(x))

(2)询问

算出来这些个数看起来并没什么用。然而一种很好的算法可以在O(1)效率内计算出一段区间内的最小值。先看代码

int ask(int i, int j){    int k = (int)(log(j-i+1)/log(2));    return min(dp[i][k], dp[j-TwoPow(k)+1][k]);}

看起来有些云里雾里、、但是思想非常简单。我们举例说明下：

对于2..8这个区间如何利用已经求过的数据来解答呢？关键在于将区间分为两个长度为2^x(x为自然数)的子区间，且这两个区间的并为原区间，则这两个区间的最小值为所求。即2..5, 5..8，两个区间长度都为4。2..8的最小值即为dp[2][2], dp[5][2]

再例如对于3..7, 可以分成3..6, 4..7；对于3..8，可以分成3..6, 5..8。

一般的，对于区间a = i..j, 一定可以分成区间i..log2(|a|), j-log2(|a|)+1..j。|a|为区间a的长度，即j-i+1。log2用换底公式可以求出来。

证明这个方法，即区间i..2^(log2(|a|))，j-log2(|a|)+1..2^log2(|a|)的并为原区间非常简单，这里省略。

最后给出完整代码

#include <iostream>#include <cstring>#include <cmath>#include <cstdio>using namespace std;#define maxn 100010int dp[maxn][20];int n, q;#define TwoPow(x) ((1)<<(x))void init(){    for (int i = 1; i <= 18; i++)        for (int j = 1; j <= n; j++)            if (j+TwoPow(i) <= n)                 dp[j][i] = min(dp[j][i-1],dp[j+TwoPow(i-1)][i-1]);}int ask(int i, int j){    int k = (int)(log(j-i+1)/log(2));    return min(dp[i][k], dp[j-TwoPow(k)+1][k]);}int main(){    memset (dp, 127/3, sizeof(dp));    scanf("%d%d", &n, &q);    for (int i = 1; i <= n; i++)        scanf("%d", &dp[i][0]);    init();    int i, j;    while (q --> 0) {        scanf("%d%d", &i, &j);        printf("%d ", ask(i,j));    }    return 0;}

吐槽一下c++的IO、、过于慢，居然TLE了、、、看看结果

//暴力法评测结果#0: Accepted (0ms, 768KiB)#1: Accepted (0ms, 768KiB)#2: Accepted (15ms, 800KiB)#3: Accepted (0ms, 796KiB)#4: Accepted (468ms, 1864KiB)#5: Accepted (109ms, 980KiB)#6: Accepted (265ms, 1180KiB)#7: Accepted (795ms, 2792KiB)#8: Time Limit Exceeded (1809ms, 3356KiB)#9: Accepted (842ms, 2828KiB)

//ST算法#0: Accepted (15ms, 8360KiB)#1: Accepted (0ms, 8360KiB)#2: Accepted (0ms, 8364KiB)#3: Accepted (15ms, 8360KiB)#4: Accepted (140ms, 8364KiB)#5: Accepted (15ms, 8364KiB)#6: Accepted (31ms, 8364KiB)#7: Accepted (31ms, 8360KiB)#8: Accepted (359ms, 8364KiB)#9: Accepted (406ms, 8368KiB)

别走开、第二场战斗（动态区间和）马上开始、、、虽然没什么人看。。。

1 0