RMQ 是英文 Range Maximum/Minimum Query 的缩写,表示区间最大(最小)值。使用倍增思想解决 RMQ 问题的方法是 ST 表(Sparse Table, 稀疏表 )。ST 表是用于解决 可重复贡献问题 的数据结构。
可重复贡献问题 是指对于运算 opt ? \operatorname{opt} opt,满足 x opt ? x = x x\operatorname{opt} x=x xoptx=x,则对应的区间询问就是一个可重复贡献问题。例如,最大值有 max ? ( x , x ) = x \max(x,x)=x max(x,x)=x, g c d gcd gcd 有 gcd ? ( x , x ) = x \operatorname{gcd}(x,x)=x gcd(x,x)=x,所以 RMQ 和区间 GCD 就是一个可重复贡献问题。像区间和就不具有这个性质,如果求区间和的时候采用的预处理区间重叠了,则会导致重叠部分被计算两次。另外, opt ? \operatorname{opt} opt 还必须满足结合律才能使用 ST 表求解。
题目链接:【模板】ST 表
这是一道 ST 表经典题——静态区间最大值
请注意最大数据时限只有 0.8s,数据强度不低,请务必保证你的每次查询复杂度为 O ( 1 ) O(1) O(1)。若使用更高时间复杂度算法不保证能通过。
如果您认为您的代码时间复杂度正确但是 TLE,可以尝试使用快速读入:
inline int read()
{
int x=0,f=1;char ch=getchar();
while (ch<'0'||ch>'9'){if (ch=='-') f=-1;ch=getchar();}
while (ch>='0'&&ch<='9'){x=x*10+ch-48;ch=getchar();}
return x*f;
}
函数返回值为读入的第一个整数。
快速读入作用仅为加快读入,并非强制使用。
给定一个长度为 N N N 的数列,和 M M M 次询问,求出每一次询问的区间内数字的最大值。
第一行包含两个整数 N , M N,M N,M,分别表示数列的长度和询问的个数。
第二行包含 N N N 个整数(记为 a i a_i ai?),依次表示数列的第 i i i 项。
接下来 M M M 行,每行包含两个整数 l i , r i l_i,r_i li?,ri?,表示查询的区间为 [ l i , r i ] [l_i,r_i] [li?,ri?]。
输出包含 M M M 行,每行一个整数,依次表示每一次询问的结果。
8 8
9 3 1 7 5 6 0 8
1 6
1 5
2 7
2 6
1 8
4 8
3 7
1 8
9
9
7
7
9
8
7
9
对于 30 % 30\% 30% 的数据,满足 1 ≤ N , M ≤ 10 1\le N,M\le 10 1≤N,M≤10。
对于 70 % 70\% 70% 的数据,满足 1 ≤ N , M ≤ 10 5 1\le N,M\le {10}^5 1≤N,M≤105。
对于 100 % 100\% 100% 的数据,满足 1 ≤ N ≤ 10 5 1\le N\le {10}^5 1≤N≤105, 1 ≤ M ≤ 2 × 10 6 1\le M\le 2\times{10}^6 1≤M≤2×106, a i ∈ [ 0 , 10 9 ] a_i\in[0,{10}^9] ai?∈[0,109], 1 ≤ l i ≤ r i ≤ N 1\le l_i\le r_i\le N 1≤li?≤ri?≤N。
ST 表基于倍增思想,可以做到 O ( n log ? n ) O(n\log n) O(nlogn) 预处理, O ( 1 ) O(1) O(1) 回答每个询问。但是不支持修改操作。
基于倍增思想,考虑如何求出区间最大值。可以发现,如果按照一般的倍增流程,每次跳 2 i 2^i 2i步的话,询问时的复杂度仍旧是 O ( log ? n ) O(\log n) O(logn),效率较低。
由于区间最大值是一个具有可重复贡献性质的问题。哪怕用来求解的预处理区间有重叠部分,只要这些区间合并是所求的区间,最终计算出的答案就是正确的。举个例子:
区间 [ 2 , 5 ] [2,5] [2,5]的最大值为 5 5 5,区间 [ 4 , 7 ] [4,7] [4,7]的最大值为 7 7 7,区间 [ 2 , 7 ] [2,7] [2,7]的最大值为 max ? { 5 , 7 } = 7 \max\{5,7\}=7 max{5,7}=7。
通过ST表,使用至多两个预处理过的区间就可以覆盖询问区间,也就是说询问时的时间复杂度可以被降至 O ( 1 ) O(1) O(1),在处理有大量询问的题目时十分有效。
要计算区间
[
i
,
i
+
2
j
?
1
]
[i,i+2^j-1]
[i,i+2j?1]的最大值,区间大小为
2
j
2^j
2j,相当于从位置
i
i
i跳了
2
j
?
1
2^j-1
2j?1 步,依据倍增的思想,可以将整个区间一分为二,左侧区间
[
i
,
i
+
2
j
?
1
?
1
]
[i,i+2^{j-1}-1]
[i,i+2j?1?1],右侧区间
[
i
+
2
j
?
1
,
i
+
2
j
?
1
]
[i+2^{j-1},i+2^j-1]
[i+2j?1,i+2j?1],大小均为
2
j
?
1
2^{j-1}
2j?1,如下图所示:
那么状态转移方程:
f [ i ] [ j ] = m a x { f [ i ] [ j ? 1 ] , f [ i + 2 j ? 1 ] [ j ? 1 ] } f[i][j]=max\{f[i][j-1],f[i+2^{j-1}][j-1]\} f[i][j]=max{f[i][j?1],f[i+2j?1][j?1]}
对于每个询问 [ L , R ] [L,R] [L,R],把它成两个部分 [ L , L + 2 k ? 1 ] [L,L+2^k-1] [L,L+2k?1]与 [ R ? 2 k + 1 , R ] [R-2^k+1,R] [R?2k+1,R],其中 k = ? l o g 2 ( R ? L + 1 ) ? k=\lfloor log_2(R-L+1)\rfloor k=?log2?(R?L+1)?,两部分的最值就是答案。
#include <iostream>
#include <cmath>
using namespace std;
const int N = 1e5 + 10, M = 20;
int n, a[N], f[N][M];
//创建ST表
void create() {
//初始状态
//f[i][0]表示从i开始长度为2^0的区间最值为a[i]本身
for(int i = 1; i <= n; i ++) f[i][0] = a[i];
int k = log2(n);
//枚举区间长度指数j
for(int j = 1; j <= k; j ++)
for(int i = 1; i + (1 << j) - 1 <= n; i ++)
f[i][j] = max(f[i][j - 1], f[i + (1 << j - 1)][j - 1]);
}
//利用ST表查询区间[L,R]的最大值
int query(int L, int R) {
int k = log2(R - L + 1);
return max(f[L][k], f[R - (1 << k) + 1][k]);
}
int main()
{
int m;
cin >> n >> m;
for(int i = 1; i <= n; i ++) scanf("%d", a + i);;
create();
while(m --) {
int L, R;
scanf("%d%d", &L, &R);
printf("%d\n", query(L, R));
}
}