浅说倍增算法——线性倍增

倍增

易错提醒

首先强调一下,倍增不是一种算法,它是一种思想,而像什么 RMQ 问题啊,ST 表啊,都是由倍增思想演变出来的一种算法。接下来我们来正式的接入今天的话题

什么是倍增

倍增,倍增,顾名思义,就是以一个数成倍的增长,这个数通常是2。当然也会有在不同的时候会以其他的数进行翻倍,比如3,8,16等等,但是都不常见。我们现在就先来讲讲倍增中的线性倍增。

线性倍增

倍增一般情况下就是用来求解某一区间的极值,或一个成倍增长的数。

引入------快速幂与倍增的关联

快速幂和倍增也有一点点的关联,我们知道快速幂是通过二进制分解的形式来计算的,而倍增也是构成二进制位权的方法。

区间极值问题

给定一个长度为 n n n 的区间,给定 m m m 次询问,每次询问有两个值 l , r l,r l,r 代表一个区间的左右端点,请给出这个区间的最大值。

上述问题就是一个区间极值问题,而区间极值问题就是 RMQ 问题,我们这里不要抛开本质的倍增而只去关注算法。我们要把两者结合起来看。

首先,如果让你去求一个区间的极值,你会怎么求?是不是只能去枚举每一段,然后求一个最大值?这样的时间复杂度是 O ( n 2 ) O(n^2) O(n2) ,相比之下,有点高。那么我们可以怎么弄呢?

我们这里要先了解一个二进制数的特性:所有的实数都可以被写成若干个二进制相加 ,也就是说,我们可以采用二进制的方式去表达每个数。基于此,我们的每段区间都可以分成若干个,长度为 2 k 2^k 2k 的区间,那么我们只需要对在这些区间中找一个最大值不就完了?

那么我们现在的问题就转化到了如何求解每段长度为 2 k 2^k 2k 的区间的最大值呢?和如何利用这些区间去求得每个区间的极值?

问题1------如何预处理

问题描述:如何求解每段长度为 2 k 2^k 2k 的区间的最大值

子问题1

这里我们考虑使用动态规划

首先我们知道,动态规划一定是从最优解到最优解,所以我们这里要先知道当前是2的多少倍,所以我们应该先枚举指数 i i i ,其次,我们还需要知道每一段的起点和终点,所以我们还要去枚举起点 j j j (注意:这里 j j j 的范围应该是 1 ≤ j ≤ n + 1 − 2 i 1 \le j \le n+1-2^i 1≤j≤n+1−2i ,因为这是一个区间)

那么我们就可以得到以下代码

cpp 复制代码
for (int i=1;(1<<i)<=n;i++){
	for (int j=1;j+(1<<i)-1<=n;j++){
		//状态转移
	}
}

我们现在知道了如何枚举,接下来就是如何进行转移了。

子问题2

上面我们讲了,动态规划是从最优解到最优解,再加上我们是以2的倍数进行分段的,所以我们其实可以把当前的区间分成两个小的区间,也就是分成两个长度为 2 k − 1 2^{k-1} 2k−1 的区间,又因为我们是先枚举的指数,所以 2 k − 1 2^{k-1} 2k−1 的两个答案我们是知道的,所以我们只需要在两个答案中选一个最大的(或最小的)就行了。

只不过我们还需要知道这两段分别的起点。

这里我们可以画一个图来了解一下

由图可见,第一段是 j → j + 2 k − 1 − 1 j \to j+2^{k-1}-1 j→j+2k−1−1 ,第二段是 j + 2 k − 1 → j + 2 k − 1 j+2^{k-1} \to j+2^k-1 j+2k−1→j+2k−1 ,所以,两端的起点分别是 j j j 和 j + 2 k − 1 j+2^{k-1} j+2k−1 。基于此,我们就可以写出以下状态转移方程
d p [ i ] [ k ] = m a x ( d p [ i ] [ k − 1 ] , d p [ i + 2 k − 1 ] [ k − 1 ] ) dp[i][k]=max(dp[i][k-1],dp[i+2^{k-1}][k-1]) dp[i][k]=max(dp[i][k−1],dp[i+2k−1][k−1])

现在我们也是成功的预处理出来了每一段长为 2 k 2^k 2k 的区间的最大值,样例代码如下:

cpp 复制代码
for (int i=1;i<=n;i++){
	cin>>a[i];
	dp1[i][0]=a[i];//注意要提前预处理
}
for (int i=1;(1<<i)<=n;i++){
	for (int j=1;j+(1<<i)-1<=n;j++){
		dp1[j][i]=max(dp1[j][i-1],dp1[j+(1<<(i-1))][i-1]);
	}	
}

这样的时间复杂度为 O ( n l o g n ) O(nlogn) O(nlogn)

问题2------如何求解每个区间的极值

我们已经解决了预处理的问题了,现在我们就要去处理每个区间的问题了。这里我们就要用到前面所提到的一个定理,所有的实数都可以被写成若干个二进制相加。我们可以基于这个定理去求解每个区间的极值。

我们可以采取函数 l o g 2 log2 log2 来求解当前这段所包含的最大的长度为 2 k 2^k 2k 的 k k k ,然后从大到小依次枚举可行的指数 j ( 1 ≤ j ≤ k ) j(1\le j \le k) j(1≤j≤k) ,然后不断更新起点 x x x ,并且通过这个起点 x x x ,来确定当前是哪一段的答案,在根据可选的答案中选一个最大值。

样例代码如下:

cpp 复制代码
cin>>x>>y;
int num=log2(y-x+1)+1;//多加一个,保险
for (int j=num;j>=0;j--){
	if (x+(1<<j)-1<=y){
		maxn=max(dp[x][j],maxn);
		x+=(1<<j);//更新起点
	}
}
cout<<maxn;

这样的时间复杂度是 O ( l o g n ) O(logn) O(logn)

除此之外,还有一个时间复杂度是 O ( 1 ) O(1) O(1) 的方法,但是在有些时候不能用,要小心加谨慎,高危 。

因为我们知道,我们求得是最大值,所以有重复也没有关系,那么一旦我们知道了当前区间的最大的 k k k ,那么我们是否也可以直接在前面找一个长度为 2 k 2^k 2k 的区间,后面也找一个长度为 2 k 2^k 2k 的区间就行了?只不过后面的区间的起点我们还要算一下罢了,这里就不算了,直接给出答案。

cpp 复制代码
cin>>x>>y;
int num=log2(y-x+1);
maxn=max(dp[x][num],dp[y-(1<<num)+1][num]);
cout<<maxn;

但是这种方法只适用于求解可以重复的题目,如果当前题目要求的是传递到第几个人这种就不可以了。

例题

[USACO07JAN] Balanced Lineup G

题目描述

每天,农夫 John 的 n ( 1 ≤ n ≤ 5 × 1 0 4 ) n(1\le n\le 5\times 10^4) n(1≤n≤5×104) 头牛总是按同一序列排队。

有一天, John 决定让一些牛们玩一场飞盘比赛。他准备找一群在队列中位置连续的牛来进行比赛。但是为了避免水平悬殊,牛的身高不应该相差太大。John 准备了 q ( 1 ≤ q ≤ 1.8 × 1 0 5 ) q(1\le q\le 1.8\times10^5) q(1≤q≤1.8×105) 个可能的牛的选择和所有牛的身高 h i ( 1 ≤ h i ≤ 1 0 6 , 1 ≤ i ≤ n ) h_i(1\le h_i\le 10^6,1\le i\le n) hi(1≤hi≤106,1≤i≤n)。他想知道每一组里面最高和最低的牛的身高差。

输入格式

第一行两个数 n , q n,q n,q。

接下来 n n n 行,每行一个数 h i h_i hi。

再接下来 q q q 行,每行两个整数 a a a 和 b b b,表示询问第 a a a 头牛到第 b b b 头牛里的最高和最低的牛的身高差。

输出格式

输出共 q q q 行,对于每一组询问,输出每一组中最高和最低的牛的身高差。

样例 #1

样例输入 #1

6 3
1
7
3
4
2
5
1 5
4 6
2 2

样例输出 #1

6
3
0

这道题就是典型的倍增的题目,只不过是要求一个最大值和一个最小值,可以用来练手。

cpp 复制代码
#include<bits/stdc++.h>
using namespace std;
const int INF=5*1e5+10;
long long a[INF],dp1[INF][40],dp2[INF][40];
int main(){
	int n,q;
	cin>>n>>q;
	for (int i=1;i<=n;i++){
		cin>>a[i];
		dp1[i][0]=a[i];
		dp2[i][0]=a[i];
	}
	for (int i=1;(1<<i)<=n;i++){
		for (int j=1;j+(1<<i)-1<=n;j++){
			dp1[j][i]=max(dp1[j][i-1],dp1[j+(1<<(i-1))][i-1]);
			dp2[j][i]=min(dp2[j][i-1],dp2[j+(1<<(i-1))][i-1]);
		}
	}
	for (int i=1;i<=q;i++){
		long long maxn=INT_MIN,minn=INT_MAX;
		int x,y;
		cin>>x>>y;
		int num=log2(y-x+1);
		maxn=max(dp1[x][num],dp1[y-(1<<num)+1][num]);
		minn=min(dp2[x][num],dp2[y-(1<<num)+1][num]);
		cout<<maxn-minn<<endl;
	}
	return 0;
}

Pass An Note

题目描述

有 n n n 个小朋友在传纸条,编号 1 1 1 至 n n n。编号为 i i i 的小朋友如果收到了纸条,会传给编号为 a i a_i ai 的小朋友。

现在有 m m m 组询问,每组询问会给出参数 p p p 和 q q q,问从小朋友 p p p 开始,传 q q q 次纸条会传到哪个小朋友手里。请求出每组询问的答案。
输入格式

第一行输入两个正整数 n n n 和 m m m,保证 n ≤ 3 × 1 0 5 n≤3×10^5 n≤3×105 , m ≤ 3 × 1 0 5 m≤3×10^5 m≤3×105。

第二行输入 n n n 个正整数 a i a_i ai ,保证 1 ≤ a i ≤ n 1≤ai≤n 1≤ai≤n 接下来 m m m 行,每行两个正整数 p p p 和 q q q,保证 1 ≤ p , q ≤ n 1≤p,q≤n 1≤p,q≤n 。

输出格式

输出 m m m 行,每行一个正整数,表示从 p p p传递 q q q 次纸条会到达的人。

样例输入

10 10
5 2 10 4 9 4 8 10 6 2
5 3
5 7
7 10
8 2
8 1
7 7
8 1
5 4
3 5
9 4

样例输出

4
4
2
2
10
2
10
4
2
4

这道题就不能使用上述的 O ( 1 ) O(1) O(1) 的方法了,所以我们还是老老实实的敲 O ( l o g n ) O(logn) O(logn) 的方法吧。

cpp 复制代码
#include<bits/stdc++.h>
using namespace std;
const int INF=5*10e5;
int a[INF],dp[INF][20];//dp表示从x开始传,传2^i次 
int main(){
	int n,m;
	cin>>n>>m;
	for (int i=1;i<=n;i++){
		scanf("%d",&a[i]);
		dp[i][0]=a[i];
	}
	for (int i=1;(1<<i)<=n;i++){
		for (int j=1;j<=n;j++){
			dp[j][i]=dp[dp[j][i-1]][i-1];
		}
	} 
	while (m--){
		int x,y,ans;
		scanf("%d %d",&x,&y);
		int num=log2(y)+1;
		for (int i=num;i>=0;i--){
			if ((1<<i)<=y){
				ans=dp[x][i];
				x=ans;
				y-=(1<<i);
			}
		}
		printf("%d\n",ans);
	}
	return 0;
}
相关推荐
刚学HTML5 分钟前
leetcode 05 回文字符串
算法·leetcode
AC使者24 分钟前
#B1630. 数字走向4
算法
冠位观测者28 分钟前
【Leetcode 每日一题】2545. 根据第 K 场考试的分数排序
数据结构·算法·leetcode
古希腊掌管学习的神1 小时前
[搜广推]王树森推荐系统笔记——曝光过滤 & Bloom Filter
算法·推荐算法
qystca1 小时前
洛谷 P1706 全排列问题 C语言
算法
浊酒南街1 小时前
决策树(理论知识1)
算法·决策树·机器学习
就爱学编程1 小时前
重生之我在异世界学编程之C语言小项目:通讯录
c语言·开发语言·数据结构·算法
学术头条2 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
Schwertlilien2 小时前
图像处理-Ch4-频率域处理
算法
IT猿手2 小时前
最新高性能多目标优化算法:多目标麋鹿优化算法(MOEHO)求解TP1-TP10及工程应用---盘式制动器设计,提供完整MATLAB代码
开发语言·深度学习·算法·机器学习·matlab·多目标算法