【算法竞赛】尺取法

尺取法(又称为双指针、Two Pointers)是算法竞赛中一个常)用的优化技巧,用来解决序列的区间问题,操作简单,容易编程。如果区间是单调的,也常常用二分法求解,所以很多问题用尺取法和二分法都行。另外,尺取法的操作过程和分治算法的步骤很相似,有时也用在分治中。

概念

什么是尺取法?为什么尺取法能用来优化?考虑下面的应用背景:

(1)给定一个序列,有时需要它是有序的,先排序;

(2)问题和序列的区间有关,且需要操作两个变量,可以用两个下标(指针)i和j扫描区间。

对于上面的应用,一般的做法是用i和j分别扫描区间,有二重循环,复杂度为O(n^2^)。

以反向扫描(即i与j的方向相反,后文有解释)为例,代码如下:

cpp 复制代码
for(int i = 0; i<n; i++)                      //i从头扫到尾
	for(intj=n-1; n-1; j>= 0; j-- ){          //j从尾扫到头
			...
		}
	

下面用尺取法优化上述算法。

实际上,尺取法就是把二重循环变为一个循环,在这个循环不中同时处理i和j。复杂度也就从O(n^2^)变为O(n)。仍以上面的反向扫描为例,代码如下:

cpp 复制代码
//用while实现
int i = 0, j = n - 1;
while (i<j){
	//i和j在中间相遇,这样做还能防止i和j越界
	i++;//i从头扫到尾
	j--;//j从尾扫到头
}
//用for实现
for(inti= 0, j=n-1;i<j;i++,j--){
		//满足题意的操作
	}

在尺取法中,i和j有以下两种扫描方向:

(1)反向扫描。i和j方向相反,让i从头到尾,j从尾到头,在中间相会。

(2)同向扫描。i和j方向相同,都从头到尾,速度不同,如让j跑在i前面。

把同向扫描的i、j指针称为"快慢指针",把反向扫描的i、j指针称为"左右指针",更加形象。其中,"快慢指针"在序列上产生了一个大小可变的"滑动窗口",有灵活的应用,如寻找区间、数组去重、多指针问题。

反向扫描

用下面的几个应用说明反向扫描的编码方法。

一、找指定和的整数对

这个问题是尺取法中最经典,也最简单直接的应用。

为了说明尺取法的优势,下面给出4种解题方法。

(1)用二重循环暴力搜索,枚举所有的取数方法,复杂度为0(n^2^),超时。暴力法不需要排序。

(2)二分法。首先对数组从小到大排序,复杂度为O(nlog~2~n);然后从头到尾处理数组中的每个元素a[i],在大于a[i]的数中二分查找是否存在一个等于m-a[i]的数,复杂度也为O(nlog~2~n)。两部分相加,总复杂度仍然为O(nlog~2~n)。

(3)哈希。分配一个哈希空间s,把n个数放进去。逐个检查a[]中的几个数,如a[i],检查m-a[i]在s中是否有值,如果有,那么存在一个答案。复杂度为O(n)。哈希方法很快,但是需要一个额外的很大的哈希空间。

(4)尺取法。这是标准解法。首先对数组从小到大排序;然后设置两个变量i和j,分别指向头和尾,i初值为0,j初值为n-1,然后让i和j逐渐向中间]移动,检查a[i]+a[j],如果大于m,就让j减1;如果小于m,就让i加1,直至a[i]+a[j]=m。排序复杂度为O(nlog~2~n),检查的复杂度为O(n),总复杂度为O(nlog~2~n)。

尺取法代码如下,注意可能有多个答案。

cpp 复制代码
// 函数用于找到数组中两数之和等于给定值 m 的两个数
void find_sum(int a[], int n, int m) {
    // 先对数组进行排序,时间复杂度为 O(n log₂ n)
    sort(a, a + n); 
    // i 指向数组头部,j 指向数组尾部
    int i = 0, j = n - 1;
    while (i < j) {
        int sum = a[i] + a[j];
        // 如果两数之和大于 m,j 指针向前移动
        if (sum > m) j--;
        // 如果两数之和小于 m,i 指针向后移动
        else if (sum < m) i++;
        // 如果两数之和等于 m,输出这两个数,然后 i 指针向后移动继续寻找可能的其他答案
        else {
            cout << a[i] << " " << a[j] << endl;
            i++;
        }
    }
}

在本题中,尺取法不仅效率高,而且不需要额外的空间。

把题目的条件改变一下,可以变化为类似的问题,如判断一个数是否为两个数的平方和。

二、判断回文串

给一个字符串,判断它是否为回文串。

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;

// 主函数
int main() {
    int n;
    cin >> n; // n 为测试用例个数
    while (n--) {
        string s;
        cin >> s; // 读一个字符串
        bool ans = true;
        int i = 0, j = s.size() - 1; // 双指针,i 指向字符串头部,j 指向字符串尾部
        while (i < j) {
            if (s[i]!= s[j]) { // 如果对应位置字符不相等
                ans = false;
                break;
            }
            i++;
            j--; // 移动双指针
        }
        if (ans)
            cout << "yes" << endl;
        else
            cout << "no" << endl;
    }
    return 0;
}

稍微改变条件,类似的题目如下。

(1)不区分大小写,忽略非英文字母,判断是否为回文串1。

(2)允许删除(或插入,本题只考虑删除)最多一个字符,判断是否能构成回文字符串

解题思路:设反向扫描双指针为i和j,如果s[i]和s[j]相同,则执行i++和j--;如果s[i]和s[j]不同,那么或者删除s[i],或者删除s[j],看剩下的字符串是否是回文串。

同向扫描

下面给出同向扫描的几个经典应用。

一、寻找区间和

这是用尺取法产生滑动窗口的典型例子。

指针i和j(i<j)都从头向尾扫描,判断区间[i,j]数组元素的利1是否等于s

如何寻找区间和等于5的区间?如果简单地对i和j做二重循环,复杂度为O(n^2^)

用尺取法,复杂度为O(n),操作步骤如下:

(1)初始值i=0,j=0,即开始都指向第1个元素a[0]。定义sum是区间[i,j]数组元素的和,初始值sum=a[0]。

(2)如果sum=s,输出一个解。继续,把sum减掉元素a[i],并把i向后移动一位。

(3)如果sum>s,让sum减掉元素a[i],并把i向后移动一位。

(4)如果sum<s,把j向后移动一位,并把sum的值加上这个新元素。

在上面的步骤中,有两个关键技巧:

(1)滑动窗口的实现。

窗口就是区间[i,j],随着i和j从头到尾移动,窗口就"滑动"扫描了整个序列,检索了所有数据。i和j并不是同步增加的,窗口像一只蚯蚓伸缩前进,它的长度是变化的,这个变化正对应了对区间和的计算。

(2)sum的使用。

如何计算区间和?暴力的方法是从a[i]到a[j]累加,但是这个累加的复杂度为O(n),超时。如果利用sum,每次移动i或j时,只需要把sum加或减一次,就得到了区间和,复杂度为O(1)。这是"前缀和"递推思想的应用。

cpp 复制代码
// 函数用于在给定整数数组中找到连续子数组使得其和等于给定值 s
void findsum(int *a, int n, int s) {
    int i = 0, j = 0;
    int sum = a[0];
    while (j < n) { // 下面代码中保证 i <= j
        // 如果当前和大于等于给定值 s
        if (sum >= s) {
            // 如果当前和等于给定值 s,输出子数组的起始和结束位置
            if (sum == s)
                printf("%d %d\n", i, j);
            sum -= a[i];
            i++;
            // 防止 i 超过 j
            if (i > j) {
                sum = a[i];
                j++;
            }
        }
        // 如果当前和小于给定值 s
        if (sum < s) {
            j++;
            // 更新 sum
            sum += a[j];
        }
    }
}

"滑动窗口"的例子还有:

(1)给定一个序列以及一个整数M,在序列中找M个连续读递增的元素,使它们的区间和最大;

(2)给定一个序列以及一个整数K,求一个最短的连续子序列,其中包含至少K个不同的元素。

二、数组去重

数组去重是很常见的操作,方法也很多,尺取法是其中优秀的算法。

问题描述:给定数组a ,长度为n,把数组中重复的数去掉。

下面给出两种解法:哈希和尺取法。

(1)哈希

哈希函数的特点是有冲突,利用这个特点去重。把所有数插入哈希表,用冲突过滤重复

的数,就能得到不同的数。缺点是哈希把数据的值本身看作地址,如果数据值过大,需要的

空间也非常大。

(2)尺取法

(1)将数组排序,排序后重复的整数就会挤在一起。

(2)定义双指针i和j,初始值都指向a[0]。i和j都从头到尾扫描数组a[]。i指针走得快,逐个遍历整个数组;j指针走得慢,它始终指向当前不重复部分的最后一个数。也就是说,j用于获得不重复的数。

(3)扫描数组。快指针执行i++,如果此时a[i]不等于慢指针j指向的a[j],就执行j++,并且把a[i]复制到慢指针j的当前位置a[j]。

(4)i扫描结束后,a[0]~a[j]就是不重复数组。

三、多指针

有时两个窗口指针不够用,需要更多的指针。例2.4是三指针的例子。

如果用暴力法统计数对,复杂度为O(n^2^),超时。下面试试尺取法。

对输入样例排序后得{445778),其中第1个4和后面两个7是两对,第2个4和后面两个7也是两对,共4对。如果仅使用i和j两个指针,无法实现.

如何解决?可以把后面两个7看作一个整体,一起统计数对。用两个指针j和k指示这种区间,[j,k]区间内每个数都相同,这个区间可以产生,一j个数对。细节见下面的代码。使用3个指针:i是主指针,从头到尾遍历几个数;j和k是辅助指针,用于查找数字相同的区间[j,k]。

第10行的尺取法代码只有一个for循环,且j和k随着i递增,所以复杂度为O(n)。

另外,第8行的排序复杂度为O(nlog~2~n)。

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;

const int N = 2e5 + 5;
int a[N];

// 主函数
int main() {
    int n, c;
    cin >> n >> c;
    for (int i = 1; i <= n; i++)
        cin >> a[i];
    sort(a + 1, a + 1 + n);
    long long ans = 0;
    // 使用三个指针 i、j、k 进行遍历和查找
    for (int i = 1, j = 1, k = 1; i <= n; i++) {
        // 用 j 指针查找第一个与 a[i]之差大于等于 c 的位置
        while (j <= n && a[j] - a[i] < c)
            j++;
        // 用 k 指针查找第一个与 a[i]之差大于 c 的位置
        while (k <= n && a[k] - a[i] <= c)
            k++;
        // 如果 a[j]-a[i]==c 且 a[k - 1]-a[i]==c 且 k - 1 >= 1,则更新答案
        if (a[j] - a[i] == c && a[k - 1] - a[i] == c && k - 1 >= 1)
            ans += k - j;
    }
    cout << ans;
    return 0;
}
相关推荐
Microsoft Word13 分钟前
c++基础语法
开发语言·c++·算法
天才在此26 分钟前
汽车加油行驶问题-动态规划算法(已在洛谷AC)
算法·动态规划
一只小小汤圆38 分钟前
opencascade源码学习之BRepOffsetAPI包 -BRepOffsetAPI_DraftAngle
c++·学习·opencascade
legend_jz1 小时前
【Linux】线程控制
linux·服务器·开发语言·c++·笔记·学习·学习方法
嘿BRE1 小时前
【C++】几个基本容器的模拟实现(string,vector,list,stack,queue,priority_queue)
c++
莫叫石榴姐1 小时前
数据科学与SQL:组距分组分析 | 区间分布问题
大数据·人工智能·sql·深度学习·算法·机器学习·数据挖掘
ö Constancy2 小时前
c++ 笔记
开发语言·c++
fengbizhe2 小时前
笔试-笔记2
c++·笔记
徐霞客3202 小时前
Qt入门1——认识Qt的几个常用头文件和常用函数
开发语言·c++·笔记·qt
fpcc2 小时前
redis6.0之后的多线程版本的问题
c++·redis