基础算法---离散化

概念

离散化,把无限 空间中有限 的个体映射到有限的空间中去,以此提高算法的时空效率。

通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。

也就是说当数据空间跨越太大,但是数据的个数却不多,我们可以使用离散化将许多无意义的操作去掉

例如 数组的长度是10^9 但是只有100000个下标上的值不为0 ,当我们需要求某个区间l,r内的和 ,如果不离散化,就要从l开始遍历到r,才可以求出区间和,如果l和r相差很大,就会浪费很多时间,其中很多值为0,所以我们加了很多无意义的数

离散化

有一组数据 {1,5000,60,99999,88,88}存到一个数组里后 ,先排序 ---> {1,60,88,88,5000,99999} 去重 --->{1,60,88,5000,99999} ,二分查找得到下标 {1,2,3,4,5}

为什么要排序? 为了等下查找数据的时候可以使用二分查找,例如查找60这个数字

为什么要去重? 要确保相同元素离散化的结果相同

看个题目

假定有一个无限长的数轴,数轴上每个坐标上的数都是 0 。

现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c 。

接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 l,r 之间的所有数的和。

输入格式

第一行包含两个整数 n 和 m。

接下来 n 行,每行包含两个整数 x 和 c。

再接下来 m 行,每行包含两个整数 l 和 r 。

输出格式

共 m 行,每行输出一个询问中所求的区间内数字和。

数据范围

−10 ^9 ≤x≤ 10 ^9,

1≤n,m≤10^5,

−10^ 9 ≤l≤r≤ 10 ^9,

−10000≤c≤10000

输入样例:

复制代码
3 3
1 2
3 6
7 5
1 3
4 6
7 8

输出样例:

复制代码
8
0
5
复制代码
#include <iostream>
#include <vector>

#include <algorithm> //sort函数的头文件
using namespace std;

const int N = 300010;
int a[N], s[N];

typedef pair<int, int>  PII;

vector <int> alls; // 存储着 x l r
vector <PII> insert; // 存储操作坐标x和增量c
vector <PII> inquiry; // 存储着询问区间 l 和 r

int find(int x) //二分查找: 找x l r 离散后的坐标
{
	int l = 0, r = alls.size() - 1;
	while (l < r)
	{
		int mid = l + r >> 1;
		if (alls[mid] >= x)
		{
			r = mid;
		}
		else
		{
			l = mid + 1;
		}
	}
	return r + 1; // 坐标是从1开始的
}
int main(void)
{
	int n, m;
	cin >> n >> m;

	while (n--)
	{
		int x, c;
		cin >> x >> c;
		alls.push_back(x);
		insert.push_back({ x,c });
	}

	while (m--)
	{
		int l, r;
		cin >> l >> r;
		alls.push_back(l);
		alls.push_back(r);
		inquiry.push_back({ l,r });
	}

	//排序alls数组排的是l、r、x的顺序,再去重,去的也是l、r、x的重复数字
	sort(alls.begin(), alls.end()); 
	// unique函数是将重复的元素放到数组的后边(并未删去) 
	// 返回值是第一个重复元素的下标
	//erase函数删除区间的元素
	alls.erase(unique(alls.begin(), alls.end()), alls.end());

	/*for (auto item:vec)不改变迭代对象的值,效果是利用item遍历并获得vec容器中的每一个值*/
	for (auto item : insert)
	{
		int x = find(item.first);
		a[x] += item.second;
	}
	
	for (int i = 1; i <= alls.size(); i++)
	{
		s[i] = s[i - 1] + a[i]; //求a[i]前缀和
	}

	for (auto item : inquiry)
	{
		int l = find(item.first), r =find( item.second);
		printf("%d\n", s[r] - s[l - 1]);
	}

	return 0;
}

讲解

根据输入样例,原数据应该是这样的

将x l r 存入alls--->alls 1 3 7 1 3 4 6 7 8

排序去重 --> alls 1 3 4 6 7 8


然后intsert 数组存储着操作下标和加数 { 1 , 2 } { 3 , 6 } { 7, 5 }

inquiry数组存储着询问区间 { 1, 3 } { 4 , 6 } { 7 , 8 }


然后我们有一个a数组,我们利用二分查找找得 1 3 7 对应的下标为 1 2 5 ,在这些位置增加 2 6 5 ,那么就得到了a数组

再把 区间 1 3 4 6 7 8利用二分得到离散化的坐标为 1 2 3 4 5 6

也就是说求 1 , 3 区间的和 就是求a数组 1 , 2 区间的和 ... ...

到此得到答案

相关推荐
折哥的程序人生 · 物流技术专研13 小时前
Java面试85题图解版 · 特别篇:2026后端高频面试题复盘(算法底层逻辑+高并发架构设计全解析,附Java实战代码)
java·网络·数据库·算法·面试
想吃火锅100514 小时前
【leetcode】14.最长公共前缀js
算法·leetcode·职场和发展
云絮.15 小时前
数据库操作
数据库·mysql·算法·oracle
小林ixn16 小时前
LeetCode 206. 反转链表(迭代 + 递归详解)
算法·leetcode·链表
凡人叶枫16 小时前
Effective C++ 条款17:以独立语句将 newed 对象置入智能指针
java·linux·开发语言·c++·算法
菜鸟‍17 小时前
LeetCode 1 27 和 704 || 两数之和 移除元素 二分查找
算法·leetcode·职场和发展
退休倒计时18 小时前
【每日一题】LeetCode 142. 环形链表 II TypeScript
算法·leetcode·链表·typescript
popcorn_min19 小时前
Digits 手写数字识别:随机森林多分类 + 像素级特征热力图
算法·随机森林·分类
liulilittle19 小时前
拥塞控制:排水终止的两种决策:OR 与 AND
网络·tcp/ip·计算机网络·算法·信息与通信·tcp·通信
weixin_3077791320 小时前
从脚本执行到智能体协作:AI辅助测试能力的范式重构
运维·开发语言·人工智能·算法·测试用例