基础算法---离散化

概念

离散化,把无限 空间中有限 的个体映射到有限的空间中去,以此提高算法的时空效率。

通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。

也就是说当数据空间跨越太大,但是数据的个数却不多,我们可以使用离散化将许多无意义的操作去掉

例如 数组的长度是10^9 但是只有100000个下标上的值不为0 ,当我们需要求某个区间[l,r]内的和 ,如果不离散化,就要从l开始遍历到r,才可以求出区间和,如果l和r相差很大,就会浪费很多时间,其中很多值为0,所以我们加了很多无意义的数

离散化

有一组数据 {1,5000,60,99999,88,88}存到一个数组里后 ,先排序 ---> {1,60,88,88,5000,99999} 去重 --->{1,60,88,5000,99999} ,二分查找得到下标 {1,2,3,4,5}

为什么要排序? 为了等下查找数据的时候可以使用二分查找,例如查找60这个数字

为什么要去重? 要确保相同元素离散化的结果相同

看个题目

假定有一个无限长的数轴,数轴上每个坐标上的数都是 0 。

现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c 。

接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l,r] 之间的所有数的和。

输入格式

第一行包含两个整数 n 和 m。

接下来 n 行,每行包含两个整数 x 和 c。

再接下来 m 行,每行包含两个整数 l 和 r 。

输出格式

共 m 行,每行输出一个询问中所求的区间内数字和。

数据范围

−10 ^9 ≤x≤ 10 ^9,

1≤n,m≤10^5,

−10^ 9 ≤l≤r≤ 10 ^9,

−10000≤c≤10000

输入样例:

3 3
1 2
3 6
7 5
1 3
4 6
7 8

输出样例:

8
0
5
#include <iostream>
#include <vector>

#include <algorithm> //sort函数的头文件
using namespace std;

const int N = 300010;
int a[N], s[N];

typedef pair<int, int>  PII;

vector <int> alls; // 存储着 x l r
vector <PII> insert; // 存储操作坐标x和增量c
vector <PII> inquiry; // 存储着询问区间 l 和 r

int find(int x) //二分查找: 找x l r 离散后的坐标
{
	int l = 0, r = alls.size() - 1;
	while (l < r)
	{
		int mid = l + r >> 1;
		if (alls[mid] >= x)
		{
			r = mid;
		}
		else
		{
			l = mid + 1;
		}
	}
	return r + 1; // 坐标是从1开始的
}
int main(void)
{
	int n, m;
	cin >> n >> m;

	while (n--)
	{
		int x, c;
		cin >> x >> c;
		alls.push_back(x);
		insert.push_back({ x,c });
	}

	while (m--)
	{
		int l, r;
		cin >> l >> r;
		alls.push_back(l);
		alls.push_back(r);
		inquiry.push_back({ l,r });
	}

	//排序alls数组排的是l、r、x的顺序,再去重,去的也是l、r、x的重复数字
	sort(alls.begin(), alls.end()); 
	// unique函数是将重复的元素放到数组的后边(并未删去) 
	// 返回值是第一个重复元素的下标
	//erase函数删除区间的元素
	alls.erase(unique(alls.begin(), alls.end()), alls.end());

	/*for (auto item:vec)不改变迭代对象的值,效果是利用item遍历并获得vec容器中的每一个值*/
	for (auto item : insert)
	{
		int x = find(item.first);
		a[x] += item.second;
	}
	
	for (int i = 1; i <= alls.size(); i++)
	{
		s[i] = s[i - 1] + a[i]; //求a[i]前缀和
	}

	for (auto item : inquiry)
	{
		int l = find(item.first), r =find( item.second);
		printf("%d\n", s[r] - s[l - 1]);
	}

	return 0;
}

讲解

根据输入样例,原数据应该是这样的

将x l r 存入alls--->alls 1 3 7 1 3 4 6 7 8

排序去重 --> alls 1 3 4 6 7 8


然后intsert 数组存储着操作下标和加数 { 1 , 2 } { 3 , 6 } { 7, 5 }

inquiry数组存储着询问区间 { 1, 3 } { 4 , 6 } { 7 , 8 }


然后我们有一个a数组,我们利用二分查找找得 1 3 7 对应的下标为 1 2 5 ,在这些位置增加 2 6 5 ,那么就得到了a数组

再把 区间 1 3 4 6 7 8利用二分得到离散化的坐标为 1 2 3 4 5 6

也就是说求[ 1 , 3 ]区间的和 就是求a数组 [ 1 , 2 ] 区间的和 ... ...

到此得到答案

相关推荐
XH华2 小时前
初识C语言之二维数组(下)
c语言·算法
南宫生2 小时前
力扣-图论-17【算法学习day.67】
java·学习·算法·leetcode·图论
不想当程序猿_2 小时前
【蓝桥杯每日一题】求和——前缀和
算法·前缀和·蓝桥杯
落魄君子3 小时前
GA-BP分类-遗传算法(Genetic Algorithm)和反向传播算法(Backpropagation)
算法·分类·数据挖掘
菜鸡中的奋斗鸡→挣扎鸡3 小时前
滑动窗口 + 算法复习
数据结构·算法
Lenyiin3 小时前
第146场双周赛:统计符合条件长度为3的子数组数目、统计异或值为给定值的路径数目、判断网格图能否被切割成块、唯一中间众数子序列 Ⅰ
c++·算法·leetcode·周赛·lenyiin
郭wes代码3 小时前
Cmd命令大全(万字详细版)
python·算法·小程序
scan7243 小时前
LILAC采样算法
人工智能·算法·机器学习
菌菌的快乐生活4 小时前
理解支持向量机
算法·机器学习·支持向量机
大山同学4 小时前
第三章线性判别函数(二)
线性代数·算法·机器学习