【堆的应用--C语言版】

前面一节我们都已将堆的结构(顺序存储)已经实现,对树的相关概念以及知识做了一定的了解。其中我们在实现删除操作和插入操作的时候,我们还同时实现了建大堆(小堆)的向上(下)调整算法

在这里我们需要补充:

我们上一节实现的算法中的向上调整算法的时间复杂度为O(n*log n),而向下调整算的时间复杂度为O(n)。所以我们就可以知道,在建堆的时候尽量选择时间复杂度较小的向下调整算法

一.堆排序

小Tip:排升序,建大堆;排升序,建小堆。

1.版本一:

基于已有数组进行建堆,取堆顶元素完成排序。

**注:**该版本有一个前提,必须提供现有的数据结构堆。

cpp 复制代码
//1.需要堆的数据结构
//2.空间复杂度 O(N)
void HeapSort(int* a, int n)
{
	HP hp;  //创建一个堆
	for (int i = 0; i < n; i++)
	{
		HPPush(&hp, a[i]);  //将数组中每一个元素逐个插入堆中
	}
	//逐个取堆顶的元素
	int i = 0;
	while (!HPEmpty(&hp))
	{
		a[i++] = HPTop(&hp);//取堆顶的元素
		HPPop(&hp);//出堆
	}
	//销毁堆
	HPDestroy(&hp);
}

基于前面我们已经实现过堆的顺序存储结构,在这里我们就只实现局部代码。实现思路我在代码的旁边已经进行了标注。

2.版本二:

数组进行建堆,首尾交换,交换之后的堆尾从堆中删除掉,将堆顶数据向下调整选出次大的数据。

cpp 复制代码
void HeapSort(int* a, i int n)
{
	//先进行向下调整算法建堆
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(arr, i, n);
	}
	//循环 将堆顶数据进行交换,交换完将调整堆(堆中的要访问的底层数组的下标减1,在进行堆的调整的时候end还是 要调整的 堆中的元素个数)
	int end = end - 1;
	while (end)
	{
		Swap(&a[0], &a[end]);
		AdustDwon(a, 0, end);
		end--;
	}
}

实现思路已经在上面的代码中已经标注了。

二 .top-k问题

如果我们要在10个数据中,找前面3个最大的数据是多少,咋找? 如果我们要在100个数据中,找前面3个最大的数据是多少,咋找? 如果我们要在1000个数据中,找前面3个最大的数据是多少咋找? ......如果我们要在100000000000000000个数据中,找前面3个最大的数据是多少,咋找呢?

对于数据量少的,我们可以用前面所学的打擂台,冒泡排序,选择法排序,快速排序以及上面所讲的堆排序 。但是对于数据量特别大的呢,我们如果还用上面所说的方法,那就太慢太麻烦了。现在我们所玩的游戏(有很多玩家)中找积分最多的前几个玩家?世界人口中找年龄最大的人?......用上面的方法是不是就很繁琐了

所以对于这种类似的问题结合堆的性质我们就Top-k来进行排序。Top-k问题:即就是求数据集合中前k个最大或者最小的元素,一般情况下数据量都比较大。

cpp 复制代码
#include <stdio.h>
#include <stdlib.h>
void Swap(int* x, int * y)
{
	int temp = *x;
	*x = *y;
	*y = temp;
}//可不用,见后面
void AdjustDown(int* arr, int parent, int size)
{
	int child = parent * 2 + 1;//左孩子
	while (child < size)   //注意这里的条件
	{
		//找左右孩子中值最小的  小堆用>  大堆用<
		if (child + 1 < size && arr[child] > arr[child + 1])
		{
			child++;
		}
		//小堆用<  大堆用>
		if (arr[child] < arr[parent])
		{
			Swap(&arr[child], &arr[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}

}

//top-K 问题   求最大
void topk()
{
	int k = 0;
	printf("请你输入K>:");
	scanf("%d", &k);

	//以只读的方式打开文件
	const char *file = "data.txt";
	FILE* fout = fopen(file, "r");
	if (fout == NULL)
	{
		perror("fopen fail!");
		exit(1);
	}

	
	//用动态内存内存的知识,申请k个整形单位的数组
	int* minHeap = (int*)malloc(sizeof(int) * k);
	if (minHeap == NULL)
	{
		perror("malloc fail!");
		exit(2);
	}
	//从文件中读取数据
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}


	//取随机生成前k个数字进行建堆  利用向下调整算法进行建堆
	for (int  i = (k-1-1)/2; i >= 0; i--)
	{
		AdjustDown(minHeap, i, k);   //建小堆
	}

	//将文件中剩余的数字和堆中的k个数据进行逐个比较,大的数字王进走,小的数字往出走
	int x = 0;
	while (fscanf(fout, "%d", &x)!=EOF)
	{
		//如果此时读取到的数据大于堆顶数据,就将
		if (x > minHeap[0])
		{
			minHeap[0] = x;   //此处也可以用Swap函数进行数据的交换
			AdjustDown(minHeap, 0, k);
		}
	}
	for (int i = 0; i < k; i++)
	{
		printf("%d ", minHeap[i]);
	}
	fclose(fout);
}

//先生成随机数字放在文件中
void CreatData()
{
	int n = 100000;
	srand((unsigned int)time(NULL));//利用时间戳进行堆随机数种子进行改变

	//以写的形式创建文件
	const char *file = "data.txt";
	FILE* fin = fopen(file, "w");
	if (fin == NULL)
	{
		perror("fin fail!");
		return;
	}

	//向文件中写入用fprintf,向文件中写入数字
	for (int i = 0; i < n; i++)
	{
		int x = (rand() + i) % 1000000;
		fprintf(fin, "%d\n", x);
	}
	fclose(fin);
}
int main()
{
	CreatData();
	topk();
	return 0;
}

实现的思路:

先实现自定义数据交换函数,向下调整算法(时间复杂度低,所以选择它),生成随机数的函数。

其次就是实现Top-K问题的核心了,先定义可以自定可在所有数字要找最大的k个数字的变量k,然后再以读的形式打开所生成随机数的那个文件,再就是开辟k个数据大小的数组空间。

然后先将文件中前k个数据存储在该数组中,再进行将数组中的k个元素进行建堆处理(此处建的是小堆)。随后循环读取文件中剩余的数据(直到遇到文件结束的标志),每一次将从文件中读取中的数据和小堆的堆顶进行比较大小,如果比堆顶数据大就将该值堆顶位置**(或者交换)** 。于此同时之后每次还得数据调整(一直保持小堆)。读取完比较调整完之后,将最终数组中的数据打印在终端上。最终需要关闭文件哦!!!

注:

对于Top-k 问题如果求前K个最大的数据,就建小堆,反之就建小堆。

》》 》》》》》》》》》 今天分享的内容就结束了,下篇见》》》》》》》》》》》》》》》

关注博主,优质内容不断更新!!!

如有错误,还望指出!

相关推荐
m0_6312704036 分钟前
标准C++(二)
开发语言·c++·算法
banjin36 分钟前
AI驱动TDSQL-C Serverless 数据库技术实战营-ai学生选课系统数据分析
c语言·人工智能·serverless
Zhen (Evan) Wang36 分钟前
What is the new in C#11?
开发语言·c#
沫刃起39 分钟前
Codeforces Round 972 (Div. 2) C. Lazy Narek
数据结构·c++·算法
DdddJMs__13540 分钟前
C语言 | Leetcode C语言题解之第413题等差数列划分
c语言·leetcode·题解
轩轶子41 分钟前
【C-项目】网盘(一期,无限进程版)
服务器·c语言·网络
0224号比邻星42 分钟前
[C语言]第十节 函数栈帧的创建和销毁一基础知识到高级技巧的全景探索
c语言·开发语言
爱coding的橙子1 小时前
CCF-CSP认证考试准备第十五天 202303-3 LDAP
算法
martian6652 小时前
学懂C++(六十):C++ 11、C++ 14、C++ 17、C++ 20新特性大总结(万字详解大全)
开发语言·c++·c++20
QXH2000002 小时前
Leetcode—环形链表||
c语言·数据结构·算法·leetcode·链表