堆排序算法和Topk思想

目录

1>>导言

2>>堆排序

2.1>>通过堆结构实现堆排序

2.2>>堆思想实现排序

3>>Topk思想

4>>代码

5>>结语


1>>导言

今天重点内容就是带着大家实现堆排序和Topk,堆排序分为两种,一种是直接调用堆的数据结构来实现的,另一种就是通过堆的思想实现的,Topk就是在一个数组中寻找前k个最大/最小的数,通常利用在世界五百强企业、十大富豪等等。

2>>堆排序

2.1>>通过堆结构实现堆排序

1.首先给了一个数组,我们需要统计出它的大小。

2.创建一个堆结构变量hp,并且初始化它。注意:传的是地址

3.往这个堆中传递arr数组的每个数

4.循环判断,当堆不为空时,每次取根节点,然后删除根节点(删除操作还记得叭?就是讲最后结点和根结点互换,然后size--,就可以将最后一个结点删除,然后将新的根结点向下调整)

5.每次取出的头结点(根据大堆就是最大,小堆就是最小),所以最终就是一个降序/升序啦!

这边以大根堆为结果,宝子们可以去试试噢

2.2>>堆思想实现排序

1.要实现堆排序,首先得要是一个堆,那么第一个循环就要把堆建立,双亲结点向下调整思想,从最后一个结点的双亲结点开始(最后一个结点是n-1)它的双亲结点是-1然后除2,依次向下调整,这样就是一个堆。

2.将这个棵树的每一个子树都想象成一个堆,然后:

3.从最后一个结点开始,到0为止,每次交换它的最后一个结点和第0个结点,然后向下调整,这样就能够从大/从小排序

问题:要实现升序建(大堆/小堆)?要实现降序建(大堆/小堆)?

答案是:升序建大堆,降序建小堆,因为升序每次交换将最大的移到最后面了所以要大堆。

这是最终结果

3>>Topk思想

首先我们来造一个空间为100000的文件,通过之前章节学的随机数初始化文件每个数值

srand表示更改随机数初始值

创建一个file的文件,存放字符指针,叫data.txt

通过fopen打开文件file,w表示写入,若返回不为空则开始往变量fin写数据

最后关闭文件。

上面步骤稍微过一遍,现在开始实现topk,这才是重点:

cpp 复制代码
void TopK()
{

	int k = 0;
	printf("请输入K:");
	scanf("%d", &k);

	const char* file = "data.txt";
	FILE* fout = fopen(file, "r");
	if (fout == NULL)
	{
		perror("fopen error");
		exit(1);
	}
	//找最大的前K个数,建小堆
	int* minHeap = (int*)malloc(sizeof(int) * k);
	if (minHeap == NULL)
	{
		perror("malloc fail!");
		exit(2);
	}
	//读取文件中前K个数据建堆
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}

	// 建堆
	for (int i = (k - 1 - 1) / 2; i >= 0; i--) {
		adjustdown(minHeap, i, k);
	}
	//要最大就建小堆,要最小就键大堆
	int x = 0;
	while (fscanf(fout, "%d", &x) != EOF) {
		if (x > minHeap[0]) {
			minHeap[0] = x;
			adjustdown(minHeap, 0, k);
		}
	}
	for (int i = 0; i < k; i++) {
		printf("%d ", minHeap[i]);
	}
}

输入指定空间/堆大小k,然后读取文件每组数字,要找最大的前k个数,就要建小堆,就跟我们要最大值取最小值min一样的,若返回不为空,那么开始建堆,取前k个数据,建堆,跟建堆思想一样,从最后一个结点的父节点开始,依次向下调整,最后循环遍历文件的每一个数,如果读取到的数数大于我们的根结点,那么另根结点等于它,然后依次向下调整即可

这是文件中的数

4>>代码

cpp 复制代码
#define _CRT_SECURE_NO_WARNINGS 1
#include"heap.h"

void test()
{
	HP hp;
	hpinit(&hp);
	hppush(&hp, 1);
	hppush(&hp, 2);
	hppush(&hp, 4);
	hppush(&hp, 5);
	hppop(&hp);
	hppop(&hp);
	hppop(&hp);
	hpdestroy(&hp);
}
void test1() {

	int arr[] = { 17,20,10,13,19,15 };
	int n = sizeof(arr) / sizeof(arr[0]);
	HP hp;
	hpinit(&hp);
	int i = 0;
	for (i = 0; i < n; i++) {
		hppush(&hp, arr[i]);
	}
	i = 0;
	while (!hpempty(&hp)) {
		arr[i++] = hptop(&hp);
		hppop(&hp);
	}
	for (i = 0; i < n; i++) {
		printf("%d ", arr[i]);
	}
}
void HeapSort(int* arr, int n) {//自己实现堆排序
	for (int i =(n-1-1)/2; i >= 0; i--) {
		adjustdown(arr, i, n);
	}
	int end = n - 1;//最后一个结点开始,到0 为止
	while (end) {//大根堆
			swap(&arr[0], &arr[end]);
			adjustdown(arr, 0, end);//end一直--;
		end--;
	}
	//大根堆为升序
}
void CreateNDate()
{
	// 造数据
	int n = 100000;
	srand((unsigned int)time(0));
	const char* file = "data.txt";
	FILE* fin = fopen(file, "w");
	if (fin == NULL)
	{
		perror("fopen error");
		return;
	}
	for (int i = 0; i < n; ++i)
	{
		int x = (rand() + i) % 1000000;
		fprintf(fin, "%d\n", x);
	}
	fclose(fin);
}
void TopK()
{

	int k = 0;
	printf("请输入K:");
	scanf("%d", &k);

	const char* file = "data.txt";
	FILE* fout = fopen(file, "r");
	if (fout == NULL)
	{
		perror("fopen error");
		exit(1);
	}
	//找最大的前K个数,建小堆
	int* minHeap = (int*)malloc(sizeof(int) * k);
	if (minHeap == NULL)
	{
		perror("malloc fail!");
		exit(2);
	}
	//读取文件中前K个数据建堆
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}

	// 建堆
	for (int i = (k - 1 - 1) / 2; i >= 0; i--) {
		adjustdown(minHeap, i, k);
	}
	//要最大就建小堆,要最小就键大堆
	int x = 0;
	while (fscanf(fout, "%d", &x) != EOF) {
		if (x > minHeap[0]) {
			minHeap[0] = x;
			adjustdown(minHeap, 0, k);
		}
	}
	for (int i = 0; i < k; i++) {
		printf("%d ", minHeap[i]);
	}
}
int main()
{
	/*test();*/
	//test1();
	//int arr[] = { 17,20,10,13,19,15 };
	//int n = sizeof(arr) / sizeof(arr[0]);
	//HeapSort(arr, n);
	//
	//int i;
	//for (i = 0; i < n; i++) {
	//	printf("%d ", arr[i]);
	//}
	//CreateNDate();
	TopK();
	
	return 0;
}
cpp 复制代码
#include"heap.h"

void hpinit(HP* php) {
	assert(php);
	php->arr = NULL;
	php->size = php->capacity = 0;
}

bool hpempty(HP* php) {
	assert(php);
	return php->size==0;
}
int hpsize(HP* php) {
	assert(php);
	return php->size;
}

void adjustup(hpdatatype* arr, int child) {
	//向上调整,parent为(child-1)/2; leftchild为parent*2+1,rightchild为parent*2+2
	int parent = (child - 1) / 2;
	//为根结点即为0结束
	while (child > 0) {
		//小根堆<,从上往下每个子孙都比我大
		//大根堆>,从上往下每个子孙都比我小
		if (arr[child] > arr[parent]) {
			//两数交换
			swap(&arr[child], &arr[parent]);
			//孩子和双亲结点往上走
			child = parent;
			parent = (child - 1) / 2;
		}
		else {
			break;
		}

	}
}	
void hppush(HP* php, hpdatatype x) {
	assert(php);
	//空间不够就扩容,与顺序表一致
	if (php->size==php->capacity)
	{
		int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;
		hpdatatype* tmp = (hpdatatype*)realloc(php->arr, newcapacity * sizeof(hpdatatype));
		if (tmp == NULL) {
			perror("realloc");
			exit(1);
		}
		php->arr = tmp;
		php->capacity = newcapacity;
	}
	//扩容结束
	//存放数据,每次存放就要比较,以小根堆为例子
	//0 1 2 3 size为4,新加入的数据下标为size
	php->arr[php->size] = x;
	//加入的不一定是与祖先比较大的数,因此需要向上调整
	adjustup(php->arr, php->size);
	//交换完毕size++
	php->size++;
}

void adjustdown(hpdatatype* arr, int parent,int size) {
	//向下调整,leftchild为parent*2+1,rightchild为parent*2+2
	int child = parent * 2 + 1;
	//大于等于总结个数n即为size结束
	while (child<size) {
		//小根堆,从上往下每个子孙都比我大
		//大根堆,从上往下每个子孙都比我小
		//此时用小根堆
		//先要判断左孩子和右孩子哪个更小
		if (child + 1 < size && arr[child] > arr[child + 1]) {
			child++;
		}
			//两数交换
			//孩子和双亲结点往下走
		if (arr[child] < arr[parent])
		{
			swap(&arr[child], &arr[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else {
			break;
		}

	}
}

void hppop(HP* php) {
	assert(php);
	assert(!hpempty(php));
	//删除堆顶数据不能直接删除
	//否则会大乱套
	//思路:根屁股结点互换,然后让新的堆顶向下调整,size--
	//屁股为size-1;
	swap(&php->arr[0], &php->arr[php->size - 1]);
	php->size--;
	adjustdown(php->arr,0,php->size);
	
}
hpdatatype hptop(HP* php) {
	assert(php);
	return php->arr[0];
}
void swap(int* child, int* parent) {
	int tmp = *child;
	*child = *parent;
	*parent = tmp;
}
void hpdestroy(HP* php) {
	assert(php);
	assert(!hpempty(php));
	if (php->arr)
		free(php->arr);
	php->arr = NULL;
	php->size = php->capacity = 0;
}

5>>结语

这篇讲的算法思想------堆排序和topk,希望对宝子们有所帮助,有不懂的欢迎评论区指出,也欢迎大佬们指点小编的文章,谢谢大家观看,期待与你下篇再见~

相关推荐
带多刺的玫瑰1 小时前
Leecode刷题C语言之统计不是特殊数字的数字数量
java·c语言·算法
爱敲代码的憨仔1 小时前
《线性代数的本质》
线性代数·算法·决策树
熬夜学编程的小王1 小时前
【C++篇】深度解析 C++ List 容器:底层设计与实现揭秘
开发语言·数据结构·c++·stl·list
yigan_Eins1 小时前
【数论】莫比乌斯函数及其反演
c++·经验分享·算法
阿史大杯茶2 小时前
AtCoder Beginner Contest 381(ABCDEF 题)视频讲解
数据结构·c++·算法
Chris _data2 小时前
二叉树oj题解析
java·数据结构
დ旧言~2 小时前
【高阶数据结构】图论
算法·深度优先·广度优先·宽度优先·推荐算法
张彦峰ZYF2 小时前
投资策略规划最优决策分析
分布式·算法·金融
The_Ticker2 小时前
CFD平台如何接入实时行情源
java·大数据·数据库·人工智能·算法·区块链·软件工程
Lenyiin3 小时前
02.06、回文链表
数据结构·leetcode·链表