数据结构--排序(1)

文章目录

排序概念

排序指的是通过某一特征关键字(如信息量大小,首字母等)来对一连串的数据进行重新排列的操作,实现递增或者递减的数据排序。

稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

在实际的应用中是非常常见的。

文件的排序

购物的商品排序

在我们常见的排序算法中,有这几种:

这些排序算法都是通过自身空间,通过不断交换来实现排序的。

直接插入排序

思想:当我们拿到了一组数组时,先将第一个元素定为前序序列,让第二个元素与它对比,以升序为例,大的就放在第一个元素之后,小的就放在第一个元素之前,放完之后,两个元素将成为新的前序序列;接着就是将第三个元素与前序序列的元素比较,比较最大的元素,也就是前序序列的最后一个元素,比它大就将元素向后挪移,为插入数腾出一个元素空间;依此类推。

玩斗地主时从小排到大的就是这种思想:

c 复制代码
#include"Sort.h"
void PrintfArray(int* a, int n)
{
	for (int i = 0; i < n; i++)
	{
		printf("%d ", a[i]);
	}
	printf("\n");
}

//直接插入排序
void InsertSort(int* a, int n)
{
	for (int i = 0; i < n - 1; i++)
	{
		int end = i;
		int tmp = a[end + 1];
		while (end >= 0)
		{
			//将数组看作是一个个数插入进去的,从第二个数开始插入
			//比较插入数和前序序列最后一个数的大小
			//不符合条件就前序序列缩短,一直比较到大于end值停下来
			if (a[end] >tmp )
			{
				a[end + 1] = a[end];
			}
			else
			{
				break;
			}
			end--;
		}
		a[end + 1] = tmp;
	}
	
}

内循环就是将新插入的数找到合适位置,让出空间,让新的数插入;

时间复杂度:O(N^2)

验证:

c 复制代码
void TestInsertSort()
{
	int a[] = { 9,1,2,5,7,4,8,6,3,5,1,2,3,5,1,8,3 };
	InsertSort(a, sizeof(a) / sizeof(a[0]));
	PrintfArray(a, sizeof(a) / sizeof(a[0]));
}

int main()
{

	TestInsertSort();
	return 0;
}

希尔排序

在上面的直接插入排序中,如果插入数一直大于前序序列,会发现内循环会走的比较快;因为都排序好了,只需要比较前序序列的最后一个元素即可;

思想:希尔排序中,就是先将一组数组分成几等份,将每一份都进行排序,这样对于下次进行直接插入排序就预先做好了排序,简称预排序;接着不断缩短每一份的长度,一直做着预排序,直到每一份的长度为1时,就相当于上面的直接插入排序。

希尔排序就是对直接插入排序进行优化,通过预排序,让数组的排序比较有序,这样在再次排序时,就会省出会很多时间。

对于gap的取值,一般习惯直接对半取,但现在也有将gap取成三等份的;但实际效果都差不多;

c 复制代码
void Swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}

//希尔排序
void ShellSort(int* a, int n)
{
	int gap = n;
	while (gap > 1)
	{
	//gap=gap/2;
		gap = gap/3 + 1;
		for (int i=0; i< n - gap; i ++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (a[end] > tmp)
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			a[end + gap] = tmp;
		}
		
	}

}

1.将tmp与前序序列相比大小,交换,最后将空出的位插入tmp;

2.前序序列扩大了,新增一个数;

3.在不同组中进行直插;

4.进行不断的预排序;
在这里,不是将每一组排完再进行下一组的排序,而是排一组的前序序列之后,跳掉下一组去进行排序到前序序列;gap若取3等份,要加上1,不然可能会出现达不到gap==1的情况,如为8时,gap取到2就停止了;
这里不要看着有很多层循环进行嵌套,实际上它的算法效率是远远高于直接插入排序的,以gap一直取二等份为例,1000个数据也就取10次gap,100万数据也就取20次gap,10亿才取24次gap,所以外层的循环实际次数是不大的,相对如此大的数据几乎可以忽略不计;

验证:

c 复制代码
void TestShellSort()
{
	int a[]= { 9,1,2,5,7,4,8,6,3,5,1,2,3,5,1,8,3 }; 
	ShellSort(a, sizeof(a)/sizeof(a[0]));
	PrintfArray(a, sizeof(a) / sizeof(a[0]));
}
int main()
{
	
	TestShellSort();
	
	return 0;
}

时间复杂度:O(N^1.25) ~ O(1.6*N^1.25)

冒泡排序

思想:通过循环,不断的比较相邻的两个值,将最大的值往后放到最后一个位置,再通过一层循环,进行多躺的比较,总是将最大数往后放即可;

这样最大的数就排好了,以此类推排其他的数字;

c 复制代码
//冒泡排序
void BubbleSort(int* a, int n)
{
	int mark = 0;
	for (int i = 0; i < n - 1; i++)
	{
		for (int j = 0; j < n -1- i; j++)
		{
			if (a[j] > a[j + 1])
			{
				Swap(&a[j], &a[j + 1]);
				mark = 0;
			}
			else
			{
				mark = 1;
			}
		}
		//表示没有进行交换,已排序好了
		if (mark == 1)
		{
			break;
		}
	}
	
}

时间复杂度:O(N^2)

堆排序

堆排序链接处

堆排序之前写过了,这里就不多解释;

c 复制代码
void AdjustDown(int* a, int n, int parent)
{
	//左孩子
	int child = parent * 2 + 1;
	
	while (child<n)
	{
		
		//右孩子比左孩子大
		if (child + 1 < n && a[child + 1] > a[child])
		{
			child++;
		}
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}
//堆排序
void HeapSort(int* a, int n)
{
	
	//建堆
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(a, n, i);
	}
	//交换
	int end = n - 1;
	while (end>0)
	{
		
		Swap(&a[0], &a[end]);
		AdjustDown(a, end, 0);
		end--;
	}
}

时间复杂度:O(N*logN)

选择排序

思想:在数组中找出最大值和最小值的下标,记录它,然后分别与起始与结尾位置进行交换,这样一次就能找出最大值和最小值了,接着缩短数组起始和结尾位置,然后再通过循环依次进行此步骤;

c 复制代码
void SelectSort(int* a,int n)
{
	int begin = 0;
	int end = n - 1;
	while (begin < end)
	{
		int min = begin;
		int max = begin;
		//找出区间里的max和min
		for (int i = begin + 1; i <= end; i++)
		{
			if (a[i] < a[min])
			{
				min = i;
			}
			if (a[i] > a[max])
			{
				max = i;
			}
		}
		//将最小数放在起始位置
		Swap(&a[begin], &a[min]);
		//max位置的数一旦被改变,max也需跟随改变
		if (max == begin)
		{
			max = min;
		}
		Swap(&a[end], &a[max]);

		begin++;
		end--;
	}
}

这里需要注意的是,如果起始点就是最大数时,当最小数与起始位置交换后,那么max表示下标,max不变,仍然指着起始位置的下标,所以需要跟随max的值改变而改变;

O(N^2)

验证不同排序的运行时间

通过10000个数据来验证它们的排序运行时间;

c 复制代码
void TestOP()
{
	srand(time(NULL));
	const int N = 100000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);
	int* a3 = (int*)malloc(sizeof(int) * N);
	int* a4 = (int*)malloc(sizeof(int) * N);
	int* a5 = (int*)malloc(sizeof(int) * N);

	//赋值
	for (int i = 0; i < N; i++)
	{
		a1[i] = rand();

		a2[i] = a1[i];
		a3[i] = a2[i];
		a4[i] = a3[i];
		a5[i] = a1[i];
	}

	int begin1 = clock();
	InsertSort(a1, N);
	int end1 = clock();

	int begin2 = clock();
	ShellSort(a2, N);
	int end2 = clock();

	int begin3 = clock();
	BubbleSort(a3, N);
	int end3 = clock();

	int begin4 = clock();
	HeapSort(a4, N);
	int end4 = clock();

	int begin5 = clock();
	SelectSort(a5, N);
	int end5 = clock();

	printf("InsertSort:%d\n", end1 - begin1);
	printf("ShellSort:%d\n", end2 - begin2);
	printf("BubbleSort:%d\n", end3 - begin3);
	printf("HeapSort:%d\n", end4 - begin4);
	printf("SelectSort:%d\n", end5 - begin5);

}
int main()
{

	TestOP();

	return 0;
}
相关推荐
little redcap1 小时前
第十九次CCF计算机软件能力认证-乔乔和牛牛逛超市
数据结构·c++·算法
manba_5 小时前
leetcode-560. 和为 K 的子数组
数据结构·算法·leetcode
汉字萌萌哒5 小时前
【2022 CCF 非专业级别软件能力认证第一轮(CSP-J1)入门级 C++语言试题及解析】
数据结构·c++·算法
th新港6 小时前
CCF201909_1
数据结构·c++·算法·ccf
Monodye6 小时前
【Java】网络编程:TCP_IP协议详解(IP协议数据报文及如何解决IPv4不够的状况)
java·网络·数据结构·算法·系统架构
pzx_0016 小时前
【内积】内积计算公式及物理意义
数据结构·python·opencv·算法·线性回归
七折困8 小时前
列表、数组排序总结:Collections.sort()、list.sort()、list.stream().sorted()、Arrays.sort()
java·集合·数组·排序
重生之我要进大厂10 小时前
LeetCode 876
java·开发语言·数据结构·算法·leetcode
Happy鱿鱼10 小时前
C语言-数据结构 有向图拓扑排序TopologicalSort(邻接表存储)
c语言·开发语言·数据结构
KBDYD101010 小时前
C语言--结构体变量和数组的定义、初始化、赋值
c语言·开发语言·数据结构·算法