第八章 排序 十一、外部排序

目录

一、定义

二、例子

三、时间开销分析

四、优化

1、多路归并

优化结果及缺点

2、减少初始归并段数量

五、总结

六、附加


一、定义

  1. 外部排序是一种用于处理大量数据的排序算法,由于数据量太大无法全部载入内存,所以需要将数据分批读取到内存中进行排序,这个过程称为"外部排序"。
  2. 外部排序通常使用两个或多个磁盘文件进行排序,其中一个文件是输入文件,另一个或多个文件是输出文件。
  3. 外部排序使用归并排序或快速排序等算法对数据进行排序,并将排序结果写入磁盘文件。
  4. 外部排序常用于处理大型数据库、搜索引擎索引、大型文件的排序等场景。

二、例子

1、我们要将磁盘内的数据进行升序排序

2、首先将第一个磁盘块和第二个磁盘块放入到输入缓冲区,然后将它们进行内部排序。

排序前

排序后

3、经过内部排序后再将它们放回磁盘块,我们就可以获得一个有序的"归并段"

4、然后再让后面的两个磁盘块进行内部排序

5、重复如此,我们就可以获得8个有序的"归并段",16块有序磁盘块

6、然后我们使用2路归并将归并段1和归并段2进行归并

7、每次挑出最小的数放入输出缓冲区,最后得到一个升序的磁盘块

8、我们将输出缓冲区的数据输出以后,接下来继续按照升序放入输出缓冲区

9、此时输入缓冲区空了,我们就要让最近的的一个磁盘块进来填充

10、继续进行比较输出

11、再次将磁盘块的数据填充进入输入缓冲区

12、重复如此,就完成归并段1和2进行升序排列了

13、每两个归并段都这样归并,我们就从8个有序归并段,缩减成了4个有序归并段

14、同样的,我们将归并段两两进行归并,这样就能将4个有序归并段,缩减成了2个有序归并段

15、再次进行归并,直到剩余一个整体

三、时间开销分析

四、优化

1、多路归并

优化结果及缺点

2、减少初始归并段数量

五、总结

六、附加

相关推荐
yuuki23323314 分钟前
【数据结构】双向链表的实现
c语言·数据结构·后端
我不是彭于晏丶43 分钟前
238. 除自身以外数组的乘积
数据结构·算法
代码雕刻家1 小时前
1.6.课设实验-数据结构-栈、队列-银行叫号系统2.0
c语言·数据结构
Violet_YSWY1 小时前
任何数据结构的构造或初始化,都应指定大小,避免数据结构无限增长吃光内存【示例】
java·数据结构
代码雕刻家2 小时前
1.7.课设实验-数据结构-二叉树-文件夹创建系统
c语言·数据结构
sigd3 小时前
排队选人-2024年秋招-小米集团-软件开发岗-第二批笔试
数据结构·算法
立志成为大牛的小牛18 小时前
数据结构——三十七、关键路径(王道408)
数据结构·笔记·程序人生·考研·算法
Shinom1ya_20 小时前
算法 day 41
数据结构·算法·leetcode
无敌最俊朗@21 小时前
C++ 值类别与移动语义详解(精简版)
java·数据结构·算法
岑梓铭1 天前
《考研408数据结构》第六章(5.5树的应用)复习笔记
数据结构·笔记·考研·408·ds