数据结构——堆

数据结构------堆

堆简介

堆是一棵树,其每个节点都有一个键值,且每个节点的键值都大于等于/小于等于其父亲的键值。

每个节点的键值都大于等于其父亲键值的堆叫做小根堆,否则叫做大根堆。STL 中的 priority_queue 其实就是一个大根堆。

(小根)堆主要支持的操作有:插入一个数、查询最小值、删除最小值、合并两个堆、减小一个元素的值。

一些功能强大的堆(可并堆)还能(高效地)支持 merge 等操作。

一些功能更强大的堆还支持可持久化,也就是对任意历史版本进行查询或者操作,产生新的版本。

堆的分类


习惯上,不加限定提到「堆」时往往都指二叉堆。

二叉堆

结构

从二叉堆的结构说起,它是一棵二叉树,并且是完全二叉树,每个结点中存有一个元素(或者说,有个权值)。

堆性质:父亲的权值不小于儿子的权值(大根堆)。同样的,我们可以定义小根堆。本文以大根堆为例。

由堆性质,树根存的是最大值(getmax 操作就解决了)。

过程

插入操作

插入操作是指向二叉堆中插入一个元素,要保证插入后也是一棵完全二叉树。

最简单的方法就是,最下一层最右边的叶子之后插入。

如果最下一层已满,就新增一层。

插入之后可能会不满足堆性质?

向上调整:如果这个结点的权值大于它父亲的权值,就交换,重复此过程直到不满足或者到根。

可以证明,插入之后向上调整后,没有其他结点会不满足堆性质。

向上调整的时间复杂度是 O ( l o g n ) O(log n) O(logn)的。

删除操作

删除操作指删除堆中最大的元素,即删除根结点。

但是如果直接删除,则变成了两个堆,难以处理。

所以不妨考虑插入操作的逆过程,设法将根结点移到最后一个结点,然后直接删掉。

然而实际上不好做,我们通常采用的方法是,把根结点和最后一个结点直接交换。

于是直接删掉(在最后一个结点处的)根结点,但是新的根结点可能不满足堆性质......

向下调整:

在该结点的儿子中,找一个最大的,与该结点交换,重复此过程直到底层。

可以证明,删除并向下调整后,没有其他结点不满足堆性质。

时间复杂度 O ( l o g n ) O(log n) O(logn)。

增加某个点的权值

很显然,直接修改后,向上调整一次即可,时间复杂度为 O ( l o g n ) O(log n) O(logn)。

实现

我们发现,上面介绍的几种操作主要依赖于两个核心:向上调整和向下调整。

考虑使用一个序列 h h h 来表示堆。 h i h_i hi 的两个儿子分别是 h 2 h_2 h2 i _i i 和 h 2 h_2 h2 i _i i + _+ + 1 _1 1, 1 1 1 是根结点:

参考代码:

cpp 复制代码
void up(int x) {
  while (x > 1 && h[x] > h[x / 2]) {
    swap(h[x], h[x / 2]);
    x /= 2;
  }
}

void down(int x) {
  while (x * 2 <= n) {
    t = x * 2;
    if (t + 1 <= n && h[t + 1] > h[t]) t++;
    if (h[t] <= h[x]) break;
    std::swap(h[x], h[t]);
    x = t;
  }
}

建堆

考虑这么一个问题,从一个空的堆开始,插入 n 个元素,不在乎顺序。

直接一个一个插入需要 O ( n l o g n ) O(n log n) O(nlogn) 的时间,有没有更好的方法?

方法一:使用 decreasekey(即,向上调整)

从根开始,按 BFS 序进行。

cpp 复制代码
void build_heap_1() {
  for (i = 1; i <= n; i++) up(i);
}

为啥这么做:对于第 k 层的结点,向上调整的复杂度为 O ( k ) O(k) O(k) 而不是 O ( l o g n ) O(log n) O(logn)。

总复杂度: l o g 1 log 1 log1 + l o g 2 log 2 log2 + ... + l o g n log n logn = O ( n l o g n ) O(n log n) O(nlogn)。

(在「基于比较的排序」中证明过)

方法二:使用向下调整

这时换一种思路,从叶子开始,逐个向下调整

cpp 复制代码
void build_heap_2() {
  for (i = n; i >= 1; i--) down(i);
}

换一种理解方法,每次「合并」两个已经调整好的堆,这说明了正确性。

注意到向下调整的复杂度,为 O ( l o g n − k ) O(log n - k) O(logn−k),另外注意到叶节点无需调整,因此可从序列约 n/2 的位置开始调整,可减少部分常数但不影响复杂度。

之所以能 O ( n ) O(n) O(n) 建堆,是因为堆性质很弱 ,二叉堆并不是唯一的。

要是像排序那样的强条件就难说了。

应用

对顶堆

这个问题可以被进一步抽象成:动态维护一个序列上第 k k k 大的数, k k k 值可能会发生变化。

对于此类问题,我们可以使用对顶堆 这一技巧予以解决(可以避免写权值线段树或 B S T BST BST带来的繁琐)。

对顶堆由一个大根堆与一个小根堆组成,小根堆维护大值即前 k k k 大的值(包含第 k k k 个),大根堆维护小值即比第 k k k 大数小的其他数。

这两个堆构成的数据结构支持以下操作:

1.维护 :当小根堆的大小小于 k k k 时,不断将大根堆堆顶元素取出并插入小根堆,直到小根堆的大小等于 k k k;当小根堆的大小大于 k k k 时,不断将小根堆堆顶元素取出并插入大根堆,直到小根堆的大小等于 k k k;

2.插入元素:若插入的元素大于等于小根堆堆顶元素,则将其插入小根堆,否则将其插入大根堆,然后维护对顶堆;

3.查询第 k 大元素:小根堆堆顶元素即为所求;

4.删除第 k 大元素:删除小根堆堆顶元素,然后维护对顶堆;

显然,查询第 k k k 大元素的时间复杂度是 O ( 1 ) O(1) O(1) 的。由于插入、删除或调整 k k k 值后,小根堆的大小与期望的 k k k 值最多相差 1 1 1,故每次维护最多只需对大根堆与小根堆中的元素进行一次调整,因此,这些操作的时间复杂度都是 O ( l o g n ) O(log n) O(logn) 的。

其他:

配对堆:

详见:链接: 数据结构------配对堆

左偏树:

详见后文。

相关推荐
程序猿000001号2 分钟前
使用Python的Seaborn库进行数据可视化
开发语言·python·信息可视化
一个不正经的林Sir7 分钟前
C#WPF基础介绍/第一个WPF程序
开发语言·c#·wpf
愤怒的代码11 分钟前
Spring Boot对访问密钥加解密——HMAC-SHA256
java·spring boot·后端
带多刺的玫瑰12 分钟前
Leecode刷题C语言之切蛋糕的最小总开销①
java·数据结构·算法
API快乐传递者12 分钟前
Python爬虫获取淘宝详情接口详细解析
开发语言·爬虫·python
公众号Codewar原创作者14 分钟前
R数据分析:工具变量回归的做法和解释,实例解析
开发语言·人工智能·python
赵钰老师17 分钟前
基于R语言APSIM模型应用及批量模拟(精细农业、水肥管理、气候变化、粮食安全、土壤碳周转、环境影响、农业可持续性、农业生态等)
开发语言·数据分析·r语言
栗豆包27 分钟前
w118共享汽车管理系统
java·spring boot·后端·spring·tomcat·maven
lly20240633 分钟前
Highcharts 饼图:数据可视化利器
开发语言
夜半被帅醒33 分钟前
MySQL 数据库优化详解【Java数据库调优】
java·数据库·mysql