数据结构与算法学习笔记----堆

数据结构与算法学习笔记----堆

@@ author: 明月清了个风

@@ last edited: 2024.12.2

ps⛹从这里开始调整了文章结构,先讲解算法和数据结构基本原理,再给出例题,针对例题中的应用再讲解思路。

堆是一种完全二叉树,常用于实现优先队列(priority_queue)等功能,可以根据堆内元素关系分为大根堆小根堆

  • 大根堆 :每个父节点的值都大于或等于其子节点的值,根节点是堆中最大的元素。
  • 小根堆 :每个父节点的正都小于或等于其子节点的值,根节点是对重最小的元素。

对于堆来说(以小根堆为例),常用的操作有建堆、取出最小元素、删除最小元素、删除某个元素、修改某个元素

  1. 建堆O(n)

    堆化(heapify)是堆数据结构中的一个核心操作。建堆的过程其实也是一个排序的过程,以小根堆为例,在读入所有的元素之后进行堆化,使用到的操作是下沉(down),步骤如下:

    • 假设当前节点是最大值
    • 然后比较左子节点和右子节点,找到三个节点中最小的一个。
    • 如果当前节点不是最小值,就与最小值节点交换,并递归下沉被交换的元素,这个数所在的新的子树中仍可能不满足堆的条件。

    这里给出的示例代码使用的是数组的存储方式(当然也可以用链表进行存储)

    从下标1开始存储,左子节点是2 * i,右子节点是2 * i + 1

    每次对于一个节点,在其作为根节点存在的子树中找到最小的节点(也就是在i, 2 * i, 2 *i + 1中的最小值)放到这颗子树的根节点上,最后递归被交换的点。

    ⭐️这里有个注意点:建堆的循环中从cnt / 2开始(如果是从0开始存的,就是从cnt / 2 - 1开始)。

    解释:在完全二叉树中,叶子节点 的索引cnt / 2 + 1cnt,从cnt / 2 + 1开始的所有节点都是叶子节点,那么对于叶子节点而言,他们自身满足堆的性质,在以他们自己为根节点的子树中是最小值(因为他们也没有子节点和他们对比了),因此不需要调整他们的位置。对于非叶子节点 而言,需要进行对比确保其子树堆的性质,因此可以从cnt / 2开始遍历。

    cpp 复制代码
    int h[N], cnt;
    
    void down(int u)
    {
        int t = u;
        if(u * 2 <= cnt && h[u* 2] < h[u]) t = u * 2;
        if(u * 2 + 1 <= cnt && h[u * 2 + 1] < h[u]) t = u * 2 + 1;
        if(u != t)
        {
            swap(h[u], h[t]);
            down(t);
        }
    }
    
    int main()
    {
        
        for(int i = 1; i <= cnt; i ++) cin >> h[i];
        
        for(int i = cnt / 2; i ; i --) down(i);
        
    }
  2. 取最小值 O(1)

    取堆中的最小值很简单,返回第一个元素h[1]即可

  3. 删除最小值 O( l o g ( n ) log(n) log(n))

    对于数组存储的二叉树,删除最小值也很简单,只需要用树的最后一个元素将其覆盖h[1] = h[cnt --],再进行一次排序down(1),在最坏情况下, 这个树会沿着树的高度一路down到最底层,因此时间复杂度为O( l o g ( n ) log(n) log(n))。

  4. 删除某个元素

    对于删除某个元素而言,这里考虑的同样是删除最小值的操作,若要删除编号为k的元素,则用树的最后一个元素将其覆盖h[k] = h[cnt --]后,再进行一次堆化排序操作down(k),时间复杂度也和上述操作相同。

  5. 修改某个元素

    修改元素一般只需要将这个值改掉h[k] = x,; cnt ++再堆化一遍donw(k)就行。

Acwing 836. 合并集合

原题链接\]([838. 堆排序 - AcWing题库](https://www.acwing.com/problem/content/840/)) 输入一个长度为 n n n的整数数列,从小到大输出前 m m m小的数。 #### 输入格式 第一行输入整数 n n n和 m m m 第二行包含 n n n个整数,表示整数数列。 #### 输出格式 共一行,包含 m m m个整数,表示整数数列中前 m m m小的数。 #### 数据范围 1 ≤ n , m ≤ 1 0 5 1 \\leq n, m \\leq 10\^{5} 1≤n,m≤105, 1 ≤ 数列中元素 ≤ 1 0 9 1 \\leq 数列中元素 \\leq 10\^9 1≤数列中元素≤109 #### 代码 ```cpp #include #include using namespace std; const int N = 100010; int n, m; int h[N], cnt; void down(int u) { int t = u; if(u * 2 <= cnt && h[u * 2] < h[t]) t = u * 2; if(u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t]) t = u * 2 + 1; if(u != t) { swap(h[u], h[t]); down(t); } } int main() { cin >> n >> m; for(int i = 1; i <= n; i ++) cin >> h[i]; cnt = n; for(int i = n / 2; i; i --) down(i); while(m --) { cout << h[1] << ' '; h[1] = h[cnt --]; down(1); } cout << endl; return 0; } ``` ### Acwing 836. 合并集合 \[原题链接\]([839. 模拟堆 - AcWing题库](https://www.acwing.com/problem/content/841/)) 维护一个集合,初始时集合为空,支持如下几种操作: 1. `I x`,插入一个数`x`; 2. `PM`,输出当前集合中的最小值; 3. `DM`,删除当前集合中的最小值(数据保证此时的最小值唯一); 4. `D k`,删除第`k`个插入的数。 5. `C k x`,修改第`k`个插入的数,将其变为`x`; 现在要进行`N`次操作,对于所有第 2 2 2个操作,输出当前集合的最小值。 #### 输入格式 第一行输入整数 N N N。 接下来 N N N行,每行包含一个操作指令。 #### 输出格式 对于每个输出指令`PM`,输出一个结果,表示当前集合中的最小值。 #### 数据范围 1 ≤ N ≤ 1 0 5 1 \\leq N \\leq 10\^{5} 1≤N≤105, − 1 0 9 ≤ x ≤ 1 0 9 -10\^9 \\leq x \\leq 10\^9 −109≤x≤109 #### 思路 这道题中的操作都是上面讲过的基本操作,需要注意的地方是位置的映射,因为**指定要删除的元素编号是按插入的顺序计算的** 。我们建堆完成后,数组内元素的顺序就不同了,因此需要保存这个数据,如果是用结构体存储的话相对会更简单,这里给个示例,具体实现就不写了(如果后面有碰或者大家有需要再补吧),需要修改第 k k k个元素就遍历一遍堆找到`insertOrder`为`k`的元素即可。 ```cpp typedef struct HeapNode { int value; // 节点的值 int insertionOrder; // 插入顺序,表示该节点是第几次插入堆中的 struct HeapNode* left; // 指向左子节点的指针 struct HeapNode* right; // 指向右子节点的指针 struct HeapNode* parent; // 指向父节点的指针 } HeapNode; ``` 由于使用的是数组存储元素,因此额外的信息(也就是插入顺序)需要另外开数组进行存储,并且因为会**涉及到堆中两个元素值的互换,那么插入顺序的索引也需要进行互换** ,因此开两个数组`ph[N]`和`hp[N]`。 前者`ph[k]`的含义是第 k k k个插入的元素在堆中的索引,也就是要找到第 k k k个插入元素在堆中排序后的位置操作是`k = ph[k]`。 后者`hp[k]`的含义是堆中索引为`k`的元素是第几个插入的。 这里比较绕,画个图解释一下 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6e6452bd7afd481b8e7e1b783eb4c52d.jpeg) 图中右侧为一个堆,节点中的数字表示其在堆中排序后的位置(即数组`h`),现有两个节点`a`和`b`需要交换位置。 假设`a`是第一个插入的元素,`b`是第三个插入的元素,那么对于节点`a`来说`ph[1] = 4,hp[4] = 1`,对于节点`b`来说`ph[3] = 2, hp[2] = 3` 那么交换时,不仅要交换值,还要交换索引,因此交换操作的代码为 ```cpp void heap_swap(int a, int b) { swap(ph[hp[a]], ph[hp[b]]); swap(hp[a], hp[b]); swap(h[a], h[b]); } ``` 解释:对于要交换的节点`a`和`b`,首先交换其插入的索引`swap(ph[hp[a]], ph[hp[b]])`,`hp[a]`和`hp[b]`分别是两节点在堆中的索引,然后交换两者在树中位置的索引`swap(hp[a], hp[b])`,最后交换两者的值`swap(h[a], h[b])`。 #### 代码 ```cpp #include #include using namespace std; const int N = 100010; int n, m; int h[N], ph[N], hp[N], cnt; void heap_swap(int a, int b) { swap(ph[hp[a]], ph[hp[b]]); swap(hp[a], hp[b]); swap(h[a], h[b]); } void down(int u) { int t = u; if(u * 2 <= cnt && h[u * 2] < h[t]) t = u * 2; if(u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t]) t = u * 2 + 1; if(u != t) { heap_swap(u, t); down(t); } } void up(int u) { while(u / 2 && h[u / 2] > h[u]) { heap_swap(u, u / 2); u >>= 1; } } int main() { cin >> n; while(n --) { char op[5]; int k, x; cin >> op; if(!strcmp(op, "I")) { cin >> x; cnt ++; m ++; ph[m] = cnt, hp[cnt] = m; h[cnt] = x; up(cnt); } else if(!strcmp(op, "PM")) cout << h[1] << endl; else if(!strcmp(op, "DM")) { heap_swap(1, cnt); cnt --; down(1); } else if(!strcmp(op, "D")) { cin >> k; k = ph[k]; heap_swap(k, cnt); cnt --; up(k); down(k); } else { cin >> k >> x; k = ph[k]; h[k] = x; up(k); down(k); } } return 0; } ```

相关推荐
想跑步的小弱鸡2 小时前
Leetcode hot 100(day 3)
算法·leetcode·职场和发展
xyliiiiiL3 小时前
ZGC初步了解
java·jvm·算法
爱的叹息4 小时前
RedisTemplate 的 6 个可配置序列化器属性对比
算法·哈希算法
独好紫罗兰4 小时前
洛谷题单2-P5713 【深基3.例5】洛谷团队系统-python-流程图重构
开发语言·python·算法
zhuyixiangyyds5 小时前
day21和day22学习Pandas库
笔记·学习·pandas
每次的天空5 小时前
Android学习总结之算法篇四(字符串)
android·学习·算法
请来次降维打击!!!5 小时前
优选算法系列(5.位运算)
java·前端·c++·算法
qystca5 小时前
蓝桥云客 刷题统计
算法·模拟
别NULL6 小时前
机试题——统计最少媒体包发送源个数
c++·算法·媒体
jingjingjing11116 小时前
笔记:docker安装(ubuntu 20.04)
笔记·docker·容器