优先级队列(4)_数据流的中位数

个人主页:C++忠实粉丝
欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C++忠实粉丝 原创

优先级队列(4)_数据流的中位数

收录于专栏【经典算法练习
本专栏旨在分享学习算法的一点学习笔记,欢迎大家在评论区交流讨论💌

目录

[1. 题目链接](#1. 题目链接)

[2. 题目描述](#2. 题目描述)

[3. 解法](#3. 解法)

算法思路:

代码展示:

[4. 题目总结:](#4. 题目总结:)


1. 题目链接

OJ链接 : 数据流的中位数

2. 题目描述

中位数是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。

  • 例如 arr = [2,3,4] 的中位数是 3
  • 例如 arr = [2,3] 的中位数是 (2 + 3) / 2 = 2.5

实现 MedianFinder 类:

  • MedianFinder() 初始化 MedianFinder 对象。

  • void addNum(int num) 将数据流中的整数 num 添加到数据结构中。

  • double findMedian() 返回到目前为止所有元素的中位数。与实际答案相差 10-5 以内的答案将被接受。

示例 1:

复制代码
输入
["MedianFinder", "addNum", "addNum", "findMedian", "addNum", "findMedian"]
[[], [1], [2], [], [3], []]
输出
[null, null, null, 1.5, null, 2.0]

解释
MedianFinder medianFinder = new MedianFinder();
medianFinder.addNum(1);    // arr = [1]
medianFinder.addNum(2);    // arr = [1, 2]
medianFinder.findMedian(); // 返回 1.5 ((1 + 2) / 2)
medianFinder.addNum(3);    // arr[1, 2, 3]
medianFinder.findMedian(); // return 2.0

提示:

  • -105 <= num <= 105
  • 在调用 findMedian 之前,数据结构中至少有一个元素
  • 最多 5 * 104 次调用 addNumfindMedian

3. 解法

算法思路:

这是一道关于 [堆] 这种数据结构的一个 [经典应用].

我们可以将整个数组 [按照大小] 平均分成两个部分 (如果不能平分, 那就让较小部分的元素多一个), 较小的部分称为左侧部分, 较大的部分称为右侧部分 :

  1. 将左侧部分放入 [大根堆] 中, 然后将右侧部分放入 [小根堆] 中

  2. 这样就能在O(1) 的时间内拿到中间的一个数或者两个数, 进而求平均数

如下图所示 :

于是问题就变成了 [如何将一个一个从数据流中过来的数据, 动态调整到大根堆或者小根堆中, 并且保证两个堆的元素一致, 或者左侧堆的元素比右侧堆的元素多一个]

为了方便叙述, 将左侧的 [大根堆] 记为left, 右侧的 [小根堆] 记为rght, 数据流中来的 [数据] 记为x

其实, 就是一个分类讨论的过程:

  1. 如果左右堆的 [数量相同] , left.size() == right.size():

a. 如果两个堆都是空的, 直接将数据x放到left中

b. 如果两个堆非空:

i. 如果元素要放入左侧, 也就是x <= left.top(): 那就直接放, 因为不会影响我们制定的规则

ii. 如果要放到右侧

  1. 可以先将x放入right中

  2. 然后把right的堆顶元素放入left中

  3. 如果左右堆的数量 [不相同] , 那就是left.size() > right.size():

a. 这个时候我们关心的是x是否会放入left中, 导致left变得过多:

' i. 如果x放入right中, 也就是x >= right.top(), 直接放

ii. 反之, 就需要放入left中

  1. 可以先将x放入left中

  2. 然后把left的堆顶元素放入right中

只要么一个新来的元素按照 [上述规则] 执行, 就能保证 left 中放着整个数组排序后的 [左半部分], right中放着整个数组排序后的 [右半部分], 就能在O(1)的时间内求出平均数.

代码展示:

cpp 复制代码
class MedianFinder {
    priority_queue<int> left;
    priority_queue<int, vector<int>, greater<int>> right;
public:
    MedianFinder() {}
    
    void addNum(int num) 
    {
        if(left.size() == right.size())
        {
            if(left.empty() || num <= left.top()) left.push(num);
            else 
            {
                right.push(num);
                left.push(right.top());
                right.pop();
            }
        }
        else
        {
            if(num <= left.top()) 
            {
                left.push(num);
                right.push(left.top());
                left.pop();
            }
            else right.push(num);
        }
    }
    
    double findMedian() 
    {
        if(left.size() == right.size()) return (left.top() + right.top()) / 2.0;
        else return left.top();
    }
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

4. 题目总结:

时间复杂度

插入操作 addNum 的时间复杂度为O(logn),在最坏情况下需要调整堆。调正堆的时间复杂度为O(logN)

查找中位数 findMedian 的时间复杂度为O(1)。
空间复杂度

空间复杂度为O(n),用于存储所有插入的数字。

相关推荐
lihao lihao8 分钟前
C++stack和queue的模拟实现
开发语言·c++
姆路33 分钟前
QT中使用图表之QChart概述
c++·qt
西几43 分钟前
代码训练营 day48|LeetCode 300,LeetCode 674,LeetCode 718
c++·算法·leetcode
武子康1 小时前
大数据-187 Elasticsearch - ELK 家族 Logstash Filter 插件 使用详解
大数据·数据结构·elk·elasticsearch·搜索引擎·全文检索·1024程序员节
风清扬_jd1 小时前
Chromium HTML5 新的 Input 类型week对应c++
前端·c++·html5
liuyang-neu1 小时前
力扣第420周赛 中等 3324. 出现在屏幕上的字符串序列
java·算法·leetcode
南东山人1 小时前
C++静态成员变量需要在类外进行定义和初始化-error LNK2001:无法解析的外部符号
c++
lqqjuly2 小时前
C++ 中回调函数的实现方式-函数指针
开发语言·c++
想做白天梦2 小时前
双向链表(数据结构与算法)
java·前端·算法
小卡皮巴拉2 小时前
【力扣刷题实战】相同的树
c语言·算法·leetcode·二叉树·递归