优先级队列算法

1046. 最后一块石头的重量

题目链接:1046. 最后一块石头的重量

题目解析

题目的意思大致就是给一堆石头(数组),每次从里面选出两块最大的石头(最大的数)xy

  • 如果x == yxy粉碎(删除xy
  • 如果x!=y,较小的粉碎,较大的减去小石头的重量

返回最终的碰撞结果1块(返回重量)或者0块石头

算法原理

每次选2个最大的数进行比较,这正好符合大根堆的数据结构,即用堆来模拟

  1. 创建大根堆
  2. 数据丢入大根堆
  3. 拿出2次大根堆堆顶元素,碰完之后,如果还有一个没碎,丢入大根堆

代码实现

cpp 复制代码
class Solution {
public:
    int lastStoneWeight(vector<int>& stones)
    {
        //默认大根堆
        priority_queue<int> heap(stones.begin(), stones.end());

        while(heap.size() > 1)
        {
            int x = heap.top();
            heap.pop();
            int y = heap.top();
            heap.pop();
            if(x > y)
            {
                x -= y;
                heap.push(x);
            }
        }
        return heap.empty() ? 0 : heap.top();
    }
};

703. 数据流中的第 K 大元素

题目链接:703. 数据流中的第 K 大元素

题目解析

目的是要找出排序之后的第k大元素(包含相同元素)

要实现一个类KthLargest,它的构造函数来构造数据流,add插入数据流然后返回第k大的元素

算法原理

这考察就是TopK问题,两种主流方式:

  1. 堆(O(N*LogK))
  2. 快速选择算法(O(N))

这题数据是一个一个过来,而用堆解决topK,也是一个一个处理,所以采用堆更优一点

  1. 创建大小为K的堆
    第K大:小根堆
    第K小:大根堆
  2. 循环:
    元素依次进堆
    判定堆的大小是否超过K

关于TopK问题,可以查看此篇文章:数据结构------二叉树

这篇更棒求解TopK问题的三种境界(漫画版)

代码实现

cpp 复制代码
class KthLargest {
public:
    int k;
    //第k大, 小根堆
    priority_queue<int ,vector<int>, greater<int> > heap;
    KthLargest(int _k, vector<int>& nums)
    {
        k = _k;
        for(auto e : nums)
        {
            heap.push(e);
            if(heap.size() > k)
            {
                heap.pop();
            }
        }
    }
    
    int add(int val)
    {
        heap.push(val);
        if(heap.size() > k)
        {
            heap.pop();
        }
        return heap.top();
    }
};

/**
 * Your KthLargest object will be instantiated and called as such:
 * KthLargest* obj = new KthLargest(k, nums);
 * int param_1 = obj->add(val);
 */

692. 前K个高频单词

题目链接:692. 前K个高频单词

题目解析

这题也是TopK问题,给一个单词列表,返回前k个出现次数最多的。

这里除了统计次数,还是统计单词的字典序,如果次数相同,按字典序排序。

算法原理

  • 这里可以用排序,统计前k个次数最多的单词,需要重载一下比较函数,如果次数相同,就按照字典序排序。

  • 也可以采用堆解决:

    1. 这里需要知道单词的次数,所以要先预处理原始字符串数组每个单词出现的个数(哈希表);
    2. 然后创建大小为K的堆:
      出现次数键小根堆,字典序大根堆
    3. 循环,元素依次进堆,然后判端
    4. 提取结果

代码实现

排序:

cpp 复制代码
class Solution {
public:
    struct Greater
    {
        bool operator()(const pair<string,int>& kv1,const pair<string,int>& kv2)
        {
            return kv1.second > kv2.second || (kv1.second == kv2.second && kv1.first <kv2.first);
        }
    };


    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> countMap;
        for(const auto& e:words)
        {
            countMap[e]++;
        }

        vector<pair<string,int>> kvVec(countMap.begin(),countMap.end());
        sort(kvVec.begin(),kvVec.end(),Greater());
        vector<string> ret;
        for(int i=0;i<k;i++)
        {
            ret.push_back(kvVec[i].first);
        }
        return ret;
    }
};

堆:

cpp 复制代码
class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k)
    {

        unordered_map<string, int> hash;
        for(const auto& e : words)
        {
            hash[e]++;
        }
        auto cmp = [](const pair<string, int> &p1, const pair<string, int> &p2)
        {
            if(p1.second == p2.second)
            {
                //大根堆
                return p1.first < p2.first;
            }
            //小根堆
            return p1.second > p2.second;
        };
        priority_queue<pair<string, int>, vector<pair<string, int>>, decltype(cmp)> heap(cmp);
        for(const auto& e : hash)
        {
            heap.push(e);
            if(heap.size() > k)
            {
                heap.pop();
            }
        }
        vector<string> ret(k);
        for(int i = k-1; i >= 0; i--)
        {
            ret[i] = heap.top().first;
            heap.pop();
        }
        return ret;
    }
};

295. 数据流的中位数

题目链接:295. 数据流的中位数

题目解析

题目给了一个有序整数列表,找出中间值,如果列表大小为偶数,中位数是中间两个数的平均值。

让我们实现一个MedianFinder类:

  • MedianFinder() 初始化 MedianFinder 对象
  • void addNum(int num) 将数据流中的整数 num 添加到数据结构中
    数据一个一个添加,确保序列为有序序列
  • double findMedian() 返回到目前为止所有元素的中位数。与实际答案相差 10^-5^以内的答案将被接受
    目前序列的中位数

算法原理

解法1------直接sort:

插入一个数,排一下序,然后通过元素个数,访问中间下标的元素。

这个add时间复杂度是O(N* logN),find的时间复杂度为O(1),题目数据量很大,会超时

解法2------插入排序思想

采用插入排序,add的时间复杂度为O(N),find时间复杂度为O(1),如果插入数据很大,时间复杂度也很大

解法3------大小堆维护

借助大小根堆来维护这个序列:

此时先规定:

  • 假设左侧为m,右侧为n
  • 要么m == n
  • 要么 m == n+1

此时要求中位数,如果这个序列元素为偶数个,直接(大根堆堆顶元素 + 小根堆堆顶元素)/2即可得到中位数;

如果为奇数个,则是大根堆堆顶元素为中位数。

查找的时间复杂度为O(1),插入的时间复杂度为O(logN)

这里需要主要的时插入数据的时候,如何维护m == nm == n+1

这里分类讨论:

  • m == n
    num <= x || m == 0,插入left
    num > x,插入right,然后让y进入left
  • m == n+1
    num <= x,进入left,此时m比n大2个,需要调整,让x进入right
    num > x,进入right

代码实现

cpp 复制代码
class MedianFinder
{
public:
    //大根堆
    priority_queue<int> left;
    //小根堆
    priority_queue<int, vector<int>, greater<int>> right;
    MedianFinder()
    {}
    
    void addNum(int num)
    {
        if(left.size() == right.size())
        {
            if(left.empty() || left.top() >= num)
            {
                left.push(num);
            }
            else
            {
                right.push(num);
                int tmp = right.top();
                right.pop();
                left.push(tmp);
            }
        }
        else if(left.size() == right.size() + 1)
        {
            if(num <= left.top())
            {
                left.push(num);
                int tmp = left.top();
                left.pop();
                right.push(tmp);
            }
            else
            {
                right.push(num);
            }
        }
    }
    
    double findMedian()
    {
        return left.size() == right.size() ? (left.top() + right.top()) / 2.0 : left.top();
    }
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */
相关推荐
火山口车神丶13 分钟前
某车企ASW面试笔试题
c++·matlab
jiao_mrswang24 分钟前
leetcode-18-四数之和
算法·leetcode·职场和发展
qystca32 分钟前
洛谷 B3637 最长上升子序列 C语言 记忆化搜索->‘正序‘dp
c语言·开发语言·算法
薯条不要番茄酱33 分钟前
数据结构-8.Java. 七大排序算法(中篇)
java·开发语言·数据结构·后端·算法·排序算法·intellij-idea
今天吃饺子38 分钟前
2024年SCI一区最新改进优化算法——四参数自适应生长优化器,MATLAB代码免费获取...
开发语言·算法·matlab
是阿建吖!39 分钟前
【优选算法】二分查找
c++·算法
王燕龙(大卫)43 分钟前
leetcode 数组中第k个最大元素
算法·leetcode
不去幼儿园2 小时前
【MARL】深入理解多智能体近端策略优化(MAPPO)算法与调参
人工智能·python·算法·机器学习·强化学习
Mr_Xuhhh2 小时前
重生之我在学环境变量
linux·运维·服务器·前端·chrome·算法
Ajiang28247353043 小时前
对于C++中stack和queue的认识以及priority_queue的模拟实现
开发语言·c++