【347. 前 K 个高频元素 中等】

题目:

给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。

示例 1:

输入: nums = 1,1,1,2,2,3, k = 2

输出: 1,2
示例 2:

输入: nums = 1, k = 1

输出: 1

提示:

1 <= nums.length <= 105

k 的取值范围是 1, 数组中不相同的元素的个数

题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的


思路:

这道题目主要涉及到如下三块内容:

  • 要统计元素出现频率
  • 对频率排序
  • 找出前K个高频元素

首先统计元素出现的频率,这一类的问题可以使用map来进行统计。

然后是对频率进行排序,这里我们可以使用一种 容器适配器就是优先级队列。

优先级队列其实就是一个披着队列外衣的堆,因为优先级队列对外接口只是从队头取元素,从队尾添加元素,再无其他取元素的方式,看起来就是一个队列。

而且优先级队列内部元素是自动依照元素的权值排列。那么它是如何有序排列的呢?

缺省情况下priority_queue利用max-heap(大顶堆)完成对元素的排序,这个大顶堆是以vector为表现形式的complete binary tree(完全二叉树)。

什么是堆呢?

堆是一棵完全二叉树,树中每个结点的值都不小于(或不大于)其左右孩子的值。 如果父亲结点是大于等于左右孩子就是大顶堆,小于等于左右孩子就是小顶堆。

所以大家经常说的大顶堆(堆头是最大元素),小顶堆(堆头是最小元素) ,如果懒得自己实现的话,就直接用priority_queue(优先级队列)就可以了,底层实现都是一样的,从小到大排就是小顶堆,从大到小排就是大顶堆。

本题我们就要使用优先级队列来对部分频率进行排序。

为什么不用快排呢, 使用快排要将map转换为vector的结构,然后对整个数组进行排序, 而这种场景下,我们其实只需要维护k个有序的序列就可以了,所以使用优先级队列是最优的。

此时要思考一下,是使用小顶堆呢,还是大顶堆?

有的同学一想,题目要求前 K 个高频元素,那么果断用大顶堆啊。

那么问题来了,定义一个大小为k的大顶堆,在每次移动更新大顶堆的时候,每次弹出都把最大的元素弹出去了,那么怎么保留下来前K个高频元素呢。

而且使用大顶堆就要把所有元素都进行排序,那能不能只排序k个元素呢?

所以我们要用小顶堆,因为要统计最大前k个元素,只有小顶堆每次将最小的元素弹出,最后小顶堆里积累的才是前k个最大元素。

寻找前k个最大元素流程如图所示:(图中的频率只有三个,所以正好构成一个大小为3的小顶堆,如果频率更多一些,则用这个小顶堆进行扫描)


代码:

cpp 复制代码
class Solution {
public:

    //  小顶堆实现从小到大排序,
    class myComparison{
    public:
        bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs){
            return lhs.second > rhs.second;
        }
    };
    
    vector<int> topKFrequent(vector<int>& nums, int k) {
        unordered_map<int, int> map1;
        vector<int> result;
        //  map1记录nums中的元素出现频率
        for(auto n : nums){
            map1[n]++;
        }

        //  使用设计的排序方式构建优先队列,也就是小顶堆
        priority_queue<pair<int, int>, vector<pair<int, int>>, myComparison> pri_que;

        //  利用小顶堆对map1中存储的元素频率进行排序
        //  从小到大排序,堆头为频率小的元素
        for(auto m : map1){
            pri_que.push(m);
            if(pri_que.size() > k){ //  堆的大小大于k时,将堆头的频率小的元素弹出,保证堆的大小一直为k
                pri_que.pop();
            }
        }

        //  将堆中存储的前k个高频元素存储到result中
        for(int i = k - 1; i >= 0; i--){
            result.push_back(pri_que.top().first);
            pri_que.pop();
        }

        return result;
    }
};

总结:

时间复杂度: O(nlogk)

空间复杂度: O(n)

堆的插入操作时间复杂度分析:

  • 堆是一个完全二叉树,其高度为 logk,其中k是堆中元素的数量。
  • 上浮调整的过程是从叶子节点向上到根节点的过程。在最坏情况下,新插入的元素需要一直上浮到根节点。因此,上浮调整的最坏情况时间复杂度是 O(logk)。

我们在写快排的cmp函数的时候,return left>right 就是从大到小,return left<right 就是从小到大。
而优先级队列的定义正好反过来了,可能和优先级队列的源码实现有关,大概率是底层实现上优先队列队首指向后面,队尾指向最前面的缘故!


参考:

代码随想录

相关推荐
-森屿安年-1 分钟前
63. 不同路径 II
c++·算法·动态规划
chase_my_dream4 分钟前
Cartographer详细讲解
c++·人工智能·自动驾驶
森G4 分钟前
75、服务器源码解析---------云视频服务项目
linux·服务器·网络·c++·qt
阿米亚波6 分钟前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.12 分钟前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
碧海蓝天202212 分钟前
C++法则24:在标准 C++ 中,没有任何可移植的方式判断指针 T* pt 指向的内存位置是否已经 构造了对象,程序员必须手动跟踪哪些元素已构造。
java·开发语言·c++
老余捞鱼24 分钟前
线性回归实战:5步验证你的量化因子是否真有效
算法·金融·回归·线性回归·ai量化
charlie11451419126 分钟前
现代C++指南:Lambda,让我们用另一种方式持有函数
开发语言·c++
想吃火锅100527 分钟前
【leetcode】121.买卖股票的最佳时机js/c++
算法·leetcode·职场和发展
森G1 小时前
77、线程池原理和实现------服务器源码解析----云视频服务项目
服务器·c++·qt