【Java】TOP-K问题

TOP-K问题

题目

https://leetcode.cn/problems/smallest-k-lcci/description/

算法的思路详解

整体排序法

核心思路

既然要找最小的前 K 个元素,那就干脆把所有元素排好序,然后直接取前 K 个。

执行步骤

  1. 将整个数组从小到大排序
  2. 取出排序后数组的前 K 个元素

优点 :代码最简单,思路最直接
缺点:做了很多"无用功"------我们只需要前 K 小,却把整个数组都排好了

整体建立小顶堆法

核心思路

用小顶堆的特性------堆顶永远是最小值。把所有元素放入堆中,然后依次弹出堆顶,弹出来的就是从小到大的顺序。

执行步骤

  1. 把所有 N 个元素放入一个小顶堆(建堆 O(N))
  2. 从堆顶弹出元素,弹出来的就是当前最小值
  3. 重复弹出 K 次,得到前 K 小的元素

优点 :比排序法稍快(建堆 O(N) vs 排序 O(N log N))
缺点:仍然需要存储全部 N 个元素

大小为 K 的大顶堆法

核心思路

维护一个"门槛"------只关心前 K 小的元素,大于门槛的统统不要。用大顶堆来记录当前找到的 K 个候选,堆顶是这 K 个里面最大的(也就是当前的"门槛")。

执行步骤

  1. 先用前 K 个元素建一个大顶堆(堆顶是这 K 个中最大的)
  2. 遍历剩下的 N-K 个元素:
    • 如果当前元素 小于 堆顶(门槛),说明它应该进入前 K 小
    • 把堆顶(最大的那个)踢出去,把当前元素加进来
  3. 遍历结束后,堆里剩下的就是前 K 小的元素

为什么用大顶堆?

因为我们要快速知道当前 K 个候选中的最大值是谁,新来的只要比它小,就能替换掉它。

优点 :内存占用极小(只存 K 个元素),适合海量数据(比如 10 亿个数找前 100 小)
缺点:实现稍复杂

code

整体排序法

java 复制代码
// 1. 整体排序法
 public static List<Integer> topKBySorting(int[] arr, int k) {
     if (arr == null || arr.length == 0 || k <= 0) return new ArrayList<>();
     int[] copy = Arrays.copyOf(arr, arr.length);
     Arrays.sort(copy);
     List<Integer> result = new ArrayList<>();
     for (int i = 0; i < k && i < copy.length; i++) {
         result.add(copy[i]);
     }
     return result;
 }

整体建立小顶堆法

java 复制代码
// 2. 整体建立小顶堆法(把所有元素放入小顶堆,再弹出前K个)
public int[] smallestK(int[] arr, int k) {
   int []result=new int [k];

   if (arr == null || arr.length == 0 || k <= 0) return result;

   PriorityQueue<Integer> heap = new PriorityQueue<>(); // 小顶堆
   for (int num : arr) {
       heap.offer(num);
   }

   for (int i = 0; i < k ; i++) {
       result[i]=(heap.poll());
   }
   return result;
    
}

大小为K的大顶堆法

java 复制代码
// 3. 大小为K的大顶堆法(推荐,适合大数据量)

class IntCmp implements Comparator<Integer> {
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);
    }
}
class Solution {
    public int[] smallestK(int[] arr, int k) {
       int []result=new int [k];

       if (arr == null || arr.length == 0 || k <= 0) return result;

       PriorityQueue<Integer> heap = new PriorityQueue<>(new IntCmp()); // 大顶堆

       for (int i=0;i< k; i++) {
            heap.offer(arr[i]);
       }

       for(int j=k;j<arr.length;j++){
            if(heap.peek()>arr[j]){
                heap.poll();
                heap.offer(arr[j]);
            }
       }

       for (int l = 0; l < k ; l++) {
           result[l]=(heap.poll());
       }
       return result;
        
    }
}
 

三种方法对比

方法 思路
整体排序 全部排好序,再取前 K 个
整体小顶堆 所有元素进堆,再弹出 K 次
大小为 K 的大顶堆 维持一个 K 大小的"候选池",池里最大的就是门槛
方法 时间复杂度 空间复杂度 说明
整体排序 O(N log N) O(N) 或 O(log N)(原地排序) 简单直接,但不需要全部排序
整体小顶堆 O(N + K log N) O(N) 建立堆 O(N),弹出 K 次 O(K log N)
大小为 K 的大顶堆 O(N log K) O(K) 最适合流式/海量数据,内存占用最小
相关推荐
lee_curry44 分钟前
第四章 jvm中的垃圾回收器
java·jvm·垃圾收集器
九转成圣2 小时前
Java 性能优化实战:如何将海量扁平数据高效转化为类目字典树?
java·开发语言·json
SmartRadio2 小时前
ESP32-S3 双模式切换实现:兼顾手机_路由器连接与WiFi长距离通信
开发语言·网络·智能手机·esp32·长距离wifi
laowangpython2 小时前
Rust 入门:GitHub 热门内存安全编程语言
开发语言·其他·rust·github
我叫汪枫2 小时前
在后台管理系统中,如何递归和选择保留的思路来过滤菜单
开发语言·javascript·node.js·ecmascript
_.Switch2 小时前
东方财富股票数据JS逆向:secids字段和AES加密实战
开发语言·前端·javascript·网络·爬虫·python·ecmascript
软件技术NINI2 小时前
webkit简介及工作流程
开发语言·前端·javascript·udp·ecmascript·webkit·yarn
Brendan_0012 小时前
JavaScript的Stomp.over
开发语言·javascript·ecmascript
念2342 小时前
f5 shape分析
开发语言·javascript·ecmascript
苍穹之跃2 小时前
某量JS逆向
开发语言·javascript·ecmascript