【Java】TOP-K问题

TOP-K问题

题目

https://leetcode.cn/problems/smallest-k-lcci/description/

算法的思路详解

整体排序法

核心思路

既然要找最小的前 K 个元素,那就干脆把所有元素排好序,然后直接取前 K 个。

执行步骤

  1. 将整个数组从小到大排序
  2. 取出排序后数组的前 K 个元素

优点 :代码最简单,思路最直接
缺点:做了很多"无用功"------我们只需要前 K 小,却把整个数组都排好了

整体建立小顶堆法

核心思路

用小顶堆的特性------堆顶永远是最小值。把所有元素放入堆中,然后依次弹出堆顶,弹出来的就是从小到大的顺序。

执行步骤

  1. 把所有 N 个元素放入一个小顶堆(建堆 O(N))
  2. 从堆顶弹出元素,弹出来的就是当前最小值
  3. 重复弹出 K 次,得到前 K 小的元素

优点 :比排序法稍快(建堆 O(N) vs 排序 O(N log N))
缺点:仍然需要存储全部 N 个元素

大小为 K 的大顶堆法

核心思路

维护一个"门槛"------只关心前 K 小的元素,大于门槛的统统不要。用大顶堆来记录当前找到的 K 个候选,堆顶是这 K 个里面最大的(也就是当前的"门槛")。

执行步骤

  1. 先用前 K 个元素建一个大顶堆(堆顶是这 K 个中最大的)
  2. 遍历剩下的 N-K 个元素:
    • 如果当前元素 小于 堆顶(门槛),说明它应该进入前 K 小
    • 把堆顶(最大的那个)踢出去,把当前元素加进来
  3. 遍历结束后,堆里剩下的就是前 K 小的元素

为什么用大顶堆?

因为我们要快速知道当前 K 个候选中的最大值是谁,新来的只要比它小,就能替换掉它。

优点 :内存占用极小(只存 K 个元素),适合海量数据(比如 10 亿个数找前 100 小)
缺点:实现稍复杂

code

整体排序法

java 复制代码
// 1. 整体排序法
 public static List<Integer> topKBySorting(int[] arr, int k) {
     if (arr == null || arr.length == 0 || k <= 0) return new ArrayList<>();
     int[] copy = Arrays.copyOf(arr, arr.length);
     Arrays.sort(copy);
     List<Integer> result = new ArrayList<>();
     for (int i = 0; i < k && i < copy.length; i++) {
         result.add(copy[i]);
     }
     return result;
 }

整体建立小顶堆法

java 复制代码
// 2. 整体建立小顶堆法(把所有元素放入小顶堆,再弹出前K个)
public int[] smallestK(int[] arr, int k) {
   int []result=new int [k];

   if (arr == null || arr.length == 0 || k <= 0) return result;

   PriorityQueue<Integer> heap = new PriorityQueue<>(); // 小顶堆
   for (int num : arr) {
       heap.offer(num);
   }

   for (int i = 0; i < k ; i++) {
       result[i]=(heap.poll());
   }
   return result;
    
}

大小为K的大顶堆法

java 复制代码
// 3. 大小为K的大顶堆法(推荐,适合大数据量)

class IntCmp implements Comparator<Integer> {
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);
    }
}
class Solution {
    public int[] smallestK(int[] arr, int k) {
       int []result=new int [k];

       if (arr == null || arr.length == 0 || k <= 0) return result;

       PriorityQueue<Integer> heap = new PriorityQueue<>(new IntCmp()); // 大顶堆

       for (int i=0;i< k; i++) {
            heap.offer(arr[i]);
       }

       for(int j=k;j<arr.length;j++){
            if(heap.peek()>arr[j]){
                heap.poll();
                heap.offer(arr[j]);
            }
       }

       for (int l = 0; l < k ; l++) {
           result[l]=(heap.poll());
       }
       return result;
        
    }
}
 

三种方法对比

方法 思路
整体排序 全部排好序,再取前 K 个
整体小顶堆 所有元素进堆,再弹出 K 次
大小为 K 的大顶堆 维持一个 K 大小的"候选池",池里最大的就是门槛
方法 时间复杂度 空间复杂度 说明
整体排序 O(N log N) O(N) 或 O(log N)(原地排序) 简单直接,但不需要全部排序
整体小顶堆 O(N + K log N) O(N) 建立堆 O(N),弹出 K 次 O(K log N)
大小为 K 的大顶堆 O(N log K) O(K) 最适合流式/海量数据,内存占用最小
相关推荐
CHANG_THE_WORLD2 小时前
模拟解析:宽度数组 `[1,2,1]`,10个条目的 XRef 流
java·前端·算法
枫叶丹42 小时前
【HarmonyOS 6.0】Navigation组件新特性
开发语言·华为·harmonyos
格林威2 小时前
GigE Vision 多相机同步终极检查清单(可直接用于项目部署)
开发语言·人工智能·数码相机·机器学习·计算机视觉·视觉检测·工业相机
MyY_DO2 小时前
布隆过滤器todo
java
xinzheng新政2 小时前
Javascript·深入学习基础知识2
开发语言·javascript·学习
砍材农夫2 小时前
spring-ai 第五模型介绍
java·人工智能·spring
mu_guang_2 小时前
计算机体系结构2-内存一致性
java·后端·spring·计算机体系结构
小旭95272 小时前
SpringBoot + 七牛云 + Quartz:图片存储与定时清理
java·spring boot·后端·mybatis
萝卜白菜。2 小时前
TongWeb8.0 JNDI缓存
开发语言·python·缓存