从“丑数”算法题到 AI 实战思维:一场堆与建模的对话

如何求出第 n 个"丑数"(Ugly Number)。它不仅是对数据结构运用的考察,更是一道与 AI 场景悄然共鸣的经典题。本文将从 Java 解法入手,深度解析其原理,并延展到 AI 工程中的应用启示。

📌 问题定义

我们称一个正整数为"丑数",如果它的质因数仅包含 2, 3, 5

比如前 10 个丑数是:[1, 2, 3, 4, 5, 6, 8, 9, 10, 12]

题目要求我们找出第 n 个这样的数字。

💡 解题思路

这个问题的核心在于:

如何按顺序生成 丑数,并避免重复计算

我们可以采用最小堆(PriorityQueue)+ Set 去重的策略:

  1. 初始加入第一个丑数 1
  2. 每次从堆中弹出最小元素 cur
  3. cur * 2, cur * 3, cur * 5 三个新数加入堆。
  4. 使用 Set 来确保不会重复加入。

这样,每次堆顶的元素就是当前最小的丑数。重复上述过程 n 次,第 n 个弹出的元素即为答案。

✅ Java 实现代码

ini 复制代码
import java.util.*;

public class UglyNumber {

    public int uglyNumber(int n) {
        PriorityQueue<Long> minHeap = new PriorityQueue<>();
        Set<Long> visited = new HashSet<>();
        minHeap.offer(1L);
        visited.add(1L);
        Long cur = 0L;

        for (int i = 0; i < n; i++) {
            cur = minHeap.poll();
            if (visited.add(cur * 2)) minHeap.offer(cur * 2);
            if (visited.add(cur * 3)) minHeap.offer(cur * 3);
            if (visited.add(cur * 5)) minHeap.offer(cur * 5);
        }

        return cur.intValue();
    }
}

🔍 时间与空间复杂度分析

  • 时间复杂度:O(n log n),因为每次堆操作是 log 级别,总共 n 次。
  • 空间复杂度:O(n),堆和 HashSet 的空间开销。

🤖 延伸思考:这道题在 AI 工程中有什么价值?

别小看这道看似"算法入门"的题,它实际上与 AI 系统开发中的很多问题高度契合:

1. 数据去重与优先处理

在训练 AI 模型时,我们常常要处理重复样本 或对样本赋予优先级(Priority) 。本题通过堆与 Set 的结合,体现了如何设计一个去重 + 有序处理的数据管道。

2. 生成式任务中的候选管理

像 ChatGPT 这类生成模型,其 Beam Search 或 Top-K Sampling 机制中,也存在"生成候选并选出优者"的问题,这与我们在堆中维护下一个候选丑数如出一辙。

3. 资源调度与 AI 系统优化

在大型 AI 系统中(比如调度多 GPU 训练任务),我们也经常用最小堆等策略进行任务分配和负载均衡。这些背后的思想和本题高度一致。

  • 堆结构生成有序序列,对理解流式处理(stream processing)有帮助。
  • 再次认识到一个经典算法题背后可以蕴含系统设计与 AI 工程的核心思想。
  • 在构建 AI 产品时,若能不断抽象建模,很多"复杂任务"其实可以还原为简单而高效的算法解法。
相关推荐
有一个好名字2 分钟前
力扣-电话号码组合
算法·leetcode·职场和发展
我命由我123452 分钟前
Android 开发 Room 数据库升级问题:A migration from 6 to 7 was required but not found.
android·java·java-ee·android studio·android jetpack·android-studio·android runtime
roamingcode2 分钟前
我是如何 Vibe Coding,将 AI CLI 工具从 Node.js 迁移到 Rust 并成功发布的
人工智能·rust·node.js·github·claude·github copilot
黄筱筱筱筱筱筱筱3 分钟前
7.适合新手小白学习Python的异常处理(Exception)
java·前端·数据库·python
下午写HelloWorld5 分钟前
生成对抗网络GAN的简要理解
人工智能·神经网络·生成对抗网络
Stecurry_306 分钟前
Springboot整合SpringMVC --从0到1
java·spring boot·后端
Serene_Dream6 分钟前
NIO 的底层机理
java·jvm·nio·mmap
鱼跃鹰飞6 分钟前
Leetcode会员尊享面试100题:1086:前五科的均分
算法·leetcode·职场和发展
༾冬瓜大侠༿7 分钟前
C++string
c语言·开发语言·c++·算法
Lethehong8 分钟前
探索高效工作流的秘密:GLM-4.7 与 Dify 平台深度集成实践
大数据·人工智能·算法