从“丑数”算法题到 AI 实战思维:一场堆与建模的对话

如何求出第 n 个"丑数"(Ugly Number)。它不仅是对数据结构运用的考察,更是一道与 AI 场景悄然共鸣的经典题。本文将从 Java 解法入手,深度解析其原理,并延展到 AI 工程中的应用启示。

📌 问题定义

我们称一个正整数为"丑数",如果它的质因数仅包含 2, 3, 5

比如前 10 个丑数是:[1, 2, 3, 4, 5, 6, 8, 9, 10, 12]

题目要求我们找出第 n 个这样的数字。

💡 解题思路

这个问题的核心在于:

如何按顺序生成 丑数,并避免重复计算

我们可以采用最小堆(PriorityQueue)+ Set 去重的策略:

  1. 初始加入第一个丑数 1
  2. 每次从堆中弹出最小元素 cur
  3. cur * 2, cur * 3, cur * 5 三个新数加入堆。
  4. 使用 Set 来确保不会重复加入。

这样,每次堆顶的元素就是当前最小的丑数。重复上述过程 n 次,第 n 个弹出的元素即为答案。

✅ Java 实现代码

ini 复制代码
import java.util.*;

public class UglyNumber {

    public int uglyNumber(int n) {
        PriorityQueue<Long> minHeap = new PriorityQueue<>();
        Set<Long> visited = new HashSet<>();
        minHeap.offer(1L);
        visited.add(1L);
        Long cur = 0L;

        for (int i = 0; i < n; i++) {
            cur = minHeap.poll();
            if (visited.add(cur * 2)) minHeap.offer(cur * 2);
            if (visited.add(cur * 3)) minHeap.offer(cur * 3);
            if (visited.add(cur * 5)) minHeap.offer(cur * 5);
        }

        return cur.intValue();
    }
}

🔍 时间与空间复杂度分析

  • 时间复杂度:O(n log n),因为每次堆操作是 log 级别,总共 n 次。
  • 空间复杂度:O(n),堆和 HashSet 的空间开销。

🤖 延伸思考:这道题在 AI 工程中有什么价值?

别小看这道看似"算法入门"的题,它实际上与 AI 系统开发中的很多问题高度契合:

1. 数据去重与优先处理

在训练 AI 模型时,我们常常要处理重复样本 或对样本赋予优先级(Priority) 。本题通过堆与 Set 的结合,体现了如何设计一个去重 + 有序处理的数据管道。

2. 生成式任务中的候选管理

像 ChatGPT 这类生成模型,其 Beam Search 或 Top-K Sampling 机制中,也存在"生成候选并选出优者"的问题,这与我们在堆中维护下一个候选丑数如出一辙。

3. 资源调度与 AI 系统优化

在大型 AI 系统中(比如调度多 GPU 训练任务),我们也经常用最小堆等策略进行任务分配和负载均衡。这些背后的思想和本题高度一致。

  • 堆结构生成有序序列,对理解流式处理(stream processing)有帮助。
  • 再次认识到一个经典算法题背后可以蕴含系统设计与 AI 工程的核心思想。
  • 在构建 AI 产品时,若能不断抽象建模,很多"复杂任务"其实可以还原为简单而高效的算法解法。
相关推荐
Magic--8 分钟前
深入解析管道:最基础的进程间通信(IPC)实现
java·服务器·unix
nancy_princess9 分钟前
attention基础概念1
人工智能
做个文艺程序员10 分钟前
华为昇腾NPU部署开源大模型全攻略(以Qwen3-8B为例)
人工智能·深度学习·华为
再卷也是菜24 分钟前
第一章、线性代数(2)高斯消元法
线性代数·算法
NAGNIP26 分钟前
一文搞懂CNN经典架构-EfficientNet!
算法·面试
如何原谅奋力过但无声29 分钟前
【chap11-动态规划(上 - 基础题目&背包问题)】用Python3刷《代码随想录》
数据结构·python·算法·动态规划
智算菩萨33 分钟前
【论文精读】Automated machine learning for positive-unlabelled learning
论文阅读·人工智能·机器学习·论文笔记·贝叶斯优化·自动机器学习·无标签学习
架构师沉默36 分钟前
为什么国外程序员都写独立博客,而国内都在公众号?
java·后端·架构
小程故事多_8041 分钟前
破解Agent“半途摆烂”困局,OpenDev凭Harness架构,撕开Code Agents的工程化真相
人工智能·架构·aigc·harness
带刺的坐椅42 分钟前
SolonCode v2026.4.1 发布(比 ClaudeCode 简约的编程智能体)
java·ai·llm·agent·solon-ai·claudecode·soloncode