如何求出第 n
个"丑数"(Ugly Number)。它不仅是对数据结构运用的考察,更是一道与 AI 场景悄然共鸣的经典题。本文将从 Java 解法入手,深度解析其原理,并延展到 AI 工程中的应用启示。
📌 问题定义
我们称一个正整数为"丑数",如果它的质因数仅包含 2, 3, 5 。
比如前 10 个丑数是:[1, 2, 3, 4, 5, 6, 8, 9, 10, 12]
。
题目要求我们找出第 n
个这样的数字。
💡 解题思路
这个问题的核心在于:
如何按顺序生成 丑数,并避免重复计算。
我们可以采用最小堆(PriorityQueue)+ Set 去重的策略:
- 初始加入第一个丑数
1
。 - 每次从堆中弹出最小元素
cur
。 - 将
cur * 2
,cur * 3
,cur * 5
三个新数加入堆。 - 使用
Set
来确保不会重复加入。
这样,每次堆顶的元素就是当前最小的丑数。重复上述过程 n
次,第 n
个弹出的元素即为答案。
✅ Java 实现代码
ini
import java.util.*;
public class UglyNumber {
public int uglyNumber(int n) {
PriorityQueue<Long> minHeap = new PriorityQueue<>();
Set<Long> visited = new HashSet<>();
minHeap.offer(1L);
visited.add(1L);
Long cur = 0L;
for (int i = 0; i < n; i++) {
cur = minHeap.poll();
if (visited.add(cur * 2)) minHeap.offer(cur * 2);
if (visited.add(cur * 3)) minHeap.offer(cur * 3);
if (visited.add(cur * 5)) minHeap.offer(cur * 5);
}
return cur.intValue();
}
}
🔍 时间与空间复杂度分析
- 时间复杂度:O(n log n),因为每次堆操作是 log 级别,总共 n 次。
- 空间复杂度:O(n),堆和 HashSet 的空间开销。
🤖 延伸思考:这道题在 AI 工程中有什么价值?
别小看这道看似"算法入门"的题,它实际上与 AI 系统开发中的很多问题高度契合:
1. 数据去重与优先处理
在训练 AI 模型时,我们常常要处理重复样本 或对样本赋予优先级(Priority) 。本题通过堆与 Set 的结合,体现了如何设计一个去重 + 有序处理的数据管道。
2. 生成式任务中的候选管理
像 ChatGPT 这类生成模型,其 Beam Search 或 Top-K Sampling 机制中,也存在"生成候选并选出优者"的问题,这与我们在堆中维护下一个候选丑数如出一辙。
3. 资源调度与 AI 系统优化
在大型 AI 系统中(比如调度多 GPU 训练任务),我们也经常用最小堆等策略进行任务分配和负载均衡。这些背后的思想和本题高度一致。
- 用 堆结构生成有序序列,对理解流式处理(stream processing)有帮助。
- 再次认识到一个经典算法题背后可以蕴含系统设计与 AI 工程的核心思想。
- 在构建 AI 产品时,若能不断抽象建模,很多"复杂任务"其实可以还原为简单而高效的算法解法。