从“丑数”算法题到 AI 实战思维:一场堆与建模的对话

如何求出第 n 个"丑数"(Ugly Number)。它不仅是对数据结构运用的考察,更是一道与 AI 场景悄然共鸣的经典题。本文将从 Java 解法入手,深度解析其原理,并延展到 AI 工程中的应用启示。

📌 问题定义

我们称一个正整数为"丑数",如果它的质因数仅包含 2, 3, 5

比如前 10 个丑数是:[1, 2, 3, 4, 5, 6, 8, 9, 10, 12]

题目要求我们找出第 n 个这样的数字。

💡 解题思路

这个问题的核心在于:

如何按顺序生成 丑数,并避免重复计算

我们可以采用最小堆(PriorityQueue)+ Set 去重的策略:

  1. 初始加入第一个丑数 1
  2. 每次从堆中弹出最小元素 cur
  3. cur * 2, cur * 3, cur * 5 三个新数加入堆。
  4. 使用 Set 来确保不会重复加入。

这样,每次堆顶的元素就是当前最小的丑数。重复上述过程 n 次,第 n 个弹出的元素即为答案。

✅ Java 实现代码

ini 复制代码
import java.util.*;

public class UglyNumber {

    public int uglyNumber(int n) {
        PriorityQueue<Long> minHeap = new PriorityQueue<>();
        Set<Long> visited = new HashSet<>();
        minHeap.offer(1L);
        visited.add(1L);
        Long cur = 0L;

        for (int i = 0; i < n; i++) {
            cur = minHeap.poll();
            if (visited.add(cur * 2)) minHeap.offer(cur * 2);
            if (visited.add(cur * 3)) minHeap.offer(cur * 3);
            if (visited.add(cur * 5)) minHeap.offer(cur * 5);
        }

        return cur.intValue();
    }
}

🔍 时间与空间复杂度分析

  • 时间复杂度:O(n log n),因为每次堆操作是 log 级别,总共 n 次。
  • 空间复杂度:O(n),堆和 HashSet 的空间开销。

🤖 延伸思考:这道题在 AI 工程中有什么价值?

别小看这道看似"算法入门"的题,它实际上与 AI 系统开发中的很多问题高度契合:

1. 数据去重与优先处理

在训练 AI 模型时,我们常常要处理重复样本 或对样本赋予优先级(Priority) 。本题通过堆与 Set 的结合,体现了如何设计一个去重 + 有序处理的数据管道。

2. 生成式任务中的候选管理

像 ChatGPT 这类生成模型,其 Beam Search 或 Top-K Sampling 机制中,也存在"生成候选并选出优者"的问题,这与我们在堆中维护下一个候选丑数如出一辙。

3. 资源调度与 AI 系统优化

在大型 AI 系统中(比如调度多 GPU 训练任务),我们也经常用最小堆等策略进行任务分配和负载均衡。这些背后的思想和本题高度一致。

  • 堆结构生成有序序列,对理解流式处理(stream processing)有帮助。
  • 再次认识到一个经典算法题背后可以蕴含系统设计与 AI 工程的核心思想。
  • 在构建 AI 产品时,若能不断抽象建模,很多"复杂任务"其实可以还原为简单而高效的算法解法。
相关推荐
Panesle21 分钟前
transformer架构与其它架构对比
人工智能·深度学习·transformer
SoFlu软件机器人27 分钟前
Go/Rust 疯狂蚕食 Java 市场?老牌语言的 AI 化自救之路
java·golang·rust
半盏茶香29 分钟前
启幕数据结构算法雅航新章,穿梭C++梦幻领域的探索之旅——堆的应用之堆排、Top-K问题
java·开发语言·数据结构·c++·python·算法·链表
hweiyu0038 分钟前
idea如何让打开的文件名tab多行显示
java·ide·intellij-idea·idea·intellij idea
我有医保我先冲1 小时前
AI大模型与人工智能的深度融合:重构医药行业数字化转型的底层逻辑
人工智能·重构
小吴先生6661 小时前
Groovy 规则执行器,加载到缓存
java·开发语言·缓存·groovy
小竹子141 小时前
L1-1 天梯赛座位分配
数据结构·c++·算法
星星不打輰1 小时前
Spring基于注解进行开发
java·spring
董董灿是个攻城狮1 小时前
Transformer 通关秘籍8:词向量如何表示近义词?
算法