英伟达发布Llama-Nemotron系列新模型，性能超越DeepSeek-R1

OJAC近屿智能2025-05-10 17:01

近期，英伟达重磅推出开源模型系列 Llama-Nemotron，以强悍的推理能力与高效性能引发广泛关注，被认为可能重新定义开源AI的技术格局。

该系列模型在推理速度上全面超越DeepSeek-R1，内存使用效率与吞吐表现也大幅提升。其训练策略融合合成数据的监督微调与强化学习方式，多维提升模型在复杂任务下的推理表现。系列包括LN-Nano8B、LN-Super49B与LN-Ultra253B三个梯度版本，覆盖从轻量部署到高性能算力场景。其中，旗舰型号LN-Ultra支持128K长上下文，可在单个8xH100节点高效运行，特别适合处理长文本与多步骤任务。

Llama-Nemotron系列创新地引入"推理开关"机制，用户只需使用"detailed thinking on/off"提示词，即可在日常交互与高阶推理之间自由切换。模型训练路径涵盖神经架构搜索、知识蒸馏、预训练修复、监督微调及数学/科学数据集上的强化学习等阶段，尤其在STEM领域显示出领先优势。结合Puzzle框架进行硬件自适应优化，进一步强化推理效率。

这一系列模型的发布，为开源AI社区注入新活力，展示了英伟达在通用推理与大模型优化方向的技术积淀。

当前AI技术快速更迭，各大厂商加速布局大模型产业链，AI人才需求持续走高，正是学习与转型的黄金窗口期。