小模型驱动大智能:NVIDIA 新研究实现 2.5 倍效率提升,成本直降 70%

小模型驱动大智能:NVIDIA 新研究实现 2.5 倍效率提升,成本直降 70%

论文标题:ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

作者团队:英伟达、香港大学

发布时间:2025 年 11 月 27 日

👉 一键直达论文

👉Lab4AI 大模型实验室论文阅读

⭐ 论文简介

大语言模型在解决深度复杂问题时面临计算成本高、推理能力不足的挑战;现有工具代理多依赖单一强大模型,缺乏对"工具编排"的系统性优化,导致效率与成本难以平衡。

这篇论文解决的是,训练一个小型语言模型(Orchestrator) 作为编排器,动态协调多种工具(基础工具、专业 LLMs、通用 LLMs),通过强化学习优化任务完成效果。

⭐ 核心创新

论文核心是训练一个小型语言模型作为"编排器",通过强化学习让小模型学会 "何时调用、调用什么、如何组合" 工具,实现 "以小控大、降本增效"。

该方法将多工具任务建模为马尔可夫决策过程,编排器通过"多轮滚动"交替执行"推理"和"工具调用",逐步完成任务。

奖励设计包含三重目标:结果正确性(任务是否解决)、效率(成本与延迟)、用户偏好(工具选择倾向),引导模型平衡性能与成本,适配用户需求。

为支持训练,论文还提出了 ToolScale 数据集,通过模拟工具环境与生成多样化任务,解决端到端 RL 训练的数据稀缺问题。

⭐ 论文的贡献

  • 提出"编排范式",用小型模型协调工具实现"性能 - 成本"最优;
  • 发布 ToolScale 数据集,推动工具代理研究;
  • 证明小型编排模型在复杂任务上可超越大模型,为低成本、可扩展的 AI 系统提供新思路。
相关推荐
Yolanda941 小时前
【人工智能】《从零搭建AI问答助手项目(九):Prompt优化》
人工智能·prompt
wj3055853781 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
小和尚同志1 小时前
深入使用 skill-creator:结合真实生产级实践
人工智能·aigc
DevSecOps选型指南1 小时前
安全419专访悬镜安全 | 穿越周期在 AI 浪潮中定义数字供应链安全新范式
人工智能
沪漂阿龙2 小时前
面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透
人工智能·知识图谱
WangN22 小时前
Unitree RL Lab 学习笔记【通识】
人工智能·机器学习
haina20192 小时前
海纳AI亮相《科创中国》,解码招聘“智”变之路
人工智能·ai面试·ai招聘
阿星AI工作室2 小时前
刘润年中大课笔记:一句话说清AI落地之战的本质
大数据·人工智能·创业创新·商业
qingfeng154152 小时前
企业微信机器人开发:如何实现自动化与智能运营?
人工智能·python·机器人·自动化·企业微信
ChampaignWolf3 小时前
AI插件深度对比 | Copilot、Tabnine、Codeium谁是王者
人工智能·copilot