【工具调用】工具调用后训练参数设计方案总结

Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning

MUA-RL: MULTI-TURN USER-INTERACTING AGENT REINFORCEMENT LEARNING FOR AGENTIC TOOL USE

DeepAgent: A General Reasoning Agent with Scalable Toolsets

TOOLACE: WINNING THE POINTS OF LLM FUNCTION CALLING

ToolRL: Reward is All Tool Learning Needs

TORA: A TOOL-INTEGRATED REASONING AGENT FOR MATHEMATICAL PROBLEM SOLVING

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

相关推荐
土豆.exe2 小时前
从自动修 Bug 到自主执行脚本:国产 AI 编辑器 IfAI v0.3.1 发布
人工智能·编辑器
jhf20202 小时前
热门的南京GEO优化系统
大数据·人工智能·python
范纹杉想快点毕业2 小时前
C语言查找算法对比分析
数据结构·算法
被星1砸昏头2 小时前
自定义操作符高级用法
开发语言·c++·算法
sxgzzn2 小时前
风电无人机巡检平台:如何用无人机与AI实现风机智能运维?
运维·人工智能·无人机
2301_810540732 小时前
python第一次作业
开发语言·python·算法
大江东去浪淘尽千古风流人物2 小时前
【Embodied】具身智能基础模型发展
人工智能·机器学习·3d·机器人·概率论
顾北122 小时前
基于 Spring AI 开发个性化旅游 AI 应用:会话记忆、Prompt 模板与 Token 统计全解析
人工智能
物联网软硬件开发-轨物科技2 小时前
技术白皮书:AI驱动下的光伏电站智能化运维新范式
运维·人工智能·物联网