【工具调用】工具调用后训练参数设计方案总结

Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning

MUA-RL: MULTI-TURN USER-INTERACTING AGENT REINFORCEMENT LEARNING FOR AGENTIC TOOL USE

DeepAgent: A General Reasoning Agent with Scalable Toolsets

TOOLACE: WINNING THE POINTS OF LLM FUNCTION CALLING

ToolRL: Reward is All Tool Learning Needs

TORA: A TOOL-INTEGRATED REASONING AGENT FOR MATHEMATICAL PROBLEM SOLVING

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

相关推荐
菩提树下的凡夫5 分钟前
激光应用1---影响激光光斑大小和功率密度的因素
人工智能
2301_816651227 分钟前
C++中的策略模式高级应用
开发语言·c++·算法
AI-Ming8 分钟前
注意力机制拓展-大模型知识点(程序员转行AI大模型学习)
人工智能·学习
LDR0069 分钟前
如何使用OpenClaw提高工作效率?
数据结构·算法
liuyao_xianhui9 分钟前
优选算法_模拟_替换所有的‘?‘_C++
开发语言·javascript·数据结构·c++·算法·链表·动态规划
Mintopia10 分钟前
agent-cli 哪家强?别只看“能跑”,要看“能交付”
人工智能
kishu_iOS&AI12 分钟前
PyCharm 结合 uv 进行 AI 大模型开发
人工智能·pycharm·大模型·uv
币之互联万物15 分钟前
LLM 偏好算法解析:大语言模型内容收录倾向与 NEOXGEO 技术底蕴
人工智能·算法·语言模型
菜鸟小九17 分钟前
hot100(81-90)
java·数据结构·算法