技术栈

行为克隆

程序员老周666
9 小时前
sft·强化学习·openmanus·openmanus-rl·agentgym·行为克隆·强化学习环境
3. OpenManus-RL中使用AgentGym建立强化学习环境AgentGym是为评估和开发大模型agent而设计的支持多环境和多任务的框架。该框架统一采用ReAct格式,提供多样化的交互环境和任务,支持实时反馈和并发操作。