技术栈
行为克隆
程序员老周666
9 小时前
sft
·
强化学习
·
openmanus
·
openmanus-rl
·
agentgym
·
行为克隆
·
强化学习环境
3. OpenManus-RL中使用AgentGym建立强化学习环境
AgentGym是为评估和开发大模型agent而设计的支持多环境和多任务的框架。该框架统一采用ReAct格式,提供多样化的交互环境和任务,支持实时反馈和并发操作。