技术栈

gymnasium

星马梦缘
21 天前
pytorch·python·jupyter·强化学习·baseline3·gymnasium
强化学习实战5——BaseLine3使用自定义环境训练【输入状态向量】想要学会将BL3接入自定义的环境需要做两件事:第零,你得对自己的任务熟悉,知晓观测空间、动作空间、奖励函数如何设计,根据需求决定要用的模型,再开始写代码。
我是有底线的