技术栈

baseline3

星马梦缘
15 天前
pytorch·python·jupyter·强化学习·baseline3·gymnasium
强化学习实战5——BaseLine3使用自定义环境训练【输入状态向量】想要学会将BL3接入自定义的环境需要做两件事:第零,你得对自己的任务熟悉,知晓观测空间、动作空间、奖励函数如何设计,根据需求决定要用的模型,再开始写代码。
星马梦缘
19 天前
python·深度学习·机器学习·强化学习·q-learning·baseline3
强化学习实战4——自定义环境的搭建我们之前写了自定义环境下的Predator游戏,但是如果要用BaseLine3的库来训练,就需要满足一些接口规范。接下来我们严格参考BL3的定义规范我们的环境,方便接下来的DQN训练。
星马梦缘
20 天前
强化学习·dqn·q-learning·baseline3
强化学习实战3——自定义环境的搭建Q-LEARNINGBL3能为我们解决很多问题,但是其提供的环境确实有限,如果你想训练Agent玩吃豆人,就需要自行配置环境了。
我是有底线的