如何配置《动手学强化学习》的环境

如何配置《动手学强化学习》的环境

网站:https://hrl.boyuai.com/chapter/intro

github仓库:https://github.com/boyu-ai/Hands-on-RL/tree/main

可以看到该教程要求使用gym==0.18.3版本的gym库,本教程可以用于解决绝大多数需要使用Pendulum-v0或者CartPole-v0环境的学习者

新建环境

python 复制代码
conda create --name myRL python=3.8
conda activate myRL

安装必要的库

复制代码
pip install tqdm, matplotlib, torch

安装gym

报错如下:

解决方法:

setuptools的版本太高了,无法安装chatGPT,首先更新版本

复制代码
pip install setuptools==66

下一步,修改配置文件

找到你的环境所在目录,找到其中的requirement.py文件

在原有的parsed = _parse_requirement(requirement_string)上方,加入下面代码

复制代码
if requirement_string.find('opencv-python>=3.')>=0:

            requirement_string += "0"    # opencv-python>=3.0

重新安装pip install gym==0.18.3

pip list后可以发现配置成功

运行DDPG.py的样例代码

参考:

https://blog.csdn.net/qq_30589271/article/details/129897966

https://github.com/openai/gym/issues/3202

相关推荐
九河云5 小时前
5秒开服,你的应用部署还卡在“加载中”吗?
大数据·人工智能·安全·机器学习·华为云
pp起床7 小时前
Gen_AI 补充内容 Logit Lens 和 Patchscopes
人工智能·深度学习·机器学习
勾股导航9 小时前
K-means
人工智能·机器学习·kmeans
Jay Kay9 小时前
GVPO:Group Variance Policy Optimization
人工智能·算法·机器学习
小鸡吃米…10 小时前
机器学习面试问题及答案
机器学习
Yeats_Liao11 小时前
评估体系构建:基于自动化指标与人工打分的双重验证
运维·人工智能·深度学习·算法·机器学习·自动化
断眉的派大星11 小时前
均值为0,方差为1:数据的“标准校服”
人工智能·机器学习·均值算法
Tadas-Gao11 小时前
缸中之脑:大模型架构的智能幻象与演进困局
人工智能·深度学习·机器学习·架构·大模型·llm
木枷12 小时前
Online Process Reward Learning for Agentic Reinforcement Learning
人工智能·深度学习·机器学习
m0_5637451112 小时前
误差卡尔曼滤波在VINS-mono中的应用
人工智能·机器学习