如何配置《动手学强化学习》的环境

如何配置《动手学强化学习》的环境

网站:https://hrl.boyuai.com/chapter/intro

github仓库:https://github.com/boyu-ai/Hands-on-RL/tree/main

可以看到该教程要求使用gym==0.18.3版本的gym库,本教程可以用于解决绝大多数需要使用Pendulum-v0或者CartPole-v0环境的学习者

新建环境

python 复制代码
conda create --name myRL python=3.8
conda activate myRL

安装必要的库

复制代码
pip install tqdm, matplotlib, torch

安装gym

报错如下:

解决方法:

setuptools的版本太高了,无法安装chatGPT,首先更新版本

复制代码
pip install setuptools==66

下一步,修改配置文件

找到你的环境所在目录,找到其中的requirement.py文件

在原有的parsed = _parse_requirement(requirement_string)上方,加入下面代码

复制代码
if requirement_string.find('opencv-python>=3.')>=0:

            requirement_string += "0"    # opencv-python>=3.0

重新安装pip install gym==0.18.3

pip list后可以发现配置成功

运行DDPG.py的样例代码

参考:

https://blog.csdn.net/qq_30589271/article/details/129897966

https://github.com/openai/gym/issues/3202

相关推荐
乐园游梦记4 分钟前
工业检测场景下自监督与无监督开源方案OpenMMLab+PatchCore 与其他方案对比分析
人工智能·深度学习·机器学习·开源
carrywudi6 分钟前
论文(硕士论文)
人工智能·机器学习
格林威6 分钟前
工业视觉检测:OpenCV FPS 正确计算的方式
运维·人工智能·数码相机·opencv·机器学习·计算机视觉·视觉检测
好好学仿真2 小时前
用AI预测MOF材料吸氮能力:XGBoost力压神经网络,R²高达0.9984
人工智能·机器学习·xgboost·材料科学·mofs·吸附
zs宝来了2 小时前
MLflow 模型管理:实验跟踪与模型注册
机器学习·ai·基础设施
郝学胜-神的一滴2 小时前
Softmax 从入门到精通:多分类激活函数的优雅解法
人工智能·python·算法·机器学习·分类·数据挖掘
白羊by3 小时前
逻辑回归与Softmax的区别
算法·机器学习·逻辑回归
小鱼~~3 小时前
逻辑回归简介
算法·机器学习·逻辑回归
Rubin智造社5 小时前
04月17日AI每日参考:Claude Opus 4.7正式发布,智元机器人大会今日开幕
大数据·人工智能·机器学习·claude code·智元机器人·deepseek v4·claude opus 4.7
十铭忘16 小时前
局部重绘3——FLUX-Fill的Lora训练
人工智能·深度学习·机器学习