如何配置《动手学强化学习》的环境

如何配置《动手学强化学习》的环境

网站:https://hrl.boyuai.com/chapter/intro

github仓库:https://github.com/boyu-ai/Hands-on-RL/tree/main

可以看到该教程要求使用gym==0.18.3版本的gym库,本教程可以用于解决绝大多数需要使用Pendulum-v0或者CartPole-v0环境的学习者

新建环境

python 复制代码
conda create --name myRL python=3.8
conda activate myRL

安装必要的库

复制代码
pip install tqdm, matplotlib, torch

安装gym

报错如下:

解决方法:

setuptools的版本太高了,无法安装chatGPT,首先更新版本

复制代码
pip install setuptools==66

下一步,修改配置文件

找到你的环境所在目录,找到其中的requirement.py文件

在原有的parsed = _parse_requirement(requirement_string)上方,加入下面代码

复制代码
if requirement_string.find('opencv-python>=3.')>=0:

            requirement_string += "0"    # opencv-python>=3.0

重新安装pip install gym==0.18.3

pip list后可以发现配置成功

运行DDPG.py的样例代码

参考:

https://blog.csdn.net/qq_30589271/article/details/129897966

https://github.com/openai/gym/issues/3202

相关推荐
Eloudy7 小时前
ns-3 网络仿真简介
网络·机器学习·量子计算·量子力学
zhengzhouliuhaha7 小时前
智能医疗设备控费系统:以全院一体化管控,筑牢医疗资源“安全阀”
大数据·数据结构·人工智能·算法·安全·机器学习·软件需求
装不满的克莱因瓶8 小时前
RLHF中的PPO算法——大语言模型对齐优化的核心引擎
人工智能·python·深度学习·算法·机器学习·语言模型·自然语言处理
王小王-1238 小时前
深度学习赋能:基于机器学习的恶意 URL 检测系统
人工智能·机器学习·恶意网址检测·恶意url检测·异常网址检测·机器学习异常网址检测
硅谷秋水10 小时前
NVIDIA OmniDreams:用于闭环自动驾驶仿真、支持实时生成的世界模型
人工智能·深度学习·机器学习·计算机视觉·自动驾驶
王小王-12310 小时前
基于机器学习的垃圾短信检测研究
大数据·人工智能·机器学习·垃圾短信检测·垃圾短信识别
popcorn_min11 小时前
Wine Quality 可复现机器学习实验:随机森林二分类实战
随机森林·机器学习·分类
谷哥的小弟11 小时前
大模型核心基础知识(17)—梯度下降
人工智能·深度学习·机器学习·大模型·大语言模型·梯度下降
数智工坊11 小时前
周志华《Machine Learning》学习笔记--第十五章--规则学习
笔记·学习·机器学习
namexingyun12 小时前
GPT-5.6 前端生成能力深度解析:kindle/kepler/Levi三版本UI实测与技术推演
java·前端·人工智能·gpt·机器学习·ui