如何配置《动手学强化学习》的环境

如何配置《动手学强化学习》的环境

网站:https://hrl.boyuai.com/chapter/intro

github仓库:https://github.com/boyu-ai/Hands-on-RL/tree/main

可以看到该教程要求使用gym==0.18.3版本的gym库,本教程可以用于解决绝大多数需要使用Pendulum-v0或者CartPole-v0环境的学习者

新建环境

python 复制代码
conda create --name myRL python=3.8
conda activate myRL

安装必要的库

复制代码
pip install tqdm, matplotlib, torch

安装gym

报错如下:

解决方法:

setuptools的版本太高了,无法安装chatGPT,首先更新版本

复制代码
pip install setuptools==66

下一步,修改配置文件

找到你的环境所在目录,找到其中的requirement.py文件

在原有的parsed = _parse_requirement(requirement_string)上方,加入下面代码

复制代码
if requirement_string.find('opencv-python>=3.')>=0:

            requirement_string += "0"    # opencv-python>=3.0

重新安装pip install gym==0.18.3

pip list后可以发现配置成功

运行DDPG.py的样例代码

参考:

https://blog.csdn.net/qq_30589271/article/details/129897966

https://github.com/openai/gym/issues/3202

相关推荐
装不满的克莱因瓶15 分钟前
实现矩阵的转置:从数学原理到 NumPy 实战
线性代数·机器学习·矩阵·数据分析·numpy·特征分解
数据与后端架构提升之路2 小时前
显存都去哪了:从 FP32 Master Weight 讲透大模型训练的显存账本
机器学习·显存
zhangfeng11332 小时前
本账号 自媒体 csdn 账号诊断和改进建议,记录一下
人工智能·机器学习·媒体
code_pgf3 小时前
DPO和PPO详解及区别
人工智能·机器学习
埃菲尔铁塔_CV算法3 小时前
基于扩张卷积与双分支参数调控的低光照图像增强算法完整研究与工程解析
人工智能·神经网络·算法·机器学习·计算机视觉
老鱼说AI3 小时前
统计学习方法第七章:支持向量机精讲(超硬核长文深入预警!)
人工智能·深度学习·神经网络·算法·机器学习·支持向量机·学习方法
zhangfeng11333 小时前
DeepSeek V4 适配华为昇腾950 难度及开源情况
人工智能·pytorch·python·机器学习·华为·开源
weixin_468466853 小时前
DeepLab 语义分割模型新手部署与实战指南
人工智能·深度学习·机器学习·语义分割·机器视觉·deeplab
DreamLife☼3 小时前
OpenBCI-机器学习入门:从脑电信号到模式识别
人工智能·机器学习·开源硬件·脑机接口·eeg·openbci·神经科技
Csu__3 小时前
回归任务中损失函数有哪些
机器学习