如何配置《动手学强化学习》的环境

如何配置《动手学强化学习》的环境

网站:https://hrl.boyuai.com/chapter/intro

github仓库:https://github.com/boyu-ai/Hands-on-RL/tree/main

可以看到该教程要求使用gym==0.18.3版本的gym库,本教程可以用于解决绝大多数需要使用Pendulum-v0或者CartPole-v0环境的学习者

新建环境

python 复制代码
conda create --name myRL python=3.8
conda activate myRL

安装必要的库

复制代码
pip install tqdm, matplotlib, torch

安装gym

报错如下:

解决方法:

setuptools的版本太高了,无法安装chatGPT,首先更新版本

复制代码
pip install setuptools==66

下一步,修改配置文件

找到你的环境所在目录,找到其中的requirement.py文件

在原有的parsed = _parse_requirement(requirement_string)上方,加入下面代码

复制代码
if requirement_string.find('opencv-python>=3.')>=0:

            requirement_string += "0"    # opencv-python>=3.0

重新安装pip install gym==0.18.3

pip list后可以发现配置成功

运行DDPG.py的样例代码

参考:

https://blog.csdn.net/qq_30589271/article/details/129897966

https://github.com/openai/gym/issues/3202

相关推荐
星马梦缘9 小时前
机器学习与模式识别 第十六章 Transformers 模拟卷及答案
人工智能·机器学习·cnn·transformer·attention·注意力机制·mlp
xx_xxxxx_10 小时前
AI的工程基础1-最优化算法
人工智能·机器学习
星马梦缘10 小时前
机器学习与模式识别 第十三章 从线性模型到神经网络 考点压缩
人工智能·pytorch·神经网络·机器学习·激活函数·relu
AI科技星10 小时前
乖乖数学全域数学加速正电荷会产生反向引力
人工智能·机器学习·概率论·量子计算·乖乖数学·全域数学·引力
大囚长10 小时前
信息约简对智能系统预测的重要性
人工智能·深度学习·机器学习
m0_6265352011 小时前
MRR(Mean Reciprocal Rank)和 NDCG(Normalized Discounted Cumulative Gain)
人工智能·机器学习
FL162386312912 小时前
养猪场耳标检测数据集VOC+YOLO格式744张1类别有增强
深度学习·yolo·机器学习
AI科技星12 小时前
拓扑生命系统确定性理论:基于32维流形的遗传密码起源与衰老动力学( 中英双语顶刊终稿·标准数学符号)
开发语言·网络·人工智能·算法·机器学习·乖乖数学·全域数学
大鱼>12 小时前
机器学习基础:从零理解核心概念与算法分类
算法·机器学习·分类
AI科技星12 小时前
基于32维Cayley_Dickson超复数的全域拓扑统一场论——反重力、真空自持供能、维度瞬移与星际宇宙脑秩序体系
人工智能·学习·算法·机器学习·数据挖掘