强化学习实践(一)Gym介绍

学了一段时间强化学习的理论,近期准备进行一些算法实践。应用算法的前提是要创建一个合适的仿真环境,目前Openai的Gym(https://gym.openai.com) 是主流的强化学习实验环境库。

Gym已经集成许多开发好的环境,让RL的研究者们可以直接上手使用,而不需要按照论文中的描述重建环境,当然也可以在Gym中构建自己需要的环境。

总的来说,Gym可提供的环境可以归为以下几类:

1. 经典控制

​ 主要是经典强化学习文献中的控制理论问题,像平衡车的控制。

2. Atari游戏

注意,游戏环境需要单独安装下。

3.Robotics机器人模拟

基于Gym开发的机器人3D模拟环境,通过控制机器臂完成一些特定任务。地址

4..开放的Gym

Gym除了提供如此多的环境外,还提供二次开发的接口,让你可以基于Gym搭建自己想要的环境。例子

注意:Github上也有许多基于Gym开发的强化学习环境

参考文献

1.Openai Gym与强化学习_基于gym的强化学习_李子树_的博客-CSDN博客

2.强化学习Openai Gym基础环境搭建_强化学习环境-CSDN博客

  1. Gym安装Atari环境(Windows,Linux适用)_gym atari-CSDN博客
相关推荐
YSGZJJ1 小时前
股指期货的套保策略如何精准选择和规避风险?
人工智能·区块链
无脑敲代码,bug漫天飞1 小时前
COR 损失函数
人工智能·机器学习
HPC_fac130520678162 小时前
以科学计算为切入点:剖析英伟达服务器过热难题
服务器·人工智能·深度学习·机器学习·计算机视觉·数据挖掘·gpu算力
小陈phd4 小时前
OpenCV从入门到精通实战(九)——基于dlib的疲劳监测 ear计算
人工智能·opencv·计算机视觉
Guofu_Liao5 小时前
大语言模型---LoRA简介;LoRA的优势;LoRA训练步骤;总结
人工智能·语言模型·自然语言处理·矩阵·llama
ZHOU_WUYI9 小时前
3.langchain中的prompt模板 (few shot examples in chat models)
人工智能·langchain·prompt
如若1239 小时前
主要用于图像的颜色提取、替换以及区域修改
人工智能·opencv·计算机视觉
老艾的AI世界10 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK2215110 小时前
机器学习系列----关联分析
人工智能·机器学习
Robot25110 小时前
Figure 02迎重大升级!!人形机器人独角兽[Figure AI]商业化加速
人工智能·机器人·微信公众平台