记录使用gym和stable_baseline3训练出成功通关的贪吃蛇ai

参考自b站up林亦LYi的开源项目
传送门

本次只训练了cnn版本的

第一次接触这种项目,建python虚拟环境时出了点难以说清楚的小问题,安装不上requirement.txt中的gym库那个版本,折腾了一会,自己都乱了头绪,最后导致训练用的是gymnasium这个库,测试用的是gym库。

如上图中带"_test"的py文件就是我自己魔改时加上去的,用于测试。另一个则是训练。

将之前的一个个测试改成了检测文件夹,批量测试。注意,如果同时训练和测试,可能会爆内存。

test_cnn_result.txt记录测试结果

参数可能要自己改一下。不知为啥,一样的代码,一样的参数,就是跑不出视频里的效果,跑出来一个怂怂的货。改了以后才正常一点。

记录一下

步数不是越大越好,不要无脑将步数小的删掉

看结果时仔细看最高分,差点就把最厉害的删掉了

链接

链接: https://pan.baidu.com/s/1dsmpg43iGeATeKqpfwtcMg?pwd=6666 提取码: 6666)

相关推荐
肖遥Janic7 分钟前
Stable Diffusion绘画 | 插件-Deforum:商业LOGO广告视频
人工智能·ai·ai作画·stable diffusion
我就是全世界2 小时前
一起了解AI的发展历程和AGI的未来展望
人工智能·agi
colorknight2 小时前
1.2.3 HuggingFists安装说明-MacOS安装
人工智能·低代码·macos·huggingface·数据科学·ai agent
kuan_li_lyg2 小时前
MATLAB - 机械臂手眼标定(眼在手内) - 估计安装在机器人上的移动相机的姿态
开发语言·人工智能·matlab·机器人·ros·机械臂·手眼标定
山川而川-R2 小时前
Windows安装ollama和AnythingLLM
人工智能·python·语言模型·自然语言处理
Kuekua-seu2 小时前
diffusion vs GAN
人工智能·神经网络·生成对抗网络
电子科技圈2 小时前
IAR全面支持国科环宇AS32X系列RISC-V车规MCU
人工智能·嵌入式硬件·mcu·编辑器
大地之灯2 小时前
深度学习每周学习总结J1(ResNet-50算法实战与解析 - 鸟类识别)
人工智能·python·深度学习·学习·算法
OCR_wintone4212 小时前
翔云 OCR:发票识别与验真
人工智能·深度学习·ocr
工业机器视觉设计和实现3 小时前
cnn突破三
人工智能·神经网络·cnn