记录使用gym和stable_baseline3训练出成功通关的贪吃蛇ai

参考自b站up林亦LYi的开源项目
传送门

本次只训练了cnn版本的

第一次接触这种项目,建python虚拟环境时出了点难以说清楚的小问题,安装不上requirement.txt中的gym库那个版本,折腾了一会,自己都乱了头绪,最后导致训练用的是gymnasium这个库,测试用的是gym库。

如上图中带"_test"的py文件就是我自己魔改时加上去的,用于测试。另一个则是训练。

将之前的一个个测试改成了检测文件夹,批量测试。注意,如果同时训练和测试,可能会爆内存。

test_cnn_result.txt记录测试结果

参数可能要自己改一下。不知为啥,一样的代码,一样的参数,就是跑不出视频里的效果,跑出来一个怂怂的货。改了以后才正常一点。

记录一下

步数不是越大越好,不要无脑将步数小的删掉

看结果时仔细看最高分,差点就把最厉害的删掉了

链接

链接: https://pan.baidu.com/s/1dsmpg43iGeATeKqpfwtcMg?pwd=6666 提取码: 6666)

相关推荐
LaughingZhu23 分钟前
Product Hunt 每日热榜 | 2026-03-21
人工智能·经验分享·深度学习·神经网络·产品运营
qzhqbb24 分钟前
差分隐私与大模型+差分隐私在相关领域应用的论文总结
人工智能·算法
一招定胜负27 分钟前
基于通义千问 API 的课堂话语智能分类分析工具实现
人工智能·分类·数据挖掘
阿_旭33 分钟前
基于YOLO26深度学习的【桃子成熟度检测与分割系统】【python源码+Pyqt5界面+数据集+训练代码】图像分割、人工智能
人工智能·python·深度学习·桃子成熟度检测
CoderJia程序员甲36 分钟前
GitHub 热榜项目 - 日榜(2026-03-22)
人工智能·ai·大模型·github·ai教程
剑穗挂着新流苏31238 分钟前
109_神经网络的决策层:线性层(Linear Layer)与数据展平详解
人工智能·pytorch·深度学习
机器白学39 分钟前
OpenClaw本地Docker安装部署+自定义配置国内大模型
人工智能
逄逄不是胖胖40 分钟前
《动手学深度学习》-69BERT预训练实现
人工智能·深度学习
LSssT.41 分钟前
【02】线性回归:机器学习的入门第一课
人工智能·机器学习·线性回归
多年小白43 分钟前
今日AI科技简报(2026年3月18日)
人工智能·科技