记录使用gym和stable_baseline3训练出成功通关的贪吃蛇ai

参考自b站up林亦LYi的开源项目
传送门

本次只训练了cnn版本的

第一次接触这种项目,建python虚拟环境时出了点难以说清楚的小问题,安装不上requirement.txt中的gym库那个版本,折腾了一会,自己都乱了头绪,最后导致训练用的是gymnasium这个库,测试用的是gym库。

如上图中带"_test"的py文件就是我自己魔改时加上去的,用于测试。另一个则是训练。

将之前的一个个测试改成了检测文件夹,批量测试。注意,如果同时训练和测试,可能会爆内存。

test_cnn_result.txt记录测试结果

参数可能要自己改一下。不知为啥,一样的代码,一样的参数,就是跑不出视频里的效果,跑出来一个怂怂的货。改了以后才正常一点。

记录一下

步数不是越大越好,不要无脑将步数小的删掉

看结果时仔细看最高分,差点就把最厉害的删掉了

链接

链接: https://pan.baidu.com/s/1dsmpg43iGeATeKqpfwtcMg?pwd=6666 提取码: 6666)

相关推荐
苍何17 分钟前
腾讯重磅开源!混元图像 3.0 图生图真香!
人工智能
千里马也想飞20 分钟前
人工智能在医疗领域的应用与研究论文写作实操:AI辅助快速完成框架+正文创作
人工智能
Rorsion25 分钟前
PyTorch实现二分类(单特征输出+单层神经网络)
人工智能·pytorch·分类
勾股导航33 分钟前
K-means
人工智能·机器学习·kmeans
liliangcsdn33 分钟前
Diff2Flow中扩散和流匹配的对齐探索
人工智能
SmartBrain38 分钟前
战略洞察:以AI为代表的第四次工业革命
人工智能·语言模型·aigc
一个处女座的程序猿1 小时前
AI之Agent之VibeCoding:《Vibe Coding Kills Open Source》翻译与解读
人工智能·开源·vibecoding·氛围编程
Jay Kay1 小时前
GVPO:Group Variance Policy Optimization
人工智能·算法·机器学习
风指引着方向1 小时前
归约操作优化:ops-math 的 Sum/Mean/Max 实现
人工智能·wpf
机器之心1 小时前
英伟达世界模型再进化,一个模型驱动所有机器人!机器人的GPT时刻真正到来
人工智能·openai