记录使用gym和stable_baseline3训练出成功通关的贪吃蛇ai

参考自b站up林亦LYi的开源项目
传送门

本次只训练了cnn版本的

第一次接触这种项目,建python虚拟环境时出了点难以说清楚的小问题,安装不上requirement.txt中的gym库那个版本,折腾了一会,自己都乱了头绪,最后导致训练用的是gymnasium这个库,测试用的是gym库。

如上图中带"_test"的py文件就是我自己魔改时加上去的,用于测试。另一个则是训练。

将之前的一个个测试改成了检测文件夹,批量测试。注意,如果同时训练和测试,可能会爆内存。

test_cnn_result.txt记录测试结果

参数可能要自己改一下。不知为啥,一样的代码,一样的参数,就是跑不出视频里的效果,跑出来一个怂怂的货。改了以后才正常一点。

记录一下

步数不是越大越好,不要无脑将步数小的删掉

看结果时仔细看最高分,差点就把最厉害的删掉了

链接

链接: https://pan.baidu.com/s/1dsmpg43iGeATeKqpfwtcMg?pwd=6666 提取码: 6666)

相关推荐
无忧智库3 分钟前
跨行业数据要素可信流通体系建设:打破信任壁垒的完整工程方法论(WORD)
大数据·人工智能
mit6.8243 分钟前
NitroGen: AI 自动玩游戏
人工智能
小王毕业啦5 分钟前
2007-2024年 省级-农林牧渔总产值、农业总产值数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
数据皮皮侠8 分钟前
上市公司创新韧性数据(2000-2024)|顶刊同款 EIR 指数
大数据·人工智能·算法·智慧城市·制造
科研前沿19 分钟前
纯视觉无感解算 + 动态数字孪生:室内外无感定位技术全新升级
大数据·人工智能·算法·重构·空间计算
暗夜猎手-大魔王20 分钟前
转载--AI Agent 架构设计:错误处理与容错设计(OpenClaw、Claude Code、Hermes Agent 对比)
人工智能
码农的神经元25 分钟前
Claude Code 如何接入 DeepSeek V4 模型:从安装配置到实战验证
人工智能
波动几何34 分钟前
通用行业业务技能体系技能universal-business-skill-system
人工智能
Robot_Nav36 分钟前
AI 编程助手 Skill 完全指南:VS Code · Trae CN · Claude Code
人工智能·vscode·skill·trae·claude code
直奔標竿37 分钟前
Java开发者AI转型第二十五课!Spring AI 个人知识库实战(四)——RAG来源追溯落地,拒绝AI幻觉
java·开发语言·人工智能·spring boot·后端·spring