深度学习玩游戏, 模型玩游戏,大模型+游戏 llm+game, 机器学习玩游戏,人工智能游戏陪伴,模型陪玩游戏

  1. 论文地址

Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models

  1. 中文:

Think in Games:做一个在王者荣耀中会玩和思考的Agent

  1. 我记得几年前,相关文章还是使用dqn算法。玩雅利达小游戏,冒险岛,flybird, 单机枪战。目前llm做到了下一步决策 文字版,感觉还差实时操作英雄,实时决策 + 实时指令

3.1玩游戏拆解步骤即:

a. 实时理解游戏当前环境,英雄角色,英雄状态

b. 根据当前状态感知,生成英雄指令

c. 指令下发操作英雄

d. 再循环a

3.2 问题:每个步骤的模型处理慢,步骤间的流转会产生时延

后续技术更新是否出现一个聚合llm呢? 一个模型内处理abc降低流转延迟

再有gpu升级迭代 解决每个步骤模型的处理慢问题

  1. 心影随行的ai游戏陪伴:

心影随形x百度智能云:发布当日三次扩容,助力逗逗AI达成900万用户成就 - 百度智能云千帆社区

相关推荐
Shawn_Shawn21 小时前
人工智能入门概念介绍
人工智能
极限实验室21 小时前
程序员爆哭!我们让 COCO AI 接管 GitLab 审查后,团队直接起飞:连 CTO 都说“这玩意儿比人靠谱多了
人工智能·gitlab
Maynor9961 天前
Z-Image: 100% Free AI Image Generator
人工智能
爬点儿啥1 天前
[Ai Agent] 10 MCP基础:快速编写你自己的MCP服务器(Server)
人工智能·ai·langchain·agent·transport·mcp
张人玉1 天前
百度 AI 图像识别 WinForms 应用代码分析笔记
人工智能·笔记·百度
测试人社区-小明1 天前
智能弹性伸缩算法在测试环境中的实践与验证
人工智能·测试工具·算法·机器学习·金融·机器人·量子计算
Spring AI学习1 天前
Spring AI深度解析(9/50):可观测性与监控体系实战
java·人工智能·spring
罗西的思考1 天前
【Agent】MemOS 源码笔记---(5)---记忆分类
人工智能·深度学习·算法
dajun1811234561 天前
反 AI 生成技术兴起:如何识别与过滤海量的 AI 伪造内容?
人工智能
人邮异步社区1 天前
PRML为何是机器学习的经典书籍中的经典?
人工智能·机器学习