深度学习玩游戏, 模型玩游戏,大模型+游戏 llm+game, 机器学习玩游戏,人工智能游戏陪伴,模型陪玩游戏

  1. 论文地址

Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models

  1. 中文:

Think in Games:做一个在王者荣耀中会玩和思考的Agent

  1. 我记得几年前,相关文章还是使用dqn算法。玩雅利达小游戏,冒险岛,flybird, 单机枪战。目前llm做到了下一步决策 文字版,感觉还差实时操作英雄,实时决策 + 实时指令

3.1玩游戏拆解步骤即:

a. 实时理解游戏当前环境,英雄角色,英雄状态

b. 根据当前状态感知,生成英雄指令

c. 指令下发操作英雄

d. 再循环a

3.2 问题:每个步骤的模型处理慢,步骤间的流转会产生时延

后续技术更新是否出现一个聚合llm呢? 一个模型内处理abc降低流转延迟

再有gpu升级迭代 解决每个步骤模型的处理慢问题

  1. 心影随行的ai游戏陪伴:

心影随形x百度智能云:发布当日三次扩容,助力逗逗AI达成900万用户成就 - 百度智能云千帆社区

相关推荐
wwlsm_zql1 天前
MITRE ATLAS对抗威胁矩阵:守护LLM安全的中国实践指南
人工智能·线性代数·安全·矩阵·大模型
deephub1 天前
从另一个视角看Transformer:注意力机制就是可微分的k-NN算法
人工智能·深度学习·transformer·注意力机制·knn
心动啊1211 天前
tensorflow卷积层1——卷积和池化
人工智能·python·tensorflow
程序边界1 天前
深度学习学习路线图:从MNIST到MobileNetV4,从理论到实践的完整指南
人工智能·深度学习·学习
云卓SKYDROID1 天前
无人机光纤接口模块技术解析
人工智能·无人机·高科技·云卓科技·拉距
月疯1 天前
PyTorch DataLoader 接受的返回值类型
人工智能·深度学习
无风听海1 天前
神经网络之几个简单的激活函数足够表达世界的复杂性吗
人工智能·深度学习·神经网络
铮铭1 天前
【论文阅读】GR-2:用于机器人操作的生成式视频-语言-动作模型
人工智能
Sugar_pp1 天前
【论文阅读】Railway rutting defects detection based on improved RT‑DETR
论文阅读·深度学习·目标检测·transformer
DisonTangor1 天前
百度开源 Qianfan-VL: 领域增强的通用视觉语言模型
人工智能·百度·语言模型