人工智能应用- 人机对战:03.玩转 ATARI 游戏

2015 年,DeepMind 公司在《自然》杂志上发表了一篇论文,报告了他们的 AI 系统在 29 款雅达利(Atari)游戏中超越了人类玩家的表现。这一成果的核心在于将强化学习与深度神经网络相结合,形成了深度强化学习(Deep Reinforcement Learning)的新范式。

Atari 游戏是 20 世纪 70-80 年代电子游戏产业的代表。它是一系列游戏的集合,这些游戏画面简洁、规则简单、目标单一,难度会随着时间逐渐增加,以鼓励玩家追求更高的分数。Atari 游戏种类繁多,如球类、射击类、迷宫类、竞速类和平台跳跃类等,是早期街机游戏的典型代表。

Atari 游戏

DeepMind 的Atari AI 系统使用深度神经网络作为决策模型,并结合强化学习进行训练。神经网络通过处理游戏画面,直接输出控制操纵杆的指令。在训练过程中,游戏中的得分被用作奖励信号,强化学习算法根据这些奖励不断调整神经网络的参数,以最大化最终得分。这类似于把游戏机交给一个小孩,让他通过不断尝试来掌握游戏技巧,最终成为游戏高手。DeepMind 所用的深度神经网络包括两个卷积层和两个全连接层,输出层对应 17 个游戏杆操纵动作。

DeepMind 打 Atari 游戏的神经网络。图片来源:Mnih et al.

相关推荐
To_OC5 小时前
搞懂 Token 和 Embedding 后,我终于明白大模型是怎么 "读" 文字的
人工智能·llm·agent
冬奇Lab8 小时前
每日一个开源项目(第139篇):Voicebox - 本地运行的开源 ElevenLabs 替代品
人工智能·开源·资讯
冬奇Lab8 小时前
Skill 系列(03):Skill 设计范式——5 个模式让输出从混沌到可预测
人工智能·开源·agent
IT_陈寒10 小时前
Python搞不定字符串编码?这破玩意坑我两小时!
前端·人工智能·后端
大模型真好玩11 小时前
什么是Loop Engineering?最通俗易懂的Loop Engineering核心概念
人工智能·agent·deepseek
叁两12 小时前
前端转型AI Agent该如何学习?(前置篇)
前端·人工智能·node.js
LaiYoung_12 小时前
🎁 送你一套超好用超实用的 FE AI-Coding Skills
前端·人工智能·开源
ZzT14 小时前
怎么做才不会被 AI 替代?
人工智能·程序员
道友可好14 小时前
从今天开始:你的第一个 Harness Engineering 实践
前端·人工智能·后端