人工智能应用- 人机对战:03.玩转 ATARI 游戏

2015 年,DeepMind 公司在《自然》杂志上发表了一篇论文,报告了他们的 AI 系统在 29 款雅达利(Atari)游戏中超越了人类玩家的表现。这一成果的核心在于将强化学习与深度神经网络相结合,形成了深度强化学习(Deep Reinforcement Learning)的新范式。

Atari 游戏是 20 世纪 70-80 年代电子游戏产业的代表。它是一系列游戏的集合,这些游戏画面简洁、规则简单、目标单一,难度会随着时间逐渐增加,以鼓励玩家追求更高的分数。Atari 游戏种类繁多,如球类、射击类、迷宫类、竞速类和平台跳跃类等,是早期街机游戏的典型代表。

Atari 游戏

DeepMind 的Atari AI 系统使用深度神经网络作为决策模型,并结合强化学习进行训练。神经网络通过处理游戏画面,直接输出控制操纵杆的指令。在训练过程中,游戏中的得分被用作奖励信号,强化学习算法根据这些奖励不断调整神经网络的参数,以最大化最终得分。这类似于把游戏机交给一个小孩,让他通过不断尝试来掌握游戏技巧,最终成为游戏高手。DeepMind 所用的深度神经网络包括两个卷积层和两个全连接层,输出层对应 17 个游戏杆操纵动作。

DeepMind 打 Atari 游戏的神经网络。图片来源:Mnih et al.

相关推荐
miaowmiaow13 小时前
PSD2Code 近期更新与深度解析:从设计稿到生产级代码的完整技术栈
前端·人工智能·ai编程
云烟成雨TD13 小时前
Spring AI 1.x 系列【33】RAG Advisor 组件与四大分层架构
java·人工智能·spring
lifallen13 小时前
第一章 Agent 为什么会出现
人工智能·ai·ai编程
机器之心13 小时前
小学生画了撇胡子骗过AI年龄验证,硅谷工程师沉默了
人工智能·openai
海兰13 小时前
【文字三国志:第六篇】天命重构,UI组件设计细节
人工智能·ui·语言模型·小程序
计算机安禾14 小时前
【算法分析与设计】第26篇:参数化算法与固定参数可解性理论
大数据·人工智能·算法·机器学习·剪枝
机器之心14 小时前
英伟达重新定义PC!史上最高效CPU来了
人工智能·openai
野生技术架构师14 小时前
Spec Coding 规范驱动编程实战:从 Vibe Coding 到 AI 代码规范
人工智能·代码规范
J2虾虾14 小时前
Spring AI Alibaba - Tools
服务器·人工智能·spring
雪隐14 小时前
AI股票小助手02-Akshare数据采集
人工智能·后端