英伟达开源会打游戏的Agent模型,模仿学习人类游戏视频进行训练

模型概述

描述:

NitroGen是一个统一的视觉到动作模型,设计用于直接从原始画面玩电子游戏。它以游戏视频画面作为输入,输出游戏手柄动作。与通过奖励或任务目标训练的模型不同,NitroGen纯粹通过大规模模仿学习人类游戏视频进行训练。该模型最适合为手柄控制设计的游戏(如动作、平台和竞速类游戏),而对重度依赖键鼠操作的游戏(如RTS、MOBA)效果较差。

NitroGen项目的目标是探索:对人类多样化游戏行为的大规模训练是否能产生新兴的通用具身智能能力,类似于规模扩展在大型语言模型中激发出的涌现行为。

潜在应用包括新一代游戏AI、电子游戏自动化测试,以及推动通用具身AI研究。

NitroGen 1由NVIDIA开发,是该系列首个模型。本模型仅用于研发用途。

许可/使用条款:

管辖条款:NVIDIA许可协议

附加信息:Apache许可证适用于https://huggingface.co/google/siglip2-base-patch16-224

部署地域:

全球范围

使用场景:

研究人员、工程师、开源社区、企业、游戏玩家。潜在应用包括新一代游戏AI、电子游戏自动化测试,以及推动具身AI研究。

发布日期:

GitHub 2025/12/19通过<>

GitHub 2025/12/19通过https://huggingface.co/nvidia/NitroGen

参考文献:

VPT:基于网络视频训练的《我的世界》智能体
SIMA:可遵循文本指令的多游戏通用智能体
GR00T N1:通用人形机器人开源基础模型

模型架构:

架构类型: 视觉变换器、扩散变换器

网络架构:

  • RGB帧通过预训练视觉变换器(SigLip2)处理
  • 扩散匹配变换器(DiT)基于SigLip输出生成动作

本模型基于 SigLip2开发

模型参数量: 4.93×10⁸

输入:

输入类型: 图像

输入格式: 红绿蓝(RGB)

输入参数: 二维(2D)

其他输入属性: 256×256分辨率图像

输出

输出类型: 游戏手柄/控制器动作

输出格式: 表格形式

输出参数: 二维:一个动作维度加一个时间维度

其他输出属性: 输出形状为21×16,包含每个摇杆的2个二维连续值向量,以及17个按钮的二进制值

我们的AI模型专为NVIDIA GPU加速系统设计和/或优化。通过利用NVIDIA硬件(如GPU核心)和软件框架(如CUDA库),相比纯CPU方案可实现更快的训练和推理速度。

软件集成:

运行时引擎:

未使用运行时引擎

支持的硬件微架构兼容性:

  • NVIDIA Blackwell架构
  • NVIDIA Hopper架构

推荐/支持的操作系统:

将基础模型和微调模型集成到AI系统时,需使用特定场景数据进行额外测试,确保安全有效部署。遵循V模型方法论,在部署前进行单元级和系统级的迭代测试验证,对降低风险、满足技术功能要求、确保符合安全伦理标准至关重要。

  • Linux系统
  • Windows系统

模型版本:

V1

训练、测试与评估数据集:

训练数据集:

数据类型

  • 图像
  • 视频

图像训练数据量

  • 超过10亿张图像

视频训练数据量

  • 1万至100万小时

各数据集采集方式

  • 自动化采集

各数据集标注方式

  • 合成标注

属性: 4万段公开视频,逐帧动作标注

测试数据集:

各数据集采集方式

  • 自动化采集

各数据集标注方式

  • 合成标注

属性: 4万段公开视频,逐帧动作标注

评估数据集:

各数据集采集方式

  • 自动化采集

各数据集标注方式

  • 合成标注

属性: 4万段公开视频,逐帧动作标注

官方:https://nitrogen.minedojo.org/

代码:https://github.com/MineDojo/NitroGen

相关推荐
ASKED_20195 小时前
Langchain学习笔记一 -基础模块以及架构概览
笔记·学习·langchain
(❁´◡`❁)Jimmy(❁´◡`❁)5 小时前
Exgcd 学习笔记
笔记·学习·算法
云小逸7 小时前
【nmap源码学习】 Nmap网络扫描工具深度解析:从基础参数到核心扫描逻辑
网络·数据库·学习
yunteng5217 小时前
游戏全球服_基础信息
游戏·全球同服
盐焗西兰花9 小时前
鸿蒙学习实战之路-Reader Kit构建阅读器最佳实践
学习·华为·harmonyos
深蓝海拓9 小时前
PySide6从0开始学习的笔记(二十七) 日志管理
笔记·python·学习·pyqt
慎独41310 小时前
科学赋能,让孩子专注高效爱上学习
学习
LGL6030A10 小时前
Java学习历程26——线程安全
java·开发语言·学习
学历真的很重要11 小时前
【系统架构师】第二章 操作系统知识 - 第二部分:进程管理(详解版)
学习·职场和发展·系统架构·系统架构师
Nebula_g11 小时前
线程进阶: 无人机自动防空平台开发教程(更新)
java·开发语言·数据结构·学习·算法·无人机