智元机器人已于近期正式启动了今年机器人领域的顶级赛事 ------AGIBOT WORLD CHALLENGE @ICRA 2026。本届大赛聚焦**"推理 - 操作"** 与**"世界模型"**两大核心赛道,采用仿真与真机联动模式,并以全链路开源工具链赋能全球开发者,致力于构建开放行业生态,推动技术从实验室验证走向真实场景落地,加速具身智能产业化进程。
智元 Genie 业务部生态及解决方案总监沈咏剑表示,本届赛事是去年赛事的全面迭代升级,在赛事设计、工具链层面和选手支持方面均做了优化。一方面旨在降低开发者参赛门槛、提升参与体验,另一方面也是希望能够助力参与者在赛事实践中深化对具身智能产业的理解与认知。

具体赛程安排

一、赛事设计升级
1. 赛道一:Reasoning to Action - 从 仿真到真机,聚焦推理与 真实 落地
本赛道聚焦推理决策与真机落地,通过线上仿真+ 线下真机双赛段,全面评估模型推理能力与物理执行泛化性。参赛者基于 AGIBOT WORLD 开源数据集训练模型,核心目标是弥合 Sim2Real Gap,实现从开放自然语言指令到真实物理交互的稳健迁移。
赛题依托Genie Sim 3.0 仿真平台,结合真实落地需求,覆盖物流、工业、商超、餐饮、家居等典型场景,并设置多难度梯度任务。

物流分拣
该赛道主要考察两大核心能力:
-
算法推理与任务解决能力 :基于官方基线或自研模型,完成复杂任务拆解、时序决策与环境理解,实现从指令到动作的推理执行;
-
Sim-to-Real 迁移能力 :依托Genie Sim 3.0 完成仿真训练,再迁移至与仿真高度对齐的真机场景,弥合虚拟与现实的技术鸿沟。
赛道全程验证模型在仿真优化、真机部署、真实场景鲁棒性 的综合表现,贴合具身智能落地的核心诉求。
智元沈咏剑进一步介绍道,本届赛道由去年的单一"操作"(Manipulation)全面升级为**"推理 - 操作"** (Reasoning to Action) ,核心源于行业真实痛点:具身智能不仅需要机械执行,更需具备场景理解、任务拆解、逻辑推理能力,以应对复杂长时程任务。
因此,相较去年以短程指令式操作为主的赛制,本届新增桌面整理等综合任务,强化时序规划与环境理解,推动模型从被动执行向主动推理演进。
2. 赛道二:世界模型 ------ 聚焦物理环境动态精准建模,探索具身世界模型前沿
World Model 赛道聚焦具身世界模型核心能力------ 基于机器人动作对物理环境动态进行精准建模。参赛者需依托 AGIBOT WORLD 数据集训练视频生成模型,根据机器人真实观测数据与动作信号,生成其在10 组真实作业场景下的交互视频,覆盖家居、商超、工业等多元场景,全面考核模型生成质量。
本赛道仅设置线上竞赛阶段,依托EWM Bench 完整评测体系,核心考察三大能力:
-
世界模对物理世界多视角一致性 的建模能力;
-
对真实物理属性的拟合与还原能力;
-
模型在具身场景下的预测、规划与泛化能力。
本赛道立足技术前沿探索,通过竞赛构建世界模型评测的直观认知范式,助力世界模型理论研究与应用落地突破。
二、 提供全栈工具链
智元机器人为参赛开发者提供全栈式开发工具套件,覆盖硬件、仿真平台、开源数据集与官方基线模型,全面降低参赛门槛、加速模型迭代与真机落地:
-
硬件: 精灵G2 机器人
-
仿真平台: Genie Sim 3.0 仿真平台
-
数据: AGIBOT WORLD 开源数据集
-
基线模型: ACoT-VLA、EVAC 官方模型
1)推理-操作赛道(Reasoning to Action)
在基线模型方面,智元将提供ACoT-VLA作为基线模型,助参赛者快速掌握训练、测试及提交流程;同时支持多基线对比选型,参赛者可基于最优基线开展二次开发。
在测评与环境环境方面,采用智元最新开源、由大语言模型驱动的Genie Sim 3.0仿真平台作为核心测评工具,融合三维重建与视觉生成技术,构建数字孪生级高保真仿真环境。平台内场景、资产、任务与云端评测服务器完全对齐,搭载智元自研Genie Reasoner 具身大脑,可实现基于 VLM 的全自动评测,支持参赛者在本地完成闭环验证与环境依赖校验,再提交至赛事服务器。
另外,同步开放Genie Sim 3.0相关配套数据集,支持本地训练与迭代。该工具链为具身智能原生设计,全面替代传统上一代工具,实现仿真物理属性与真机高度对齐,为高效Sim-to-Real 迁移提供底层支撑。
**2)**世界模型赛道 (World Model)
在数据方面,基于 AGIBOT WORLD 公开数据集,构建包含10 类任务的专属训练集,覆盖超 3 万条真实交互轨迹,包含抓取、放置、推、拉等多元机器人 --- 环境交互类型。测试集同时纳入专家轨迹与非完美动作轨迹(空抓、碰撞等),全面检验模型泛化能力。
在基线模型方面,采用智元自研并开源的EVAC 具身世界模型作为官方基线,该模型由机器人动作驱动、基于全量 AGIBOT WORLD 数据预训练。参赛者可在 EVAC 基础上开发,也可使用其他模型参赛。
在评测工具方面,基于EWM Bench 具身世界模型评测基准开展多维度全自动评估,从图像质量、场景一致性、轨迹遵循度等核心指标,对模型生成结果进行全方位量化考核。
三、 参赛选手的全方位激励
本届大赛参赛团队呈现全球化、多元化格局,涵盖全球顶尖高校科研团队/学生创新团队、具身智能初创企业及科技企业的科研与工程化落地团队等,实现学术研究与产业应用同场竞技、深度交流,共促具身智能技术创新与落地迭代。
大赛除常规现金奖励(总奖池高达53万美元,冠军单项奖金1万美元!比赛将为表现突出的队伍提供价值总额为50万美元的智元机器人采购代金券)外,还为优秀团队提供其它多元化的生态支持:
-
对具备优质创业想法的团队,开放智元"A 计划"早期投资通道;
-
为高校学生提供智元实习与校招绿色通道;
结语
智元本届具身智能大赛,以双赛道升级锚定技术前沿,以全开源工具链降低参与门槛,深耕生态培育,助力具身智能从技术探索加速迈向规模化产业落地。
-
锚定真实场景,牵引技术攻坚。 以实战化赛题与产业级数据为牵引,推动研发跳出桌面级轻量化操作,聚焦真实物理场景与产业核心需求,顺应具身智能从实验室走向落地的主流趋势,以赛事驱动主干场景技术突破,为细分场景规模化应用筑牢根基。
-
普及全栈开发体系,培育长期产业人才。 依托赛事普及具身智能全流程开发逻辑与工程实践,帮助参与者建立系统化认知与实战能力,为学业深造与职业发展提供支撑,持续涵养行业人才生态与技术土壤。