embodiedai - embodiedai技术,学习,经验文章

datamonday

7 个月前

[EAI-035] 机器人的“ChatGPT 时刻”还有多远？从VLA模型 π0.5 看开放世界泛化的突破π0.5 是基于 π0 开发的视觉-语言-动作（VLA）模型，旨在解决机器人学习中的核心难题：开放世界泛化（Open-World Generalization）。通过在异构数据源（包括不同形态的机器人、高层语义预测、Web 数据和口头指令）上进行共训练（Co-training），π0.5 能够控制移动操作机器人在从未见过的家庭环境中执行长程、多阶段的家务任务（如收拾厨房、叠被子），任务时长可达 10-15 分钟。