VGGT-Long:突破千米级长 RGB 序列单目 3D 重建的极限在自动驾驶、机器人导航等关键领域,从单目 RGB 流中感知 3D 环境是核心技术需求。然而,现有 3D 视觉基础模型在处理千米级、无标定的户外长序列时,往往受限于内存瓶颈和累积漂移问题,难以实现精准且稳定的 3D 重建。近期,来自南开大学和南京大学的研究团队提出了 VGGT-Long 框架,通过 “分块 - 对齐 - 闭环” 的极简设计,成功将单目 3D 重建能力拓展至千米级无界户外场景,无需相机标定和深度监督,性能媲美传统标定方法。