直播预告!面向几何与运动理解的流式前馈 3D/4D 重建

三维/四维重建技术正经历一场范式革命:从高昂的全局优化向高效的前馈式(Feed-forward)架构全面转型。

  • 如何在长序列处理中实现极致的内存效率?
  • 如何在统一框架下同时实现几何与运动的高精度建模?

5月19日晚8点青稞Talk 126期,南洋理工大学(NTU)MMLab 博士生罗奕航,将直播分享《STream3R & 4RC: 面向几何与运动理解的流式前馈 3D/4D 重建》。

STream3R:基于 Causal Transformer 的流式 3D 重建

论文:STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer

链接:https://arxiv.org/abs/2508.10893

代码:https://nirvanalan.github.io/projects/stream3r

传统的重建方法在长序列下往往受限于简单的内存机制,难以扩展。STream3R 将 3D 重建重构为一个 Decoder-only Transformer 的序列配准问题。

  • 因果注意力流: 借鉴大语言模型(LLM)的成功经验,引入因果注意力机制,像处理语言流一样高效处理图像序列。
  • 极致泛化能力: 通过大规模 3D 数据集预训练,不仅能胜任静态场景,在动态场景及在线 3D 感知中也展现出极强韧性。

4RC:随时随地的条件查询 4D 重建

论文:4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere

链接:https://arxiv.org/pdf/2602.10094

代码:https://yihangluo.com/projects/4RC/

现有的 4D 方法往往将运动与几何解耦,或仅能产生稀疏轨迹。4RC 提出了一个"一次编码,随时随地查询(Encode-once, Query-anywhere and anytime)"的统一前馈框架。

  • 全时空潜空间: 将整个视频编码为紧凑的空间-时间潜变量,支持在任意目标时间戳高效查询 3D 几何与运动。
  • 极简分解: 通过将 4D 属性分解为基础几何与随时间变化的相对运动,大幅提升了学习效率与重建质量。

分享嘉宾

罗奕航,南洋理工大学(NTU)MMLab 博士生,师从Prof. Chen Change Loy和 Prof. Xingang Pan。他的研究方向主要聚焦于 3D/4D 空间智能。

主题提纲

STream3R & 4RC: 面向几何与运动理解的流式前馈 3D/4D 重建

1、回顾近年来前馈式 3D 重建技术的发展脉络

2、STream3R:基于因果注意力序列配准的流式前馈三维重建

3、4RC:通过条件查询统一框架实现 4D 重建与运动建模

4、未来方向探讨 & AMA (Ask Me Anything)环节

直播时间

5月19日(周二)20:00 - 21:00

如何观看

Talk 将在青稞社区【视频号:青稞 AI】上进行进行直播,欢迎预约观看!

相关推荐
冬奇Lab3 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab3 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩5 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒5 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海5 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠6 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao6 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
程序员cxuan7 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
机器之心7 小时前
AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能·openai