直播预告!面向几何与运动理解的流式前馈 3D/4D 重建

三维/四维重建技术正经历一场范式革命:从高昂的全局优化向高效的前馈式(Feed-forward)架构全面转型。

  • 如何在长序列处理中实现极致的内存效率?
  • 如何在统一框架下同时实现几何与运动的高精度建模?

5月19日晚8点青稞Talk 126期,南洋理工大学(NTU)MMLab 博士生罗奕航,将直播分享《STream3R & 4RC: 面向几何与运动理解的流式前馈 3D/4D 重建》。

STream3R:基于 Causal Transformer 的流式 3D 重建

论文:STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer

链接:https://arxiv.org/abs/2508.10893

代码:https://nirvanalan.github.io/projects/stream3r

传统的重建方法在长序列下往往受限于简单的内存机制,难以扩展。STream3R 将 3D 重建重构为一个 Decoder-only Transformer 的序列配准问题。

  • 因果注意力流: 借鉴大语言模型(LLM)的成功经验,引入因果注意力机制,像处理语言流一样高效处理图像序列。
  • 极致泛化能力: 通过大规模 3D 数据集预训练,不仅能胜任静态场景,在动态场景及在线 3D 感知中也展现出极强韧性。

4RC:随时随地的条件查询 4D 重建

论文:4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere

链接:https://arxiv.org/pdf/2602.10094

代码:https://yihangluo.com/projects/4RC/

现有的 4D 方法往往将运动与几何解耦,或仅能产生稀疏轨迹。4RC 提出了一个"一次编码,随时随地查询(Encode-once, Query-anywhere and anytime)"的统一前馈框架。

  • 全时空潜空间: 将整个视频编码为紧凑的空间-时间潜变量,支持在任意目标时间戳高效查询 3D 几何与运动。
  • 极简分解: 通过将 4D 属性分解为基础几何与随时间变化的相对运动,大幅提升了学习效率与重建质量。

分享嘉宾

罗奕航,南洋理工大学(NTU)MMLab 博士生,师从Prof. Chen Change Loy和 Prof. Xingang Pan。他的研究方向主要聚焦于 3D/4D 空间智能。

主题提纲

STream3R & 4RC: 面向几何与运动理解的流式前馈 3D/4D 重建

1、回顾近年来前馈式 3D 重建技术的发展脉络

2、STream3R:基于因果注意力序列配准的流式前馈三维重建

3、4RC:通过条件查询统一框架实现 4D 重建与运动建模

4、未来方向探讨 & AMA (Ask Me Anything)环节

直播时间

5月19日(周二)20:00 - 21:00

如何观看

Talk 将在青稞社区【视频号:青稞 AI】上进行进行直播,欢迎预约观看!

相关推荐
HIT_Weston1 小时前
85、【Agent】【OpenCode】bash 工具提示词(HEREDOC)
人工智能·agent·opencode
AI技术控1 小时前
Transformer 的 Encoder 和 Decoder 模块介绍:从结构原理到大模型应用实践
人工智能·python·深度学习·自然语言处理·transformer
Codebee1 小时前
日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命
人工智能
KaMeidebaby1 小时前
卡梅德生物技术快报|单克隆抗体人源化 PEG 修饰质控方法体系构建与验证
服务器·前端·数据库·人工智能·算法·百度·新浪微博
LaughingZhu1 小时前
Product Hunt 每日热榜 | 2026-05-16
人工智能·经验分享·深度学习·神经网络·产品运营
wuxinyan1231 小时前
工业级大模型学习之路015:RAG零基础入门教程(第十一篇):系统重构与代码规范化
人工智能·python·学习·重构·rag
灵机一物1 小时前
灵机一物AI原生电商小程序、PC端(已上线)-【技术深度解析】Bun 6 天 AI 重写 96 万行代码:从 Zig 迁移 Rust 全流程与行业影响
开发语言·人工智能·rust
wuxinyan1231 小时前
工业级大模型学习之路014:RAG零基础入门教程(第十篇):系统性能与资源优化
人工智能·学习·rag