【视频世界模型】InSpatio-WorldFM: An Open-Source Real-Time Generative Frame Model原文链接:https://inspatio.github.io/worldfm/本文提出 InSpatio-WorldFM,一款面向空间智能的开源实时帧模型。现有基于视频的世界模型依赖序列帧生成,窗口级处理会带来较大延迟;与之不同,InSpatio-WorldFM 采用基于帧的范式,每一帧均可独立生成,能够实现低延迟的实时空间推理。该模型通过显式三维锚点与隐式空间记忆约束多视角空间一致性,在视角发生变化时,既能保证全局场景几何结构稳定,又能保留精细视觉细节。本文进一步设计了一套渐进式三阶段训练流程:先将预