让AI自动“造房间”：SpatialGen是什么？

内容基于群核科技开源项目SpatialGen。

如果你想装修房子，只需要丢给AI一张喜欢的客厅照片、一份"立体户型图"，它就能自动生成一个可以360°漫游的完整3D房间------这就是群核科技推出的SpatialGen。

作为聚焦"室内3D场景生成"的AI模型，SpatialGen解决了传统AI"画房间时视角混乱"的痛点：比如从门口看沙发在左边，从窗户看沙发却跑到右边。它能让生成的每个角度都符合真实空间逻辑，既还原参考图的风格，又匹配户型的实际布局。

目前SpatialGen已开源，不仅能帮设计师快速出3D方案，还能用于游戏场景搭建、老建筑数字复原等场景，相当于把"装修+建模"的复杂流程压缩成了"输入指令→等结果"的简单操作。

SpatialGen的工作流程，就像请了位"AI装修师"：

给需求：你提供两个"交底材料"------① 参考图（比如喜欢的客厅实拍图）；② 3D布局（不是平面户型图，是"立体房间规则"：比如"沙发占1.8米×0.8米，离墙0.5米"）。
画细节图：AI先画几个基础视角的图，不仅画"沙发长什么样"，还给每张图加"定位标签"（比如"这里是沙发，坐标在x=2/y=3"），保证不同视角的家具位置不矛盾。
补全更多角度：AI自动多画几十个视角（比如从阳台、餐桌旁看），确保每个角度的风格、位置都和之前一致。
拼成3D房间：AI把所有角度的图"搭积木"式拼成可漫游的3D场景------你能随便切换视角，家具位置、大小都和最初的"立体规则"对应。

SpatialGen的流程可拆解为三个模块：

布局引导的多视角多模态扩散：以带位姿的参考图和3D语义布局为条件，通过"跨视角-跨模态交替注意力机制"，生成每个视角对应的RGB图、场景坐标图、语义分割图，实现多模态信息的空间对齐。
迭代式密集视角生成：以初始视角为基准，通过跨视角引导策略，在更多采样视点生成图像，补充3D重建所需的视角覆盖度。
3D重建：将多视角多模态数据输入3D重建模块（如3D高斯重建），生成带语义信息的完整3D场景，完成从"多视角2D内容"到"3D结构"的转化。

SpatialGen的核心突破，是把"文本/图像风格"和"3D空间规则"结合，用"扩散模型+注意力机制"解决了"多视角空间一致性"的行业痛点------既保证生成内容的视觉真实感，又符合物理空间的逻辑约束。

它的开源降低了3D场景生成的门槛：设计师不用手动建模，只需输入布局和参考图就能出3D方案；开发者可以基于其代码拓展到游戏、AR/VR等场景。本质上，SpatialGen是"空间理解"与"内容生成"的结合体，让AI从"画平面"升级为"造立体空间"，是室内数字化、元宇宙场景搭建的实用工具。