StochSync:可在任意空间中生成360°全景图和3D网格纹理

StochSync方法可以用于在任意空间中生成图像,尤其是360°全景图和3D网格纹理。该方法利用了预训练的图像扩散模型,以实现零-shot生成,消除了对新数据收集和单独训练生成模型的需求。StochSync 结合了 Diffusion Synchronization(DS)和 Score Distillation Sampling(SDS)的优点,能够在条件较弱的情况下仍然生成高质量的图像。

使用 StochSync 生成的各类网格纹理和全景图,包括背景中的一张(环境映射图),它是一张 360°全景图。StochSync 扩展了在方形空间中训练的图像扩散模型的能力,能够在诸如圆柱体、球体、环面和网格表面等任意空间中生成图像。

相关链接

论文介绍

我们提出了一种名为 StochSync 的方法,用于生成任意空间中的图像------例如 360°全景图或 3D 表面上的纹理------该方法利用了一个预训练的图像扩散模型。主要的挑战在于弥合扩散模型理解的二维图像与图像生成的目标空间之间的差距。与那些在缺乏强条件或缺乏精细细节的情况下难以取得成效的方法不同,StochSync 结合了扩散同步和得分蒸馏采样的优势,即使在条件较弱的情况下也能有效运行。实验表明 StochSync 比之前的基于微调的方法表现更出色,尤其是在 360°全景图生成方面。

方法

StochSync方法的核心在于结合了Diffusion Synchronization和Score Distillation Sampling的优势,具体包括以下几个方面:

  • 最大随机性:在同步过程中引入最大随机性,优化了样本在不同实例空间之间的连贯性。这一策略通过调整噪声预测的方式,帮助消除样本间的接缝,提高了图像的整体流畅性。

  • 多步去噪计算:将传统的单步去噪预测替换为多步去噪过程,以提高生成样本的真实感和一致性。这种方法允许在每个时间步骤上进行更精确的样本预测,进而提升生成图像的细节。

  • 非重叠视图采样:在每个步骤中采用非重叠的视图采样策略,确保样本在时间上的同步,同时避免了由于视图重叠导致的真实感下降。这种方法通过交替采样不同的视图,提高了生成图像的质量。

360°全景生成

使用 PanFusion 生成全景图的定性结果提示。在左侧列中呈现了与先前工作的比较结果,而在右侧列中展示了与 StochSync 一起的消融测试案例。

L-MAGIC (Cai et al., 2024)和StochSync在水平特异性提示上的定性比较。

三维网格纹理的附加定性结果。

相关推荐
Buxxxxxx3 分钟前
DAY 39 GPU训练及类的call方法
人工智能
我有医保我先冲4 分钟前
企业级会议管理工具选型指南:从需求分析到方案落地
人工智能·经验分享·自然语言处理·需求分析
良策金宝AI10 分钟前
从CAD插件到原生平台:工程AI的演进路径与智能协同新范式
大数据·人工智能
陈天伟教授16 分钟前
人工智能应用-机器视觉:车牌识别(2)
人工智能·神经网络·机器学习
江上鹤.14818 分钟前
Day37 MLP神经网络的训练
人工智能·深度学习·神经网络
mahuifa25 分钟前
(46)VTK C++开发示例 --- 加载CML文件
c++·3d·vtk·cml
java1234_小锋32 分钟前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 残差连接(Residual Connection)详解以及算法实现
深度学习·语言模型·transformer
min18112345638 分钟前
分公司组织架构图在线设计 总部分支管理模板
大数据·人工智能·信息可视化·架构·流程图
中冕—霍格沃兹软件开发测试1 小时前
边界值分析:功能测试中的精度利器
人工智能·功能测试·科技·测试工具·appium·bug
檐下翻书1731 小时前
量子计算 + AI:蛋白质折叠预测速度提升万倍,开启靶向药新纪元
人工智能