3D 生成重建008-zero123让扩散模型了解空间信息zero-shot 单图生3d

3D 生成重建008-zero123让扩散模型了解空间信息zero-shot 单图生3d


文章目录

    • 0
    • [0 论文工作](#0 论文工作)
    • [1 论文方法](#1 论文方法)
      • [1.1 条件生成微调](#1.1 条件生成微调)
      • [1.2 维护3d表示](#1.2 维护3d表示)
    • [2 效果](#2 效果)

0

0 论文工作

之前分享的工作主要尝试是从一个pre-trained 文生图的diffusion模型中去蒸馏知识,从而去维护一个3d的表示形式。这种方法固然能够进行一个文生3d的任务,但是一个比较重要的问题就是细节确实,细节问题一方面和分辨率有关系,另外一个方面可能和通过蒸馏去强势维护一个3d表示有关,当视图之间一致性存在差异的时候,势必会造成通过均值的形式进行表达,maybe这也是细节模糊的一个因素。

zero-1-to-3,是一个单图生成3d的任务。核心的思想就是在一个大型的3d数据集objaverse上对一个扩散模型进行微调,从而将3d数据集中视角相关的信息注入到2d的扩散模型,让扩散模型能够生成不同视角的图像。相比2d数据集,这个3d数据集中的数据量已经很小了,但是这依然是一个很消耗资源的任务。

参考
zero123

1 论文方法

1.1 条件生成微调

如上图所示 ,论文的核心贡献是尝试优化了一个latent diffusion模型,将原图和视角信息作为输入进行训练。简单的理解可以拿congtrolnet做对比,controlnet允许轮廓,深度,法线等条件作为输入,不同的是zero123是用原图和相机信息联合起来作为输入。

1.2 维护3d表示

在这个地方他采用的SJC的那一套策略去优化nerfdreamfusion and SJC中提到扰动平均得分策略。

2 效果

相关推荐
MemoriKu2 分钟前
【端侧 AI 部署】MobileCLIP 导出 ONNX/TFLite 并发布到 Hugging Face 的完整实践
大数据·人工智能·elasticsearch·搜索引擎·重构·开源
VALENIAN瓦伦尼安教学设备3 分钟前
激光对中仪应用行业及全球市场份额解析
大数据·人工智能·嵌入式硬件
赴山海bi3 分钟前
亚马逊主图优化:提升点击率与转化率的实战策略
人工智能
一切皆是因缘际会4 分钟前
人工智能价值重构与发展破局
人工智能·百度·ai·重构
钓了猫的鱼儿7 分钟前
基于深度学习+AI的红外电力设备故障目标检测与预警系统(Python源码+数据集+UI可视化界面+YOLOv11训练结果)
人工智能·深度学习·目标检测
运维栈记8 分钟前
Remotion + Claude Code:用自然语言创作视频的革命性突破
人工智能·ai·音视频
LaughingZhu9 分钟前
Product Hunt 每日热榜 | 2026-05-30
人工智能·经验分享·深度学习·神经网络·产品运营
wanhengidc11 分钟前
云手机 跨设备无缝衔接
运维·服务器·人工智能·智能手机·云计算
vensli14 分钟前
AutoGLM vs 豆包手机:拆解两条 GUI Agent 的技术路线
人工智能·智能手机·transformer
m0_6418892923 分钟前
GEO优化监测:品牌如何靠GEO挖掘可靠信源,提升AI搜索曝光获客
人工智能·geo·数字营销·ai搜索·智能营销·geo优化·geo平台