计算机视觉与图形学-神经渲染专题-Seal-3D(基于NeRF的像素级交互式编辑)

摘要

随着隐式神经表示或神经辐射场 (NeRF) 的流行,迫切需要与隐式 3D 模型交互的编辑方法,以完成后处理重建场景和 3D 内容创建等任务。虽然之前的作品从不同角度探索了 NeRF 编辑,但它们在编辑灵活性、质量和速度方面受到限制,无法提供直接的编辑响应和即时预览。关键的挑战是构思一种本地可编辑的神经表示,它可以直接反映编辑指令并立即更新。为了弥补这一差距,我们提出了一种新的隐式表示交互式编辑方法和系统,称为 Seal-3D,它允许用户以像素级和自由的方式编辑 NeRF 模型 ,并具有广泛的类 NeRF 主干网,并预览 立即编辑效果。为了实现这些效果,我们提出的代理函数将编辑指令映射到 NeRF 模型的原始空间 ,以及具有局部预训练和全局微调的student-teacher训练策略来解决这些挑战。NeRF 编辑系统旨在展示各种编辑类型。我们的系统可以以约1秒的交互速度实现引人注目的编辑效果。

工程链接:https://windingwind.github.io/seal-3d/

框架

左图:用户编辑后目标空间的 3D 点和视图方向映射到原始源空间,以从教师模型获取指导 ct、σt 以进行学生训练。右图:学生训练由两个阶段组成:快速预训练,通过局部损失更新网络的部分参数来提供即时预览,以及全局损失的微调。

实验结果

第一个交互式像素级 NeRF 编辑工具。我们设计了一种交互式用户编辑方法和系统 Seal-3D,通过我们新颖的预训练策略实现了即时(约 1 秒)预览(左)。通过短时间(1~2分钟)的微调,可以进一步获得高质量的编辑结果。我们实施编辑的编辑结果工具(右)与原始表面(左)上丰富的阴影细节(例如阴影)在视图上保持一致。

3D内容编辑

结论

我们引入了一个用于神经辐射场像素级编辑的交互式框架,支持即时预览。具体来说,我们利用student-teacher蒸馏方法提供编辑指导,并设计两阶段训练策略来实现网络即时收敛,以获得粗略结果作为预览。与以前的工作不同,我们的方法不需要任何显式代理(例如网格),从而提高了交互性和用户友好性。我们的方法还支持在编辑的表面上保留着色效果。一个限制是我们的方法不支持复杂的依赖于视图的照明效果,例如镜面反射,并且不能改变场景照明,这可以通过引入内在合成来改进。此外,我们的方法不处理原始 NeRF 网络的重建失败(例如浮动伪影)。

相关推荐
wwlsm_zql1 小时前
「赤兔」Chitu 框架深度解读(十四):核心算子优化
人工智能·1024程序员节
一只一只3 小时前
Unity 3D笔记(进阶部分)——《B站阿发你好》
笔记·3d·unity·游戏引擎
AKAMAI3 小时前
Fermyon推出全球最快边缘计算平台:WebAssembly先驱携手Akamai云驱动无服务器技术新浪潮
人工智能·云计算·边缘计算
云雾J视界4 小时前
TMS320C6000 VLIW架构并行编程实战:加速AI边缘计算推理性能
人工智能·架构·边缘计算·dsp·vliw·tms320c6000
想ai抽4 小时前
基于AI Agent的数据资产自动化治理实验
人工智能·langchain·embedding
程序猿阿伟4 小时前
《3D端游开放世界动态天气系统与场景交互优化实践日志》
3d·1024程序员节
小马过河R5 小时前
AIGC视频生成之Deepseek、百度妙笔组合实战小案例
人工智能·深度学习·计算机视觉·百度·aigc
june-Dai Yi5 小时前
免费的大语言模型API接口
人工智能·语言模型·自然语言处理·chatgpt·api接口
王哈哈^_^6 小时前
【数据集】【YOLO】【目标检测】农作物病害数据集 11498 张,病害检测,YOLOv8农作物病虫害识别系统实战训推教程。
人工智能·深度学习·算法·yolo·目标检测·计算机视觉·1024程序员节
数据库安全6 小时前
牛品推荐|分类分级效能飞跃:美创智能数据安全分类分级平台
大数据·人工智能·分类