材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布|SIGGRAPH Asia

在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 SVBRDF)。它是视觉计算中不可或缺的组成部分,在文化遗产、电子商务、电子游戏和视觉特效等领域中有着广泛的应用。

在过去的二十年里,特别是深度学习流行后,学术界与工业界对高精度、多样化数字材质外观的需求不断增加。但由于技术上的挑战,采集大型数据库仍然十分困难,目前公开可用的材质外观实拍数据库的数量非常有限。

为此,浙江大学计算机辅助设计与图形系统全国重点实验室和杭州相芯科技有限公司的研究团队联合提出了一种新型集成系统,用于鲁棒、高质量和高效地采集平面各向异性材质外观 。利用该系统,研究团队构建了 OpenSVBRDF 公开材质数据库

图 1:OpenSVBRDF 数据库中的部分材质样例展示。每一行同属一个材质类别。

这是第一个大规模 6 维 SVBRDF 的实测数据库,共有 1,000 个高质量平面样本,空间分辨率为 1,024×1,024,等效为超过 10 亿个实测 BRDF,涵盖了包括木材、织物和金属在内的 9 种类别。

数据库主页:opensvbrdf.github.io/

目前,数据库对非商业应用完全免费。只需要提交基本信息在网站上申请账号,通过审核后,即可直接下载包括 GGX 纹理贴图在内的相关数据和代码。相关研究论文《OpenSVBRDF: A Database of Measured Spatially-Varying Reflectance》已被计算机图形学顶级国际会议 ACM SIGGRAPH ASIA 2023 (Journal Track) 长文接收。

论文主页:svbrdf.github.io/

技术挑战

直接采样方法在不同的光照和观察角度的组合下对物理材质进行密集测量 [Lawrence et al. 2006]。这么做虽然能够获得高质量且鲁棒的采集结果,但其效率很低,需要高昂的时间和存储成本。还有一种选择是基于先验知识的重建方法,可以从稀疏的采样数据中重建材质。这样虽然提高了效率,但当先验条件不满足时,其质量不尽人意 [Nam et al. 2018]。此外,当前SOTA光路复用技术,虽然达到了较高的采集效率和重建质量,但在处理如拉丝金属和抛光木皮等高度复杂材质时,算法还不够鲁棒 [Kang et al. 2018]。

图 2:现有材质采集研究的代表工作。从左到右分别是 [Lawrence et al. 2006],[Nam et al. 2018] 以及 [Kang et al. 2018]。其中 [Kang et al. 2018] 为该团队在 2018 年发表于 ACM SIGGRAPH 的早期工作。

硬件

为高效扫描材质外观,研究团队搭建了一个接近半立方体的近场光照多路复用设备,其尺寸约为 70cm×70cm×40cm。样本被放置在一块透明的亚克力板上,可以通过抽屉滑轨快速滑入 / 滑出,来实现高吞吐率。该设备由 2 台机器视觉相机和 16,384 个高亮度 LED 组成,两台相机分别从大约 90 度(主视角)和 45 度(次视角)的角度拍摄样本,LED 分布在设备的 6 个面上。自主研发的高性能控制电路负责对每个 LED 进行独立亮度控制,并在硬件层面实现了光源投射和相机曝光的高精度同步。

图 3:采集设备外观及两个视角下的照片。

采集重建

本系统创新性地结合了当前基于网络预测和基于微调两大类流行方法的优点,既能通过可微分光照图案优化来增加物理采集效率,又能通过微调来进一步提升最终结果质量,从而首次实现了对于平面 SVBRDF 的高鲁棒性、高质量以及高效率的采集重建。

具体来说,为了重建物理样本,研究者首先通过在均匀照明下匹配密集 SIFT 特征来建立两个相机视角之间的高精度对应关系。对于物理采集,首先将光照图案作为自编码器的一部分进行优化,实现高效采集。该自编码器自动学习如何基于两个视角的测量值来重建复杂外观,并将结果表示为中间神经表达。随后,根据主视角相机在 63 个等效线性光源下拍摄的照片,通过绘制图像误差对神经表达进行微调,以提高最终结果的质量和鲁棒性。图 3 展示了整个系统的处理流程。更多详细信息请参阅原文论文。

图 4:整个系统的采集重建流程。

结果

研究人员共采集重建了 9 个类别,共计 1,000 个样本的外观,为了方便基于物理的标准绘制管线(PBR)直接使用,该研究还将神经表达拟合到了业界标准的各向异性 GGX BRDF 模型参数。图 5 展示了材质重建结果的分项参数 / 属性。每个样本存储了 193 张原始 HDR 照片(总大小 15GB)、中间神经表达(290MB),以及 6 张贴图,包括表示 GGX 参数的纹理贴图和透明度贴图(总大小 55MB)。神经表达和纹理贴图的空间分辨率均为 1,024×1,024。

图 5:材质重建结果分项属性(包括神经表达、漫反射率、高光反射率、粗糙度等)。

为了证明重建结果的正确性,研究人员将主视角下的照片(下图第一行)和神经表达绘制结果(下图第二行)进行了比较。定量误差(以 SSIM/PSNR 表达)标注在绘制图片的底部。由下图结果可见,本系统实现了高质量材质重建(SSIM>=0.97, PSNR>=34db)。

图 6:实拍照片和神经表达绘制结果在主视角下的对比。

为了进一步证明重建结果的视角域泛化性,研究人员将点光源照射下、两个视角所拍摄的照片和使用 GGX 拟合参数绘制的结果进行了比较,验证了重建结果的跨视角正确性。

图 7:实拍照片和各向异性 GGX 拟合参数绘制结果在两个视角下的对比。

研究人员还展示了该数据库在材质生成、材质分类以及材质重建三方面的应用。具体细节请参考原始论文。

图 8:利用 OpenSVBRDF 训练 MaterialGAN 来实现材质生成与插值。

图 9:利用 OpenSVBRDF 训练主动光照以提升材质分类精度。

图 10:利用 OpenSVBRDF 来提高基于单点采样(左)和光路多路复用(右)的 BRDF 重建质量。

展望

研究人员将努力扩展现有数据库,增加展现多样性外观的材质样本。未来,他们还计划建立同时包含材质外观和几何形状的大规模高精度实测物体数据库。此外,研究人员将基于 OpenSVBRDF 设计在材质估计、分类和生成等方向上的公开 Benchmark,通过客观定量的标准测试,为推动相关研究的未来发展提供坚实的数据保障。

相关推荐
三花AI1 天前
好家伙,OpenAI 第一的位置屁股还没坐热呢,谷歌 Gemini 就重夺竞技场榜首了
资讯
蚝油菜花11 天前
今日 AI 简报|百度推出检索增强的文生图技术、开源表格处理大模型、蛋白质结构预测、3D 生成、短视频生成、PDF 翻译工具
人工智能·开源·资讯
蚝油菜花1 个月前
王炸!Anthropic 推出全新模型 Claude 3.5 Haiku,首发支持计算机使用功能!
人工智能·llm·资讯
三花AI1 个月前
Playground V3:图形设计模型的文字处理新标杆
开源·资讯
万界星空科技1 个月前
万界星空科技MES系统与各大系统的集成
产品·运营·资讯
战场小包3 个月前
OpenAI动荡,将走向何方、GPT5或许将近、毒舌AI轻松破防网友、最新版 GPT-4o AI 模型得满分 | AGI掘金视界周刊第 4 期
人工智能·资讯
字节跳动开源4 个月前
字节跳动开源多云多集群管理引擎 KubeAdmiral v1.0.0 发布!
开源·github·资讯
战场小包4 个月前
AI视界周刊第 2 期:里程碑 Llama 3.1 开源、AI训AI,越训越傻、AI 搜索重燃战火
人工智能·资讯
栩栩云生4 个月前
[240726] Mistral AI 发布新一代旗舰模型 | Node.js 合并 TypeScript 文件执行提案
typescript·node.js·资讯
赵侠客4 个月前
使用Hutool要注意了!升级到6.0后你调用的所有方法都将报错
java·后端·资讯