论文阅读:EasySplat: View-Adaptive Learning makes 3D Gaussian Splatting Easy

省流:

  1. 视图自适应分组策略,利用强大的点图先验构建成对点图,从而实现了点云和相机姿态的精确初始化。
  2. 基于KNN的自适应致密化策略,该策略根据每个高斯的相邻椭球体的形状差异动态触发致密化,从而实现了鲁棒的新视图合成。

1.视图自适应组初始化策略

由oneref方法构建的点图对得出的相机姿态是次优的,这可能会导致新颖视图合成的性能下降。

为了提高密集视图场景中的相机姿态性能并避免内存开销,我们提出了一种基于图像相似性的自适应分组策略来构建图像对。给定输入图像序列,我们首先计算每对相邻图像之间的余弦相似度,以量化它们的相似度。余弦相似度定义为:

其中表示图像的点积,是它们各自的范数。接下来,我们计算相邻图像之间的相似性差异,并构建一个差异率数组

其中表示图像之间的相似度差异。然后,我们从差率数组中选择个最大值,最后将图像序列划分为多个子序列,其中每个子序列代表一个组。在每个组内,将索引为0的视图分配为参考视图,组内的所有其他视图都与该参考视图匹配。这个过程生成一组图像对,记为方程式

其中是组号,是组集,是非参考号,是点映射号。配对后,所有图像对都被输入到DUSt3R的预训练模型中,以获得每个图像对的成对点图及其关联的置信度图,对于每个图像对。然后,如下公式所示进行全局优化以获得全局点云和相机姿态。

通过采用视图自适应分组配对策略,我们为后续的3DGS训练实现了更精确的全局点云和相机姿势。

2.基于KNN的致密化

每个3D高斯原语由一个平均向量和一个全3D协方差矩阵组成。高斯原语可以写成:

随后,在训练期间,每100次迭代计算每个高斯原语的平均视图空间位置梯度。如果梯度超过梯度阈值并且形状超过尺度阈值,则高斯将进行拆分:

虽然ADC允许拆分后的高斯覆盖大部分场景,但一些大高斯倾向于抵制拆分。然而,我们在实际场景中的观察发现,高斯分布是不均匀的,较大的高斯往往出现在较小的高斯附近。受这一现象的启发,我们提出了一种基于K-最近邻(KNN)算法的自适应高斯椭球拆分策略。具体来说,对于每个高斯椭球,我们使用KNN算法来识别个最接近的相邻高斯,然后计算这些邻居的平均形状

如果,则高斯被归类为大高斯,需要拆分。如图3所示,通过这种拆分方法,有效地划分了大高斯。

图3。基于KNN的致密化。在基于KNN的分裂之后,大高斯被分解成较小的高斯,导致对较小目标的显着改进,例如图中描绘的汽车。

相关推荐
繁华落尽,寻一世真情2 小时前
【声音场景分类--论文阅读】
论文阅读·分类·数据挖掘
rommel rain4 小时前
投机解码论文阅读:Falcon
论文阅读·语言模型·自然语言处理
m0_743106464 小时前
【论文笔记】SmileSplat:稀疏视角+pose-free+泛化
论文阅读·深度学习·计算机视觉·3d·几何学
_ZCWzy5 小时前
论文阅读:SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting
论文阅读·3d
HollowKnightZ6 小时前
论文阅读笔记:Mamba in Vision: A Comprehensive Survey of Techniques and Applications
论文阅读·笔记·mamba
pzx_0016 小时前
【论文阅读】基于空间相关性与Stacking集成学习的风电功率预测方法
论文阅读·人工智能·算法·机器学习·bootstrap·集成学习
m0_7431064617 小时前
【论文笔记】多个大规模数据集上的SOTA绝对位姿回归方法:Reloc3r
论文阅读·深度学习·计算机视觉·3d·几何学
李加号pluuuus19 小时前
【论文阅读+复现】High-fidelity Person-centric Subject-to-Image Synthesis
论文阅读·人工智能·计算机视觉
Fairy要carry1 天前
论文阅读:Jailbreak Open-Sourced Large Language Models via Enforced Decoding
论文阅读·人工智能·语言模型