论文阅读:EasySplat: View-Adaptive Learning makes 3D Gaussian Splatting Easy

省流:

  1. 视图自适应分组策略,利用强大的点图先验构建成对点图,从而实现了点云和相机姿态的精确初始化。
  2. 基于KNN的自适应致密化策略,该策略根据每个高斯的相邻椭球体的形状差异动态触发致密化,从而实现了鲁棒的新视图合成。

1.视图自适应组初始化策略

由oneref方法构建的点图对得出的相机姿态是次优的,这可能会导致新颖视图合成的性能下降。

为了提高密集视图场景中的相机姿态性能并避免内存开销,我们提出了一种基于图像相似性的自适应分组策略来构建图像对。给定输入图像序列,我们首先计算每对相邻图像之间的余弦相似度,以量化它们的相似度。余弦相似度定义为:

其中表示图像的点积,是它们各自的范数。接下来,我们计算相邻图像之间的相似性差异,并构建一个差异率数组

其中表示图像之间的相似度差异。然后,我们从差率数组中选择个最大值,最后将图像序列划分为多个子序列,其中每个子序列代表一个组。在每个组内,将索引为0的视图分配为参考视图,组内的所有其他视图都与该参考视图匹配。这个过程生成一组图像对,记为方程式

其中是组号,是组集,是非参考号,是点映射号。配对后,所有图像对都被输入到DUSt3R的预训练模型中,以获得每个图像对的成对点图及其关联的置信度图,对于每个图像对。然后,如下公式所示进行全局优化以获得全局点云和相机姿态。

通过采用视图自适应分组配对策略,我们为后续的3DGS训练实现了更精确的全局点云和相机姿势。

2.基于KNN的致密化

每个3D高斯原语由一个平均向量和一个全3D协方差矩阵组成。高斯原语可以写成:

随后,在训练期间,每100次迭代计算每个高斯原语的平均视图空间位置梯度。如果梯度超过梯度阈值并且形状超过尺度阈值,则高斯将进行拆分:

虽然ADC允许拆分后的高斯覆盖大部分场景,但一些大高斯倾向于抵制拆分。然而,我们在实际场景中的观察发现,高斯分布是不均匀的,较大的高斯往往出现在较小的高斯附近。受这一现象的启发,我们提出了一种基于K-最近邻(KNN)算法的自适应高斯椭球拆分策略。具体来说,对于每个高斯椭球,我们使用KNN算法来识别个最接近的相邻高斯,然后计算这些邻居的平均形状

如果,则高斯被归类为大高斯,需要拆分。如图3所示,通过这种拆分方法,有效地划分了大高斯。

图3。基于KNN的致密化。在基于KNN的分裂之后,大高斯被分解成较小的高斯,导致对较小目标的显着改进,例如图中描绘的汽车。

相关推荐
QFIUNE3 小时前
【文献阅读】化学空间边缘的分子深度学习
论文阅读·人工智能·笔记·深度学习
数智工坊1 天前
ControlNet:为文生图扩散模型注入精准空间条件控制
论文阅读·人工智能·深度学习·transformer·迁移学习
莽撞的大地瓜1 天前
校对通更新!告别反复转格式 PDF图文/扫描件一键校对
论文阅读·新媒体运营·内容运营
Ma0407132 天前
SCI投稿
论文阅读
数智工坊2 天前
【DDIM 论文阅读】:扩散模型加速采样的里程碑!10~50 倍快采 + 确定性生成
论文阅读·人工智能·深度学习·cnn·transformer
数智工坊3 天前
【VAE 论文阅读| ICLR 2014】:变分自编码器——深度生成模型的理论基石
论文阅读·人工智能·深度学习
数智工坊4 天前
【ECNDNet论文阅读|图像去噪经典】:融合残差、BN与空洞卷积的增强型去噪网络
网络·论文阅读
数智工坊5 天前
【RT-DETR论文阅读】:首个实时端到端Transformer检测器,DETR正式超越YOLO
论文阅读·yolo·transformer
数智工坊5 天前
【Transfer CLIP论文阅读】跨模态大模型赋能!CLIP迁移学习实现超强泛化图像去噪
论文阅读·人工智能·迁移学习
小马哥crazymxm5 天前
arXiv论文周选 (2026-W18)
论文阅读·科技·考研