3DGS输入的三个bin文件的作用


提示仅代表个人学习记录,不专业


1.cameras.bin(相机内参)

记录内容:每个相机的 id、model(成像模型)、width、height、params(如 PINHOLE 为 fx, fy, cx, cy)。

在本项目中的用法

从 params 推导 FovX/FovY,用于构建投影几何,把三维高斯正确投到二维图像。

限制:项目仅支持"无畸变"的 PINHOLE 或 SIMPLE_PINHOLE(畸变模型不会被使用)。

影响点:影响渲染的视角投影、像素坐标到射线的变换、图像分辨率。

2.images.bin(相机外参与图像列表)

记录内容:每张图像的 id、qvec(旋转四元数)、tvec(平移)、camera_id(指向上面的相机)、name(图像文件名),以及每个像素的匹配信息 xys/point3D_ids(2D-3D对应,供 SfM 使用)。

在本项目中的用法:

用 qvec/tvec 转为 R/T,构建每一帧训练/测试相机;用 name 定位 GT 图像文件。

训练循环中"按相机视角渲染→与该视角的 GT 比较→计算损失"完全依赖这些位姿。

用于场景归一化(nerfpp normalization):根据所有相机中心估计场景中心与尺度,保证训练稳定。

曝光学习映射键使用图像名(保存到 exposure.json)。

影响点:决定从哪个视角监督、渲染时的相机姿态、训练/验证划分(结合 LLFF hold 或 test.txt)。

3.points3D.bin(稀疏三维点云)

记录内容:全局稀疏点的 id、xyz、rgb、error、可见图像 image_ids、与之对应的 point2D_idxs。

在本项目中的用法:

初始点云来源:首次加载 COLMAP 数据时,会将 points3D.bin|txt 转换为 sparse/0/points3D.ply(见 storePly),再复制为模型目录的 input.ply。

该 input.ply 构成训练的初始高斯集合(位置与颜色的初始化),之后在训练过程中被优化为 point_cloud/iteration_*/point_cloud.ply。

影响点:决定初始几何与颜色起点;不直接参与后续每步损失计算(那部分用的是相机与图像)。

关系与差异

几何起点 :来自 points3D.bin → 转 points3D.ply → 复制为 input.ply。
相机投影与位姿 :来自 cameras.bin(内参)与 images.bin(外参+图像名)。
监督数据:通过 images.bin 的 name 去读取对应的图像作为 GT。


相关推荐
nashane39 分钟前
HarmonyOS 6.0 分布式相机实战:调用远端设备摄像头与AI场景识别(API 11+)
分布式·数码相机·harmonyos·harmonyos 5
AI人工智能+1 小时前
文档抽取系统结合OCR技术与大语言模型,有效解决档案数字化与知识化利用之间的矛盾
人工智能·计算机视觉·ocr·文档抽取
深度学习lover1 小时前
<数据集>yolo 焊接缺陷识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·焊接缺陷检测
军军君011 小时前
【人工智能/AI】项目实战二:AI视频生成产品汇总(非完全)
图像处理·人工智能·计算机视觉·ai作画·视觉检测·文心一言
一休哥※2 小时前
YOLOv11改进系列 | 引入EMO ICCV2023的C3k2_iRMB模块,轻量注意力残差混合块增强C3k2,多尺度分割更稳更准
深度学习·yolo·计算机视觉
光电的一只菜鸡3 小时前
相机光学(五十一)——前置附加工具透镜
数码相机
ZC跨境爬虫3 小时前
3D地球卫星轨道可视化平台开发 Day15(添加卫星系列模糊搜索功能)
前端·数据库·3d·交互·数据可视化
森诺Alyson3 小时前
前沿技术借鉴研讨-2026.4.16(视觉语言模型/医学影像文本多模态对齐)
论文阅读·人工智能·经验分享·计算机视觉·语言模型
jay神4 小时前
鸟类识别数据集 - CUB_200
人工智能·深度学习·目标检测·计算机视觉·目标跟踪·毕业设计
kobesdu5 小时前
开源3D激光SLAM算法的异同点、优劣势与适配场景总结
算法·3d·机器人·ros