计算机视觉11-相机模型与多视几何

甄心爱学习2025-11-14 15:54

2d图像可以看作3d的一个子空间

三维视觉：关注相机的位置姿态，三维场景的重构

MVS = Multi-View Stereo，多视图立体重建

输入：多张已知相机位姿的图片（这些位姿通常由 SfM 算出来）。
目标：在每一个像素上估计可靠的深度，得到稠密点云/网格模型。

可以这么理解：

SfM ：先用特征点匹配 +几何约束，只重建出稀疏的三维点（角点、特征点）和相机外参。
MVS ：在 SfM 结果的基础上，利用多张图像之间的视差，把"空白区域"也补上，变成稠密三维结构（深度图、稠密点云、三角网格）

PnP = Perspective-n-Point 问题

已知：
- 一些三维点的坐标（世界坐标系里，通常是地图中的点）；
- 它们在当前图像上的2D 像素位置；
- 相机内参（焦距、主点等）。
求：
- 当前相机相对于世界坐标系的位姿（R、t）------也就是"在什么位置、朝哪儿看"。

常见变体有 P3P、EPnP 等，通常会配合 RANSAC 使用来去除误匹配点。

光圈过小可能产生衍射现象

D'为相距，D为物距

公式非常重要！！！

超出景深范围，有弥散圆，太远太近都不行

弥散圆：指的是物点成像时，由于像差，其成像光束不能会聚于一点，在像平面上形成一个扩散的圆形投影。弥散圆在焦点前后，光线开始聚集和扩散，点的影象变成模糊的，形成一个扩大的圆。

景深是个范围，受到光圈等影响

光圈是一个用来控制光线通进入镜头的装置，它通常是在镜头内，对于已经制造好的镜头，我们不可以随意的改变镜头的镜头，但是可以通过在镜头内部加入多边形或者圆形，并且面积可变的孔径光栅来达到控制镜头通光量。

光圈越大景深越浅，光圈越小景深越深

欧式空间到摄影空间的转化，从3d到2d，丢失了一定的信息

分别建立两个坐标系，图中有一定的约束关系

问题

在一条直线上只有唯一一个无穷远点
在一个平面上，所有的无穷远点组成一条直线，称为该平面的无穷远直线
三维空间中的所有无穷远点组成的一个平面，称为这个空间的无穷远平面

再加入齐次坐标（统一维度）

相机模型（重要！！！）

注意：f的单位改为像素

两个坐标系变化只有旋转、平移

最后得到投影与真实坐标之间的关系

K为焦距的部分

R由于相机的姿态造成的旋转与平移（相对于世界坐标系而言）

公式非常重要！！！

对于矩阵的维度

上一篇：线性代数 - 二阶矩阵的行列式、向量叉积（Cross product）的模长与平行四边形面积的关系

下一篇：Android 源码学习之init进程

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）07OpenClaw优化飞书API 额度已耗尽问题 08【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw大龙虾机器人完整安装教程