自动驾驶相机坐标系转换2

坐标系转换过程

这张图非常经典,它把计算机视觉里从真实三维世界到二维像素成像的整个数学链路完整地串了起来。我们可以把它看作一个"数据流水线",从右向左,一步步解析坐标是如何转换的:

第一步:刚体变换(世界坐标系 → 相机坐标系)

  • 图中位置:最右侧部分。
  • 含义

这是将物体在真实世界中的位置( Xw ,Yw ,Zw )转换为相机"眼中"的位置( Xc ,Yc ,Zc )。

就像你拿着相机去拍一个物体,物体本身没动,但相机动了(或者相机不动,物体动了)。这个变换只涉及旋转(R)平移(T),不改变物体的形状和大小,所以叫"刚体变换"。

  • 数学表达

使用一个 4×4 的矩阵(外参矩阵)来表示:

这里的 R 是旋转矩阵, T 是平移向量。这两个参数合称为相机外参

第二步:透视投影(相机坐标系 → 图像坐标系)

  • 图中位置:中间部分。
  • 含义

这是核心步骤,模拟了小孔成像 原理。将三维的相机坐标投影到二维的成像平面上( x ,y )。

在这个步骤中,三维信息丢失了深度( Z 轴信息被压缩),产生了"近大远小"的透视效果。

  • 数学表达

利用相似三角形原理,投影矩阵是一个 3×4 的矩阵:

这里的 f 是焦距。注意等式左边的 Zc 是为了配合齐次坐标而引入的比例因子。

第三步:二次转换/离散化(图像坐标系 → 像素坐标系)

  • 图中位置:最左侧部分。
  • 含义

图像坐标系是以物理单位(如毫米)度量的,原点在光轴中心。而像素坐标系是以像素为单位,原点在图像左上角。

这一步涉及两个操作:

缩放 :将物理尺寸转换为像素数量( dx ,dy 代表每个像素的物理尺寸)。

平移 :将原点从中心移到左上角( u 0,v0 是主点坐标)。

  • 数学表达

使用内参矩阵进行变换:

这里的 dx 1 和 dy 1 通常被记作 fxfy (以像素为单位的焦距)。

总结:完整的成像公式

图中下方展示了将上述三个步骤合并后的终极公式

图中关键结论解析:

  • 透视投影矩阵 ( P 3×4 ):图中将内参矩阵和外参矩阵相乘,统称为透视投影矩阵。它直接建立了世界坐标和像素坐标的联系。
  • 内参与外参
    • 内参(Intrinsic):只与相机内部结构有关(焦距、传感器尺寸、主点),相机造好后基本不变。
    • 外参(Extrinsic):描述相机在空间中的姿态(旋转、平移),随相机移动而改变。

这张图完整展示了从物理世界到数字图像的几何映射全过程,是相机标定、三维重建等任务的理论基础。

相关推荐
梦想的初衷~2 分钟前
claude code、codex双AI协同高水平论文撰写与质量校准:数据分析→论文初稿→交叉审稿全流程
人工智能·生物信息·实战教程·临床医学·claude code·codex cli·认知颠覆
@蔓蔓喜欢你2 分钟前
GraphQL 入门:API 开发的新范式
人工智能·ai
南屹川4 分钟前
【架构设计】设计模式实战与应用:从理论到代码实现
人工智能
梦想的颜色4 分钟前
LangGraph与智能体:当AI学会了“思考图谱”,离真正干活还有多远?
人工智能
MediaTea7 分钟前
DL:深度学习的主要任务
人工智能·深度学习
南屹川8 分钟前
【测试】自动化测试实战:从单元测试到端到端测试
人工智能
han_9 分钟前
手把手教你写一个 AI Skill,让 AI 真正学会你的工作流
人工智能·ai编程·claude
蔡俊锋9 分钟前
AI广告投放Agent:从Demo到实战的半年进化
人工智能·ai广告投放agent
莱歌数字12 分钟前
AR眼镜分区散热方案:让SoC“冷”下来,让光学“稳”住
人工智能·科技·电脑·ar·制造·散热
水木流年追梦15 分钟前
大模型入门-Pre-Training、SFT、RLHF
人工智能·深度学习·机器学习