视觉矩阵 之 单应矩阵

一、什么是单应矩阵(Homography)

一句话定义(最重要)

单应矩阵是一个 3×3 矩阵,用来描述"同一平面"在两幅图像之间的射影变换关系。

记作:

二、 特征是什么?

  1. 矩阵形式:是一个 3×3 的矩阵,有 9 个元素。

    H=[h11h12h13h21h22h23h31h32h33]H=h11h21h31h12h22h32h13h23h33

  2. 齐次坐标与尺度不变性

    • 它工作在齐次坐标 下。对于一个点 p₁ = (x₁, y₁, 1)ᵀ(齐次坐标),变换后得到 p₂' = H * p₁

    • 得到的 p₂' = (x₂', y₂', w)ᵀ 不是直接的像素坐标,需要转换为非齐次坐标p₂ = (x₂'/w, y₂'/w, 1)

    • 由于齐次坐标的尺度等价性,单应矩阵 H 本身也具有尺度不变性 。即,HkH(k为非零标量)表示的是同一个几何变换。因此,H 只有 8 个自由度 (通常通过令 h₃₃ = 1 或其他约束来固定尺度)。

  3. 点对应关系

    给定一对匹配点 p₁ <-> p₂,其关系为:

    符号 ~ 表示"在尺度意义上相等"。

  4. 可逆性 :如果 H 是从图像1到图像2的单应,那么 H⁻¹ 就是从图像2到图像1的单应。

  5. 保线性 :单应变换是一种射影变换,它保持直线的"直线性"(直线变换后仍是直线),但不一定保持平行性和长度比例。

三、单应矩阵的数学推导(从相机模型出发)

1️⃣ 针孔成像模型

空间点 X 投影到图像:

2️⃣ 点在平面上

设平面:

代入投影关系,可消去深度自由度。


3️⃣ 两个视角之间的关系

两幅图像的点满足:

四、单应矩阵是如何"算出来的"?

https://zhuanlan.zhihu.com/p/138266214

1️⃣ 基本关系

这是一个 线性约束


2️⃣ 对每一对点,得到 2 条独立方程


3️⃣ 堆叠成齐次线性系统

  • 至少 4 对点

  • 这是你熟悉的 DLT


4️⃣ 用 SVD 求解

最小奇异值对应的向量

五、matlab : DLT + SVD 手写单应矩阵

cpp 复制代码
% 四对平面点
pts1 = [0 0;
        1 0;
        1 1;
        0 1];

pts2 = [100 100;
        300 80;
        320 300;
        80 280];

A = [];
for i = 1:4
    x = pts1(i,1); y = pts1(i,2);
    xp = pts2(i,1); yp = pts2(i,2);

    A = [A;
        -x -y -1  0  0  0  x*xp y*xp xp;
         0  0  0 -x -y -1  x*yp y*yp yp];
end

[~,~,V] = svd(A);
h = V(:,end);
H = reshape(h,3,3)';
H = H / H(3,3)

% 验证映射效果
p = [0.5; 0.5; 1];
p2 = H * p;
p2 = p2 / p2(3)

disp(p2(1:2))

% MATLAB 内置函数(工程推荐)
tform = fitgeotrans(pts1, pts2, 'projective');
H_matlab = tform.T

应矩阵是描述"同一平面"在两幅图像之间射影映射关系的 3×3 矩阵, 它用线性方法(DLT + SVD)求解,却表达了相机运动 + 平面几何

相关推荐
测试_AI_一辰7 小时前
AI测试工程笔记 05:AI评测实践(从数据集到自动评测闭环)
人工智能·笔记·功能测试·自动化·ai编程
云境筑桃源哇8 小时前
海洋ALFA:主权与创新的交响,开启AI生态新纪元
人工智能
2401_831824968 小时前
基于C++的区块链实现
开发语言·c++·算法
liliangcsdn8 小时前
LLM复杂数值的提取计算场景示例
人工智能·python
We་ct8 小时前
LeetCode 918. 环形子数组的最大和:两种解法详解
前端·数据结构·算法·leetcode·typescript·动态规划·取反
愣头不青9 小时前
238.除了自身以外数组的乘积
数据结构·算法
小和尚同志9 小时前
OpenCodeUI 让你随时随地 AI Coding
人工智能·aigc·ai编程
AI视觉网奇9 小时前
2d 数字人解决方案-待机动作
人工智能·计算机视觉
人工智能AI酱9 小时前
【AI深究】逻辑回归(Logistic Regression)全网最详细全流程详解与案例(附大量Python代码演示)| 数学原理、案例流程、代码演示及结果解读 | 决策边界、正则化、优缺点及工程建议
人工智能·python·算法·机器学习·ai·逻辑回归·正则化
WangLanguager9 小时前
逻辑回归(Logistic Regression)的详细介绍及Python代码示例
python·算法·逻辑回归