视觉矩阵 之 单应矩阵

一、什么是单应矩阵(Homography)

一句话定义(最重要)

单应矩阵是一个 3×3 矩阵,用来描述"同一平面"在两幅图像之间的射影变换关系。

记作:

二、 特征是什么?

  1. 矩阵形式:是一个 3×3 的矩阵,有 9 个元素。

    H=h11h12h13h21h22h23h31h32h33H=h11h21h31h12h22h32h13h23h33

  2. 齐次坐标与尺度不变性

    • 它工作在齐次坐标 下。对于一个点 p₁ = (x₁, y₁, 1)ᵀ(齐次坐标),变换后得到 p₂' = H * p₁

    • 得到的 p₂' = (x₂', y₂', w)ᵀ 不是直接的像素坐标,需要转换为非齐次坐标p₂ = (x₂'/w, y₂'/w, 1)

    • 由于齐次坐标的尺度等价性,单应矩阵 H 本身也具有尺度不变性 。即,HkH(k为非零标量)表示的是同一个几何变换。因此,H 只有 8 个自由度 (通常通过令 h₃₃ = 1 或其他约束来固定尺度)。

  3. 点对应关系

    给定一对匹配点 p₁ <-> p₂,其关系为:

    符号 ~ 表示"在尺度意义上相等"。

  4. 可逆性 :如果 H 是从图像1到图像2的单应,那么 H⁻¹ 就是从图像2到图像1的单应。

  5. 保线性 :单应变换是一种射影变换,它保持直线的"直线性"(直线变换后仍是直线),但不一定保持平行性和长度比例。

三、单应矩阵的数学推导(从相机模型出发)

1️⃣ 针孔成像模型

空间点 X 投影到图像:

2️⃣ 点在平面上

设平面:

代入投影关系,可消去深度自由度。


3️⃣ 两个视角之间的关系

两幅图像的点满足:

四、单应矩阵是如何"算出来的"?

https://zhuanlan.zhihu.com/p/138266214

1️⃣ 基本关系

这是一个 线性约束


2️⃣ 对每一对点,得到 2 条独立方程


3️⃣ 堆叠成齐次线性系统

  • 至少 4 对点

  • 这是你熟悉的 DLT


4️⃣ 用 SVD 求解

最小奇异值对应的向量

五、matlab : DLT + SVD 手写单应矩阵

cpp 复制代码
% 四对平面点
pts1 = [0 0;
        1 0;
        1 1;
        0 1];

pts2 = [100 100;
        300 80;
        320 300;
        80 280];

A = [];
for i = 1:4
    x = pts1(i,1); y = pts1(i,2);
    xp = pts2(i,1); yp = pts2(i,2);

    A = [A;
        -x -y -1  0  0  0  x*xp y*xp xp;
         0  0  0 -x -y -1  x*yp y*yp yp];
end

[~,~,V] = svd(A);
h = V(:,end);
H = reshape(h,3,3)';
H = H / H(3,3)

% 验证映射效果
p = [0.5; 0.5; 1];
p2 = H * p;
p2 = p2 / p2(3)

disp(p2(1:2))

% MATLAB 内置函数(工程推荐)
tform = fitgeotrans(pts1, pts2, 'projective');
H_matlab = tform.T

应矩阵是描述"同一平面"在两幅图像之间射影映射关系的 3×3 矩阵, 它用线性方法(DLT + SVD)求解,却表达了相机运动 + 平面几何

相关推荐
2401_872418782 小时前
算法入门:数据结构-堆
数据结构·算法
火山引擎开发者社区3 小时前
技术速递|使用 GitHub Copilot CLI 构建 Emoji 列表生成器
人工智能
codefan※3 小时前
干掉“幻觉“实战:如何构建企业级知识图谱增强 RAG
人工智能·知识图谱
wukangjupingbb3 小时前
传统基于药物 SMILES 序列和蛋白质氨基酸序列的 DTI(Drug-Target Interaction)预测方法的缺陷
人工智能
沪漂阿龙4 小时前
Codex 额度重置周期变化:AI 编程免费试玩时代正在结束
人工智能
xwz小王子4 小时前
手术机器人登上Science Robotics:2毫米纤细手臂,从3厘米切口完成腰椎神经减压
算法·机器人
TickDB4 小时前
美股行情 API 接入避坑:REST 快照、WebSocket 推送、盘前盘后数据的边界
人工智能·python·websocket·行情数据 api
装不满的克莱因瓶4 小时前
深入理解卷积神经网络(CNN)——从原理到代码实践
人工智能·神经网络·cnn
完成大叔4 小时前
模块二,Agent知识图谱的工具链思考
人工智能
lauo4 小时前
ibbot手机发布:搭载poplang技术 + token节点经济,革新AI手机体验
人工智能·智能手机