OpenCV视觉分析之目标跟踪(10)估计两个点集之间的刚性变换函数estimateRigidTransform的使用

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

计算两个2D点集之间的最优仿射变换

estimateRigidTransform 是 OpenCV 中的一个函数,用于估计两个点集之间的刚性变换(即平移和旋转)。这个函数在计算机视觉中常用于图像配准、运动估计等任务。

该函数找到一个最优的仿射变换 [A|b](一个 2x3 的浮点矩阵),该变换最佳地逼近两个点集之间的仿射变换。

两个点集

两个栅格图像。在这种情况下,函数首先在 src 图像中找到一些特征,并在 dst 图像中找到对应的特征。之后,问题就简化为第一种情况。

在点集的情况下,问题表述如下:你需要找到一个 2x2 矩阵 A 和一个 2x1 向量 b,使得:

A ∗ ∣ b ∗ \] = a r g min ⁡ \[ A ∣ b \] ∑ i ∥ dst \[ i \] − A src \[ i \] T − b ∥ 2 \[A\^\*\|b\^\*\] = arg \\min _{\[A\|b\]} \\sum _i \\\| \\texttt{dst}\[i\] - A { \\texttt{src}\[i\]}\^T - b \\\| \^2 \[A∗∣b∗\]=arg\[A∣b\]mini∑∥dst\[i\]−Asrc\[i\]T−b∥2 其中 src\[i\] 和 dst\[i\] 分别是 src 和 dst 中的第 i 个点。\[A\|b\] 可以是任意的(当 fullAffine=true 时),或者具有以下形式: \[ a 11 a 12 b 1 − a 12 a 11 b 2 \] \\begin{bmatrix} a_{11} \& a_{12} \& b_1 \\\\ -a_{12} \& a_{11} \& b_2 \\end{bmatrix} \[a11−a12a12a11b1b2

当 fullAffine=false 时。

函数原型

cpp 复制代码
Mat cv::estimateRigidTransform	
(
	InputArray 	src,
	InputArray 	dst,
	bool 	fullAffine 
)		

参数

  • 参数src:第一个输入的2D点集,存储在 std::vector 或 Mat 中,或存储在 Mat 中的图像。
  • 参数dst:第二个输入的2D点集,与 src 大小和类型相同,或另一个图像。
  • 参数fullAffine:如果为 true,函数将寻找一个没有额外限制的最优仿射变换(6个自由度)。否则,可选择的变换类别仅限于平移、旋转和均匀缩放的组合(4个自由度)

代码示例

cpp 复制代码
#include <iostream>
#include <opencv2/opencv.hpp>

using namespace cv;
using namespace std;

int main()
{
    // 创建源图像
    Mat src_image = Mat::zeros( 300, 300, CV_8UC3 );
    rectangle( src_image, Point( 50, 50 ), Point( 150, 150 ), Scalar( 255, 0, 0 ), -1 );
    circle( src_image, Point( 200, 200 ), 50, Scalar( 0, 255, 0 ), -1 );

    // 创建目标图像
    Mat dst_image = Mat::zeros( 300, 300, CV_8UC3 );
    Mat M         = getRotationMatrix2D( Point( 150, 150 ), 45, 1.0 );  // 旋转45度
    M.at< double >( 0, 2 ) += 50;                                       // 平移50个像素
    M.at< double >( 1, 2 ) += 50;                                       // 平移50个像素
    warpAffine( src_image, dst_image, M, dst_image.size() );

    // 显示生成的图像
    imshow( "Source Image", src_image );
    imshow( "Destination Image", dst_image );

    // 提取特征点
    vector< Point2f > src_points = { { 50, 50 }, { 150, 50 }, { 50, 150 }, { 200, 200 } };
    vector< Point2f > dst_points = { { 100, 100 }, { 200, 100 }, { 100, 200 }, { 250, 250 } };

    // 估计刚性变换矩阵
    Mat rigid_transform = estimateRigidTransform( src_points, dst_points, false );

    if ( rigid_transform.empty() )
    {
        cerr << "Error: Could not estimate rigid transform." << endl;
        return -1;
    }

    // 输出变换矩阵
    cout << "Rigid Transform Matrix:\n" << rigid_transform << endl;

    // 应用变换
    Mat transformed_image;
    warpAffine( src_image, transformed_image, rigid_transform, dst_image.size() );

    // 显示结果
    imshow( "Transformed Image", transformed_image );

    waitKey( 0 );

    return 0;
}

运行结果

相关推荐
月下倩影时15 小时前
视觉学习篇——模型推理部署:从“炼丹”到“上桌”
人工智能·深度学习·学习
夕小瑶15 小时前
从无形IP到AI万象,安谋科技Arm China“周易”X3 NPU 发布!
人工智能·科技·tcp/ip
陈天伟教授15 小时前
人工智能技术-人工智能与科学-03 预测分子性能
人工智能
【建模先锋】15 小时前
基于密集连接的DenseNet故障诊断模型:实现高鲁棒性的深度故障诊断
人工智能·cnn·信号处理·故障诊断·轴承故障诊断·西储大学数据集
余俊晖15 小时前
英伟达开源多模态视觉语言模型-Nemotron Nano V2 VL模型架构、训练方法、训练数据
人工智能·算法·语言模型·自然语言处理·多模态
小殊小殊15 小时前
从零手撸Mamba!
人工智能·深度学习
Juchecar15 小时前
解析视觉:大脑识别色彩形状文字过程
人工智能
chatexcel15 小时前
ChatExcel亮相GTC2025全球流量大会
大数据·人工智能
许泽宇的技术分享16 小时前
从 Semantic Kernel 到 Agent Framework:微软 AI 开发框架的进化之路
人工智能·microsoft
孟祥_成都16 小时前
打包票!前端和小白一定明白的人工智能基础概念!
前端·人工智能