OpenCV视觉分析之目标跟踪(10)估计两个点集之间的刚性变换函数estimateRigidTransform的使用

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

计算两个2D点集之间的最优仿射变换

estimateRigidTransform 是 OpenCV 中的一个函数,用于估计两个点集之间的刚性变换(即平移和旋转)。这个函数在计算机视觉中常用于图像配准、运动估计等任务。

该函数找到一个最优的仿射变换 [A|b](一个 2x3 的浮点矩阵),该变换最佳地逼近两个点集之间的仿射变换。

两个点集

两个栅格图像。在这种情况下,函数首先在 src 图像中找到一些特征,并在 dst 图像中找到对应的特征。之后,问题就简化为第一种情况。

在点集的情况下,问题表述如下:你需要找到一个 2x2 矩阵 A 和一个 2x1 向量 b,使得:

A ∗ ∣ b ∗ \] = a r g min ⁡ \[ A ∣ b \] ∑ i ∥ dst \[ i \] − A src \[ i \] T − b ∥ 2 \[A\^\*\|b\^\*\] = arg \\min _{\[A\|b\]} \\sum _i \\\| \\texttt{dst}\[i\] - A { \\texttt{src}\[i\]}\^T - b \\\| \^2 \[A∗∣b∗\]=arg\[A∣b\]mini∑∥dst\[i\]−Asrc\[i\]T−b∥2 其中 src\[i\] 和 dst\[i\] 分别是 src 和 dst 中的第 i 个点。\[A\|b\] 可以是任意的(当 fullAffine=true 时),或者具有以下形式: \[ a 11 a 12 b 1 − a 12 a 11 b 2 \] \\begin{bmatrix} a_{11} \& a_{12} \& b_1 \\\\ -a_{12} \& a_{11} \& b_2 \\end{bmatrix} \[a11−a12a12a11b1b2

当 fullAffine=false 时。

函数原型

cpp 复制代码
Mat cv::estimateRigidTransform	
(
	InputArray 	src,
	InputArray 	dst,
	bool 	fullAffine 
)		

参数

  • 参数src:第一个输入的2D点集,存储在 std::vector 或 Mat 中,或存储在 Mat 中的图像。
  • 参数dst:第二个输入的2D点集,与 src 大小和类型相同,或另一个图像。
  • 参数fullAffine:如果为 true,函数将寻找一个没有额外限制的最优仿射变换(6个自由度)。否则,可选择的变换类别仅限于平移、旋转和均匀缩放的组合(4个自由度)

代码示例

cpp 复制代码
#include <iostream>
#include <opencv2/opencv.hpp>

using namespace cv;
using namespace std;

int main()
{
    // 创建源图像
    Mat src_image = Mat::zeros( 300, 300, CV_8UC3 );
    rectangle( src_image, Point( 50, 50 ), Point( 150, 150 ), Scalar( 255, 0, 0 ), -1 );
    circle( src_image, Point( 200, 200 ), 50, Scalar( 0, 255, 0 ), -1 );

    // 创建目标图像
    Mat dst_image = Mat::zeros( 300, 300, CV_8UC3 );
    Mat M         = getRotationMatrix2D( Point( 150, 150 ), 45, 1.0 );  // 旋转45度
    M.at< double >( 0, 2 ) += 50;                                       // 平移50个像素
    M.at< double >( 1, 2 ) += 50;                                       // 平移50个像素
    warpAffine( src_image, dst_image, M, dst_image.size() );

    // 显示生成的图像
    imshow( "Source Image", src_image );
    imshow( "Destination Image", dst_image );

    // 提取特征点
    vector< Point2f > src_points = { { 50, 50 }, { 150, 50 }, { 50, 150 }, { 200, 200 } };
    vector< Point2f > dst_points = { { 100, 100 }, { 200, 100 }, { 100, 200 }, { 250, 250 } };

    // 估计刚性变换矩阵
    Mat rigid_transform = estimateRigidTransform( src_points, dst_points, false );

    if ( rigid_transform.empty() )
    {
        cerr << "Error: Could not estimate rigid transform." << endl;
        return -1;
    }

    // 输出变换矩阵
    cout << "Rigid Transform Matrix:\n" << rigid_transform << endl;

    // 应用变换
    Mat transformed_image;
    warpAffine( src_image, transformed_image, rigid_transform, dst_image.size() );

    // 显示结果
    imshow( "Transformed Image", transformed_image );

    waitKey( 0 );

    return 0;
}

运行结果

相关推荐
UMI赋能企业22 分钟前
企业视频库管理高效策略
大数据·人工智能
一念&2 小时前
今日科技热点 | AI加速变革,量子计算商用化,5G应用新机遇
人工智能·科技·量子计算
严文文-Chris2 小时前
【GPT-5 与 GPT-4 的主要区别?】
人工智能·gpt
过往入尘土3 小时前
计算机视觉:从 “看见” 到 “理解”,解锁机器感知世界的密码
人工智能
飞哥数智坊4 小时前
别再组团队了,AI时代一个人就能创业
人工智能·创业
严文文-Chris4 小时前
GPT5的Test-time compute(测试时计算)是什么?
人工智能
Java中文社群4 小时前
白嫖ClaudeCode秘籍大公开!超详细
人工智能·后端
MicrosoftReactor4 小时前
技术速递|使用 AI 应用模板扩展创建一个 .NET AI 应用与自定义数据进行对话
人工智能·.net
迪菲赫尔曼6 小时前
大模型入门实战 | 基于 YOLO 数据集微调 Qwen2.5-VL-3B-Instruct 的目标检测任务
人工智能·yolo·目标检测·大模型·微调·新手入门·qwen2.5