OpenCV视觉分析之目标跟踪(10)估计两个点集之间的刚性变换函数estimateRigidTransform的使用

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

计算两个2D点集之间的最优仿射变换

estimateRigidTransform 是 OpenCV 中的一个函数,用于估计两个点集之间的刚性变换(即平移和旋转)。这个函数在计算机视觉中常用于图像配准、运动估计等任务。

该函数找到一个最优的仿射变换 [A|b](一个 2x3 的浮点矩阵),该变换最佳地逼近两个点集之间的仿射变换。

两个点集

两个栅格图像。在这种情况下,函数首先在 src 图像中找到一些特征,并在 dst 图像中找到对应的特征。之后,问题就简化为第一种情况。

在点集的情况下,问题表述如下:你需要找到一个 2x2 矩阵 A 和一个 2x1 向量 b,使得:
[ A ∗ ∣ b ∗ ] = a r g min ⁡ [ A ∣ b ] ∑ i ∥ dst [ i ] − A src [ i ] T − b ∥ 2 [A^*|b^*] = arg \min _{[A|b]} \sum _i \| \texttt{dst}[i] - A { \texttt{src}[i]}^T - b \| ^2 [A∗∣b∗]=arg[A∣b]mini∑∥dst[i]−Asrc[i]T−b∥2

其中 src[i] 和 dst[i] 分别是 src 和 dst 中的第 i 个点。[A|b] 可以是任意的(当 fullAffine=true 时),或者具有以下形式:
[ a 11 a 12 b 1 − a 12 a 11 b 2 ] \begin{bmatrix} a_{11} & a_{12} & b_1 \\ -a_{12} & a_{11} & b_2 \end{bmatrix} [a11−a12a12a11b1b2]

当 fullAffine=false 时。

函数原型

cpp 复制代码
Mat cv::estimateRigidTransform	
(
	InputArray 	src,
	InputArray 	dst,
	bool 	fullAffine 
)		

参数

  • 参数src:第一个输入的2D点集,存储在 std::vector 或 Mat 中,或存储在 Mat 中的图像。
  • 参数dst:第二个输入的2D点集,与 src 大小和类型相同,或另一个图像。
  • 参数fullAffine:如果为 true,函数将寻找一个没有额外限制的最优仿射变换(6个自由度)。否则,可选择的变换类别仅限于平移、旋转和均匀缩放的组合(4个自由度)

代码示例

cpp 复制代码
#include <iostream>
#include <opencv2/opencv.hpp>

using namespace cv;
using namespace std;

int main()
{
    // 创建源图像
    Mat src_image = Mat::zeros( 300, 300, CV_8UC3 );
    rectangle( src_image, Point( 50, 50 ), Point( 150, 150 ), Scalar( 255, 0, 0 ), -1 );
    circle( src_image, Point( 200, 200 ), 50, Scalar( 0, 255, 0 ), -1 );

    // 创建目标图像
    Mat dst_image = Mat::zeros( 300, 300, CV_8UC3 );
    Mat M         = getRotationMatrix2D( Point( 150, 150 ), 45, 1.0 );  // 旋转45度
    M.at< double >( 0, 2 ) += 50;                                       // 平移50个像素
    M.at< double >( 1, 2 ) += 50;                                       // 平移50个像素
    warpAffine( src_image, dst_image, M, dst_image.size() );

    // 显示生成的图像
    imshow( "Source Image", src_image );
    imshow( "Destination Image", dst_image );

    // 提取特征点
    vector< Point2f > src_points = { { 50, 50 }, { 150, 50 }, { 50, 150 }, { 200, 200 } };
    vector< Point2f > dst_points = { { 100, 100 }, { 200, 100 }, { 100, 200 }, { 250, 250 } };

    // 估计刚性变换矩阵
    Mat rigid_transform = estimateRigidTransform( src_points, dst_points, false );

    if ( rigid_transform.empty() )
    {
        cerr << "Error: Could not estimate rigid transform." << endl;
        return -1;
    }

    // 输出变换矩阵
    cout << "Rigid Transform Matrix:\n" << rigid_transform << endl;

    // 应用变换
    Mat transformed_image;
    warpAffine( src_image, transformed_image, rigid_transform, dst_image.size() );

    // 显示结果
    imshow( "Transformed Image", transformed_image );

    waitKey( 0 );

    return 0;
}

运行结果

相关推荐
月眠老师2 分钟前
拓展AI超级智能后的人类生活场景
人工智能·生活
是十一月末30 分钟前
Opencv实现图片的边界填充和阈值处理
人工智能·python·opencv·计算机视觉
机智的叉烧1 小时前
前沿重器[57] | sigir24:大模型推荐系统的文本ID对齐学习
人工智能·学习·机器学习
凳子花❀1 小时前
强化学习与深度学习以及相关芯片之间的区别
人工智能·深度学习·神经网络·ai·强化学习
泰迪智能科技013 小时前
高校深度学习视觉应用平台产品介绍
人工智能·深度学习
盛派网络小助手3 小时前
微信 SDK 更新 Sample,NCF 文档和模板更新,更多更新日志,欢迎解锁
开发语言·人工智能·后端·架构·c#
Eric.Lee20214 小时前
Paddle OCR 中英文检测识别 - python 实现
人工智能·opencv·计算机视觉·ocr检测
cd_farsight4 小时前
nlp初学者怎么入门?需要学习哪些?
人工智能·自然语言处理
AI明说4 小时前
评估大语言模型在药物基因组学问答任务中的表现:PGxQA
人工智能·语言模型·自然语言处理·数智药师·数智药学
Focus_Liu4 小时前
NLP-UIE(Universal Information Extraction)
人工智能·自然语言处理