【OpenCV实现图像:使用OpenCV进行图像处理之透视变换】

文章目录

概要

透视变换(Perspective Transformation)是一种图像处理中常用的变换手段,它用于将图像从一个视角映射到另一个视角,常被称为投影映射。透视变换可以用于矫正图像中的透视畸变,使得图像中的物体在新的视平面上呈现更加规则的形状。

透视变换通常涉及到寻找图像中的特定点集,这些点对应于真实场景中的特定位置。通过这些点的映射关系,可以计算出透视变换的矩阵,然后将整个图像进行变换。在实际应用中,透视变换常用于校准摄像头、图像矫正、虚拟增强现实等领域。

计算公式

一般来说,通用的图像变换公式如下所示:

上述公式中,u,v代表原始图像坐标,x,y为经过透视变换的图片坐标,其中变换矩阵为3X3形式。进而可以得到:

举个栗子

直观的来看,透视变换的作用就是将左侧图像的坐标点

\[50,0\],\[150,0\],\[0,200\],\[200,200\]

转化为新的坐标

\[0,0\],\[200,0\],\[0,200\],\[200,200\]

通过计算我们知道,转换矩阵如下

采用左上角的点(50,0)代入公式,

接着将列向量的前两维度除以第三维执行归一化:

所以原图左上角点执行透视变换后的映射关系:

实际应用

1)读入图像

首先我们来读入一副彩色图像,如下:

bash 复制代码
import cv2
import numpy as np

img = cv2.imread("image/sample.jpg")
h, w, c = img.shape  # 获取图像的高度、宽度和通道数

2)挑选原图四个点

接着我们需要挑选四个点,我们这里采用左上,左下,右下和右上,下面的代码把我们挑选的四个点画到图像上.

bash 复制代码
src_list = [(61, 70), (151, 217), (269, 143), (160, 29)]

# 在图像上标出四个点
for i, pt in enumerate(src_list):
    cv2.circle(img, pt, 5, (0, 0, 255), -1)
    cv2.putText(img, str(i+1), (pt[0]+5, pt[1]+10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

# 将挑选的四个点转换为NumPy数组
pts1 = np.float32(src_list)

3)显示图像:

bash 复制代码
cv2.imshow('Original Image with Selected Points', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

完整代码:

bash 复制代码
import cv2
import numpy as np

img = cv2.imread("img_5.png")
h, w, c = img.shape  # 获取图像的高度、宽度和通道数
src_list = [(61, 70), (151, 217), (269, 143), (160, 29)]

# 在图像上标出四个点
for i, pt in enumerate(src_list):
    cv2.circle(img, pt, 5, (0, 0, 255), -1)
    cv2.putText(img, str(i+1), (pt[0]+5, pt[1]+10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

# 将挑选的四个点转换为NumPy数组
pts1 = np.float32(src_list)
cv2.imshow('Original Image with Selected Points', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

以上四个点标注位置不对,所以需要改变点的位置.

4)进行透视变换

首先选择四个目的图像上的点,然后调用openv函数进行透视变换.

bash 复制代码
pts2 = np.float32([[0, 0], [0, w - 2], [h - 2, w - 2], [h - 2, 0]])
matrix = cv2.getPerspectiveTransform(pts1, pts2)
result = cv2.warpPerspective(img, matrix, (h, w))
cv2.imshow("Image", img)
cv2.imshow("Perspective transformation", result)
cv2.waitKey(0)

全部

bash 复制代码
import cv2
import numpy as np

img = cv2.imread("img_5.png")
h, w, c = img.shape  # 获取图像的高度、宽度和通道数
src_list = [(81, 325), (105, 580), (590, 340), (480, 110)]

# 在图像上标出四个点
for i, pt in enumerate(src_list):
    cv2.circle(img, pt, 5, (0, 0, 255), -1)
    cv2.putText(img, str(i+1), (pt[0]+5, pt[1]+10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

# 将挑选的四个点转换为NumPy数组
pts1 = np.float32(src_list)

# 选择目标图像上的四个点
pts2 = np.float32([[0, 0], [0, w - 2], [h - 2, w - 2], [h - 2, 0]])

# 计算透视变换矩阵
matrix = cv2.getPerspectiveTransform(pts1, pts2)

# 应用透视变换
result = cv2.warpPerspective(img, matrix, (w, h))  # 修正图像大小

# 显示原始图像、透视变换前后的图像
cv2.imshow("Original Image with Selected Points", img)
cv2.imshow("Perspective Transformation", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

小结

使用OpenCV中的透视变换的基本步骤:

找到四个特定的点:

在原始图像中选择四个特定的点,这四个点对应于一个矩形或者平行四边形在真实场景中的投影。

计算透视变换矩阵:

利用这四个点的映射关系,计算透视变换矩阵。OpenCV提供了 cv2.getPerspectiveTransform 函数来实现这一步骤。

应用透视变换:

利用计算得到的透视变换矩阵,对整个图像进行透视变换。OpenCV提供了 cv2.warpPerspective 函数用于执行透视变换。

相关推荐
董厂长1 小时前
langchain :记忆组件混淆概念澄清 & 创建Conversational ReAct后显示指定 记忆组件
人工智能·深度学习·langchain·llm
亿牛云爬虫专家1 小时前
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
分布式·python·架构·kubernetes·爬虫代理·监测·采集
董董灿是个攻城狮4 小时前
5分钟搞懂什么是窗口注意力?
算法
Dann Hiroaki4 小时前
笔记分享: 哈尔滨工业大学CS31002编译原理——02. 语法分析
笔记·算法
G皮T4 小时前
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析
人工智能·chatgpt·llm·大语言模型·deepseek·deepseek-v3·deepseek-r1
九年义务漏网鲨鱼4 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
元宇宙时间5 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享5 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾5 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性
老任与码5 小时前
Spring AI Alibaba(1)——基本使用
java·人工智能·后端·springaialibaba