13-图像的透视

复制代码

   在对图像进行操作的过程中，经常会遇到要将图像进行透视操作的情况。使用 OpenCV 提供的 cv2.warpPerspective()函数实现将一张图像进行透视操作，在此过程中使用 cv2.getPerspectiveTransfom()函数生成透视转换矩阵。

原始图像：

代码：

python 复制代码

import cv2
import numpy as np
tree = cv2.imread('images/tree.jpg')
rows ,cols = tree.shape[:2]
# 设置变换矩阵: 4个点,分别是源图像的左上、右上、左下、右下
p1 = np.float32([[0,0],[cols,0],[0,rows],[cols,rows]])
# 设置变换矩阵: 4个点,分别是目标图像的左上、右上、左下、右下
p2 = np.float32([[0,0],[cols-50,rows/2-50],[0,rows],[cols-50,rows/2+50]])
# 获取透视变换矩阵
M = cv2.getPerspectiveTransform(p1,p2)
rst = cv2.warpPerspective(tree,M,(cols,rows))
cv2.imshow('tree',tree)
cv2.imshow('rst',rst)
cv2.waitKey(0)
cv2.destroyAllWindows()

相关技术及概念：

图像的透视来原于绘画理论，指在平面或曲面上描绘物体的空间关系的方法或技术。例如我们通常所说的"近大远小"就是透视技术的一种，如图所示。具体实现方式就是通过透视变换将某一矩形映射为任意四边形。

语法格式：

透视变换通过函数 cv2.warpPerspective()实现，该函数的语法是: dst=cv2.warpPerspective(src,M,dsize[,flags[,borderMode[, borderValue]]])

dst 代表透视处理后的输出图像，该图像和原始图像具有相同的类型。
dsize 决定输出图像的实际大小。
src 代表要透视的图像。
M 代表一个 3X3 的变换矩阵。
dsize 代表输出图像的尺寸大小。
flags 代表插值方法，默认为 INTER_LINEAR.当该值为 WARP_INVERSE MAP 时，意味着 M是逆变换类型，能实现从目标图像 dst 到原始图像 src 的逆变换。
borderMode 代表边类型，默认为 BORDER_CONSTANT。当该值为 BORDER
TRANSPRENT 时，意味着目标图像内的值不做改变，这些值对应原始图像内的异常值。
borderValue 代表边界值，默认是 0。

透视变换矩阵：

与仿射变换类似，同样可以使用一个函数来生成 cv2.warpPerspective()所使用的转换矩阵。

语法格式：

retval=cv2.getPerspectiveTransform( src, dst )

src 代表输入图像的四个顶点的坐标。
dst 代表输出图像的四个顶点的坐标。
需要注意的是，src 参数和 dst 参数是包含四个点的数组，与仿射变换函数 cv2. getAffineTransform()中的三个点是不同的。实际使用中，我们可以根据需要控制 src 中的四个点映射到 dst 中的四个点。