在对图像进行操作的过程中,经常会遇到要将图像进行透视操作的情况。使用 OpenCV 提供的 cv2.warpPerspective()函数实现将一张图像进行透视操作,在此过程中使用 cv2.getPerspectiveTransfom()函数生成透视转换矩阵。
原始图像:

代码:
python
import cv2
import numpy as np
tree = cv2.imread('images/tree.jpg')
rows ,cols = tree.shape[:2]
# 设置变换矩阵: 4个点,分别是源图像的左上、右上、左下、右下
p1 = np.float32([[0,0],[cols,0],[0,rows],[cols,rows]])
# 设置变换矩阵: 4个点,分别是目标图像的左上、右上、左下、右下
p2 = np.float32([[0,0],[cols-50,rows/2-50],[0,rows],[cols-50,rows/2+50]])
# 获取透视变换矩阵
M = cv2.getPerspectiveTransform(p1,p2)
rst = cv2.warpPerspective(tree,M,(cols,rows))
cv2.imshow('tree',tree)
cv2.imshow('rst',rst)
cv2.waitKey(0)
cv2.destroyAllWindows()

相关技术及概念:
图像的透视来原于绘画理论,指在平面或曲面上描绘物体的空间关系的方法或技术。例如我们通常所说的"近大远小"就是透视技术的一种,如图所示。具体实现方式就是通过透视变换将某一矩形映射为任意四边形。

语法格式:
透视变换通过函数 cv2.warpPerspective()实现,该函数的语法是: dst=cv2.warpPerspective(src,M,dsize[,flags[,borderMode[, borderValue]]])
-
dst 代表透视处理后的输出图像,该图像和原始图像具有相同的类型。
-
dsize 决定输出图像的实际大小。
-
src 代表要透视的图像。
-
M 代表一个 3X3 的变换矩阵。
-
dsize 代表输出图像的尺寸大小。
-
flags 代表插值方法,默认为 INTER_LINEAR.当该值为 WARP_INVERSE MAP 时, 意味着 M是逆变换类型,能实现从目标图像 dst 到原始图像 src 的逆变换。
-
borderMode 代表边类型,默认为 BORDER_CONSTANT。当该值为 BORDER
-
TRANSPRENT 时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
-
borderValue 代表边界值,默认是 0。
透视变换矩阵:
与仿射变换类似,同样可以使用一个函数来生成 cv2.warpPerspective()所使用的转换矩阵。
语法格式:
retval=cv2.getPerspectiveTransform( src, dst )
- src 代表输入图像的四个顶点的坐标。
- dst 代表输出图像的四个顶点的坐标。
需要注意的是,src 参数和 dst 参数是包含四个点的数组,与仿射变换函数 cv2. getAffineTransform()中的三个点是不同的。实际使用中,我们可以根据需要控制 src 中的四个点映射到 dst 中的四个点。