轻松掌握opencv的8种图像变换

文章目录

  • opencv的8种图像变换
    • [1. 图像放大、缩小](#1. 图像放大、缩小)
    • [2. 图像平移](#2. 图像平移)
    • [3. 图像旋转](#3. 图像旋转)
    • [4. 图像仿射变换](#4. 图像仿射变换)
    • [5. 图像裁剪](#5. 图像裁剪)
    • [6. 图像的位运算(AND, OR, XOR)](#6. 图像的位运算(AND, OR, XOR))
    • [7. 图像的分离和融合](#7. 图像的分离和融合)
    • [8. 图像的颜色空间](#8. 图像的颜色空间)

opencv的8种图像变换

1. 图像放大、缩小

我们先看下原图

import cv2

import matplotlib.pyplot as plt

import numpy as np

img = cv2.imread('image/logo.png')

plt.imshow(img)

看下图像大小

#height,width, channel

height,width,channel = img.shape

图像放大缩小

使用cv2.resize()方法

cv2.resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None)

参数解释

dsize形参是个数组,数组的宽度在前,高度在后(output_width,output_height)

图像缩放之后,肯定像素要进行重新计算的,就靠这个参数来指定重新计算像素的方式,有以下几种:

INTER_NEAREST - 最近邻插值

INTER_LINEAR - 双线性插值,如果最后一个参数你不指定,默认使用这种方法

INTER_CUBIC - 4x4像素邻域内的双立方插值

INTER_LANCZOS4 - 8x8像素邻域内的Lanczos插值

#图像放大

resized_img = cv2.resize(img,(width2,height 2),interpolation=cv2.INTER_LINEAR)

plt.imshow(resized_img)

看下此时图像大小,确守放大了1倍

图像缩小

#图像缩小

smaller_img = cv2.resize(img,None,fx=0.5,fy=0.5,interpolation=cv2.INTER_LINEAR)

plt.imshow(smaller_img)

可以看到图像缩小了一倍

2. 图像平移

warpAffine(src, M, dsize, dst=None, flags=None, borderMode=None, borderValue=None)

src:输入图像

M:运算矩阵,2行3列的,数据类型要求是float32位及以上

dsize:运算后矩阵的大小,也就是输出图片的尺寸。是个元祖,宽度在前,高度在后

dst:输出图像

flags:插值方法的组合,与resize函数中的插值一样,可以查看cv2.resize

borderMode:像素外推方法,边界像素的模型( int 类型),详情参考官网

borderValue:在恒定边框的情况下使用的borderValue值; 边界填充的颜色, 默认为 (0, 0, 0) (黑色)

图像平移

#图像平移

#先获取原来的高和宽

height,width = img.shape[:2]

M = np.float32([[1,0,20],[0,1,10]]) #图像平移。向右平移20个像素,向下平移10个像素

move_img = cv2.warpAffine(img,M,(width,height))

我们详细分析下M这个矩阵

下面的M相当于就是一个运算矩阵。2行3列

根据定义,我们的坐标就可以根据A,B来进行运算

可以很轻易的得出以下方程

通过方程我们就可以很轻易的看出,c1和c2就相当于是让图像平移,而a和b这2个参数就是对图像进行旋转,缩放等操作。

对图片进行三维旋转

#图像旋转

#先获取原来的高和宽

height,width = img.shape[:2]

M = np.float32([[1,0.2,0],[0.2,1,0]]) #图像平移。向右平移20个像素,向下平移10个像素

scoll_img = cv2.warpAffine(img,M,(width,height))

plt.imshow(scoll_img)

3. 图像旋转

  1. rot_mat = cv2.getRotationMatrix2D(center, -5, 1)

参数说明:center表示中间点的位置,-5表示顺时针旋转5度,1表示进行等比列的缩放

  1. cv2.warpAffine(img, rot_mat, (img.shape[1], img.shape[0]))

参数说明: img表示输入的图片,rot_mat表示仿射变化矩阵,(image.shape[1], image.shape[0])表示变换后的图片大小

#先获取原来的高和宽

height,width = img.shape[:2]

#设置旋转的中心

center = (width //2.0, height//2.0) #旋转中心

M2 = cv2.getRotationMatrix2D(center,180,1) #1表示旋转过程中有没缩放,180表示逆时针旋转,负数表示顺时针旋转

rotation_img = cv2.warpAffine(img,M2,(width,height))

plt.imshow(rotation_img)

等比例旋转180

4. 图像仿射变换

对于更复杂仿射变换,OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。

该函数的语法格式为:

retval=cv2.getAffineTransform(src, dst)

src代表输入图像的三个点坐标。

dst代表输出图像的三个点坐标。

参数值src和dst是包含三个一维数组(x, y)点的二维数组。

指代原始图像和目标图像内平行四边形的三个顶点(左上角、右上角、左下角)

上述参数通过函数cv2.getAffineTransform()定义了两个平行四边形。

src和dst中的三个点分别对应平行四边形的左上角、右上角、左下角三个点。

函数cv2.warpAffine()以函数cv2.getAffineTransform()获取的转换矩阵M为参数,将src中的点仿射到dst中。

函数cv2.getAffineTransform()对所指定的点完成映射后,将所有其他点的映射关系按照指定点的关系计算确定。

#图像仿射变换

p1 = np.float32([[120,35],[215,45],[135,120]])

p2 = np.float32([[135,45],[300,110],[130,230]])

M3 = cv2.getAffineTransform(p1,p2) #计算一个变换矩阵

trans_img = cv2.warpAffine(img,M3,(width,height))

plt.imshow(trans_img)

5. 图像裁剪

#图像剪裁,裁剪像素范围

crop_img = img[20:100,20:40]

plt.imshow(crop_img)

6. 图像的位运算(AND, OR, XOR)

位运算都是针对多张图形来计算的

我们先创建两个图形

绘制长方形

#长方形

rectangle = np.zeros((300,300),dtype='uint8')

rect_img = cv2.rectangle(rectangle,(25,25),(275,275),255,-1)

cv2.rectangle(img, pt1, pt2, color, thickness, lineType, shift )

参数表示依次为: (图片,长方形框左上角坐标, 长方形框右下角坐标, 字体颜色,字体粗细)

plt.imshow(rect_img)

画布画圆

circle(img, center, radius, color, thickness=None, lineType=None, shift=None):

含义:图片,中心店,半径,颜色,圆轮廓粗细,线类型。

#画圆

rectangle = np.zeros((300,300),dtype='uint8')

circle_img = cv2.circle(rectangle,(150,150),150,255,-1)

plt.imshow(circle_img)

#与运算

and_img = cv2.bitwise_and(rect_img,circle_img)

plt.imshow(and_img)

可见两张图重合的部分被画出

#或运算 OR

or_img = cv2.bitwise_or(rect_img,circle_img)

plt.imshow(or_img)

#异或运算 XOR

两张图片不重叠的部分

xor_img = cv2.bitwise_xor(rect_img,circle_img)

plt.imshow(xor_img)

7. 图像的分离和融合

#图像的分离

B,G,R = cv2.split(img)

plt.imshow(B)

plt.imshow(G)

plt.imshow®

在使用opencv和matplotlib的过程中会遇到图像反色或者生成的是伪彩色图像的问题,

原因是两个读取RGB通道的顺序是不一样的,opencv的顺序是B-G-R,而matplotlib的顺序是R-G-B,所以这个区分就会产生一些矛盾。

图像合并

matplotlib这样显示才是正常颜色

plt.imshow(cv2.merge([R,G,B]))

对比下直接用matplotlib和cv2的显示

8. 图像的颜色空间

#颜色空间

#灰度

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

plt.imshow(gray)

#HSV(色度,饱和度,纯度)

hsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

plt.imshow(hsv)

#lab

lab = cv2.cvtColor(img,cv2.COLOR_BGR2LAB)

plt.imshow(lab)

相关推荐
笃励19 分钟前
Java面试题二
java·开发语言·python
infominer27 分钟前
RAGFlow 0.12 版本功能导读
人工智能·开源·aigc·ai-native
涩即是Null29 分钟前
如何构建LSTM神经网络模型
人工智能·rnn·深度学习·神经网络·lstm
本本的小橙子32 分钟前
第十四周:机器学习
人工智能·机器学习
励志成为美貌才华为一体的女子1 小时前
《大规模语言模型从理论到实践》第一轮学习--第四章分布式训练
人工智能·分布式·语言模型
学步_技术1 小时前
自动驾驶系列—自动驾驶背后的数据通道:通信总线技术详解与应用场景分析
人工智能·机器学习·自动驾驶·通信总线
winds~1 小时前
自动驾驶-问题笔记-待解决
人工智能·笔记·自动驾驶
学步_技术1 小时前
自动驾驶系列—LDW(车道偏离预警):智能驾驶的安全守护者
人工智能·安全·自动驾驶·ldw
青云交1 小时前
大数据新视界 --大数据大厂之 Kafka 性能优化的进阶之道:应对海量数据的高效传输
大数据·数据库·人工智能·性能优化·kafka·数据压缩·分区策略·磁盘 i/o
一颗星星辰1 小时前
Python | 第九章 | 排序和查找
服务器·网络·python