轻松掌握opencv的8种图像变换

文章目录

  • opencv的8种图像变换
    • [1. 图像放大、缩小](#1. 图像放大、缩小)
    • [2. 图像平移](#2. 图像平移)
    • [3. 图像旋转](#3. 图像旋转)
    • [4. 图像仿射变换](#4. 图像仿射变换)
    • [5. 图像裁剪](#5. 图像裁剪)
    • [6. 图像的位运算(AND, OR, XOR)](#6. 图像的位运算(AND, OR, XOR))
    • [7. 图像的分离和融合](#7. 图像的分离和融合)
    • [8. 图像的颜色空间](#8. 图像的颜色空间)

opencv的8种图像变换

1. 图像放大、缩小

我们先看下原图

import cv2

import matplotlib.pyplot as plt

import numpy as np

img = cv2.imread('image/logo.png')

plt.imshow(img)

看下图像大小

#height,width, channel

height,width,channel = img.shape

图像放大缩小

使用cv2.resize()方法

cv2.resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None)

参数解释

dsize形参是个数组,数组的宽度在前,高度在后(output_width,output_height)

图像缩放之后,肯定像素要进行重新计算的,就靠这个参数来指定重新计算像素的方式,有以下几种:

INTER_NEAREST - 最近邻插值

INTER_LINEAR - 双线性插值,如果最后一个参数你不指定,默认使用这种方法

INTER_CUBIC - 4x4像素邻域内的双立方插值

INTER_LANCZOS4 - 8x8像素邻域内的Lanczos插值

#图像放大

resized_img = cv2.resize(img,(width2,height 2),interpolation=cv2.INTER_LINEAR)

plt.imshow(resized_img)

看下此时图像大小,确守放大了1倍

图像缩小

#图像缩小

smaller_img = cv2.resize(img,None,fx=0.5,fy=0.5,interpolation=cv2.INTER_LINEAR)

plt.imshow(smaller_img)

可以看到图像缩小了一倍

2. 图像平移

warpAffine(src, M, dsize, dst=None, flags=None, borderMode=None, borderValue=None)

src:输入图像

M:运算矩阵,2行3列的,数据类型要求是float32位及以上

dsize:运算后矩阵的大小,也就是输出图片的尺寸。是个元祖,宽度在前,高度在后

dst:输出图像

flags:插值方法的组合,与resize函数中的插值一样,可以查看cv2.resize

borderMode:像素外推方法,边界像素的模型( int 类型),详情参考官网

borderValue:在恒定边框的情况下使用的borderValue值; 边界填充的颜色, 默认为 (0, 0, 0) (黑色)

图像平移

#图像平移

#先获取原来的高和宽

height,width = img.shape[:2]

M = np.float32([[1,0,20],[0,1,10]]) #图像平移。向右平移20个像素,向下平移10个像素

move_img = cv2.warpAffine(img,M,(width,height))

我们详细分析下M这个矩阵

下面的M相当于就是一个运算矩阵。2行3列

根据定义,我们的坐标就可以根据A,B来进行运算

可以很轻易的得出以下方程

通过方程我们就可以很轻易的看出,c1和c2就相当于是让图像平移,而a和b这2个参数就是对图像进行旋转,缩放等操作。

对图片进行三维旋转

#图像旋转

#先获取原来的高和宽

height,width = img.shape[:2]

M = np.float32([[1,0.2,0],[0.2,1,0]]) #图像平移。向右平移20个像素,向下平移10个像素

scoll_img = cv2.warpAffine(img,M,(width,height))

plt.imshow(scoll_img)

3. 图像旋转

  1. rot_mat = cv2.getRotationMatrix2D(center, -5, 1)

参数说明:center表示中间点的位置,-5表示顺时针旋转5度,1表示进行等比列的缩放

  1. cv2.warpAffine(img, rot_mat, (img.shape[1], img.shape[0]))

参数说明: img表示输入的图片,rot_mat表示仿射变化矩阵,(image.shape[1], image.shape[0])表示变换后的图片大小

#先获取原来的高和宽

height,width = img.shape[:2]

#设置旋转的中心

center = (width //2.0, height//2.0) #旋转中心

M2 = cv2.getRotationMatrix2D(center,180,1) #1表示旋转过程中有没缩放,180表示逆时针旋转,负数表示顺时针旋转

rotation_img = cv2.warpAffine(img,M2,(width,height))

plt.imshow(rotation_img)

等比例旋转180

4. 图像仿射变换

对于更复杂仿射变换,OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。

该函数的语法格式为:

retval=cv2.getAffineTransform(src, dst)

src代表输入图像的三个点坐标。

dst代表输出图像的三个点坐标。

参数值src和dst是包含三个一维数组(x, y)点的二维数组。

指代原始图像和目标图像内平行四边形的三个顶点(左上角、右上角、左下角)

上述参数通过函数cv2.getAffineTransform()定义了两个平行四边形。

src和dst中的三个点分别对应平行四边形的左上角、右上角、左下角三个点。

函数cv2.warpAffine()以函数cv2.getAffineTransform()获取的转换矩阵M为参数,将src中的点仿射到dst中。

函数cv2.getAffineTransform()对所指定的点完成映射后,将所有其他点的映射关系按照指定点的关系计算确定。

#图像仿射变换

p1 = np.float32([[120,35],[215,45],[135,120]])

p2 = np.float32([[135,45],[300,110],[130,230]])

M3 = cv2.getAffineTransform(p1,p2) #计算一个变换矩阵

trans_img = cv2.warpAffine(img,M3,(width,height))

plt.imshow(trans_img)

5. 图像裁剪

#图像剪裁,裁剪像素范围

crop_img = img[20:100,20:40]

plt.imshow(crop_img)

6. 图像的位运算(AND, OR, XOR)

位运算都是针对多张图形来计算的

我们先创建两个图形

绘制长方形

#长方形

rectangle = np.zeros((300,300),dtype='uint8')

rect_img = cv2.rectangle(rectangle,(25,25),(275,275),255,-1)

cv2.rectangle(img, pt1, pt2, color, thickness, lineType, shift )

参数表示依次为: (图片,长方形框左上角坐标, 长方形框右下角坐标, 字体颜色,字体粗细)

plt.imshow(rect_img)

画布画圆

circle(img, center, radius, color, thickness=None, lineType=None, shift=None):

含义:图片,中心店,半径,颜色,圆轮廓粗细,线类型。

#画圆

rectangle = np.zeros((300,300),dtype='uint8')

circle_img = cv2.circle(rectangle,(150,150),150,255,-1)

plt.imshow(circle_img)

#与运算

and_img = cv2.bitwise_and(rect_img,circle_img)

plt.imshow(and_img)

可见两张图重合的部分被画出

#或运算 OR

or_img = cv2.bitwise_or(rect_img,circle_img)

plt.imshow(or_img)

#异或运算 XOR

两张图片不重叠的部分

xor_img = cv2.bitwise_xor(rect_img,circle_img)

plt.imshow(xor_img)

7. 图像的分离和融合

#图像的分离

B,G,R = cv2.split(img)

plt.imshow(B)

plt.imshow(G)

plt.imshow®

在使用opencv和matplotlib的过程中会遇到图像反色或者生成的是伪彩色图像的问题,

原因是两个读取RGB通道的顺序是不一样的,opencv的顺序是B-G-R,而matplotlib的顺序是R-G-B,所以这个区分就会产生一些矛盾。

图像合并

matplotlib这样显示才是正常颜色

plt.imshow(cv2.merge([R,G,B]))

对比下直接用matplotlib和cv2的显示

8. 图像的颜色空间

#颜色空间

#灰度

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

plt.imshow(gray)

#HSV(色度,饱和度,纯度)

hsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

plt.imshow(hsv)

#lab

lab = cv2.cvtColor(img,cv2.COLOR_BGR2LAB)

plt.imshow(lab)

相关推荐
这里有鱼汤12 分钟前
小白必看:QMT里的miniQMT入门教程
后端·python
Baihai_IDP23 分钟前
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
人工智能·面试·llm
大模型真好玩1 小时前
大模型工程面试经典(七)—如何评估大模型微调效果?
人工智能·面试·deepseek
黎燃9 小时前
短视频平台内容推荐算法优化:从协同过滤到多模态深度学习
人工智能
TF男孩10 小时前
ARQ:一款低成本的消息队列,实现每秒万级吞吐
后端·python·消息队列
飞哥数智坊11 小时前
多次尝试用 CodeBuddy 做小程序,最终我放弃了
人工智能·ai编程
后端小肥肠11 小时前
别再眼馋 10w + 治愈漫画!Coze 工作流 3 分钟出成品,小白可学
人工智能·aigc·coze
唐某人丶14 小时前
教你如何用 JS 实现 Agent 系统(2)—— 开发 ReAct 版本的“深度搜索”
前端·人工智能·aigc
FIT2CLOUD飞致云14 小时前
九月月报丨MaxKB在不同规模医疗机构的应用进展汇报
人工智能·开源
阿里云大数据AI技术14 小时前
【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Next系列模型
人工智能