《OpenCV 图像缩放、翻转与变换全攻略:从基础操作到高级应用实战》

简介:本文详细阐述了 OpenCV 在图像操作中的关键技术,包括缩放(确定尺寸缩放与按比例缩放)、翻转(沿不同轴的翻转方式)以及变换(平移、旋转、三点确定变换和四点确定变换即透视变换)。通过代码示例与直观图示,深入讲解了各操作的实现原理与具体应用,如如何将图片缩放至相同大小后加权、不同翻转方式的视觉效果、利用矩阵进行仿射与透视变换实现图像平移、旋转及特定形状变换等,为读者全面掌握 OpenCV 图像操作技巧提供丰富参考与实用指南。如果您觉得我的文章对您有帮助,希望可以得到您的点赞、收藏、关注和评论

《OpenCV 图像缩放、翻转与变换全攻略:从基础操作到高级应用实战》

  • 1 缩放
    • 1.1 确定的缩放尺寸
    • 1.2 按比例缩放
  • 2 翻转
  • 3 变换(难点)
    • 3.1 平移
    • 3.2 旋转
    • 3.3三点确定变换
    • 3.4 四点确定变换(透视)
  • 致谢

1 缩放

1.1 确定的缩放尺寸

这是我的文件结构:

我希望让两张图片缩放成相同大小,所以可以从一张图片的shape中取出宽高然后传参给 cv2.resize函数,然后相同大小的图片进行加权。

python 复制代码
import numpy as np
import cv2
red = cv2.imread("pig.jpg")
blue = cv2.imread("blue_pig.JPG")
height,width,channel = red.shape
blue = cv2.resize(blue,(width,height))
add_Image = cv2.addWeighted(blue,0.7,red,0.4,gamma=1)
cv2.imshow("addWeighted_image",add_Image)
cv2.waitKey()
cv2.destroyAllWindows()

1.2 按比例缩放

python 复制代码
import numpy as np
import cv2 
red = cv2.imread("pig.jpg")
print(red.shape)
reshape_red = cv2.resize(red,dsize = None,fx = 3,fy=0.6)
print(reshape_red.shape)

宽度变为原来的三倍,高度变为原来的0.6倍
这里要强调一个问题,当你决定用fx 或者fy 倍数方式实现缩放的时候,你必须要要给dsize参数赋值:None,不然会报错

2 翻转

cv2.flip(原始图像,翻转方式)

翻转方式分为三种:

  1. 0 代表沿着x轴翻转
  2. 正数代表沿着y轴翻转
  3. 复数代表沿着x,y同时翻转
    下面还是导入pig.jpg,然后在这个案例上进行翻转:
python 复制代码
import numpy as np
import cv2 
red = cv2.imread("pig.jpg")
x_red = cv2.flip(red,0)
y_red = cv2.flip(red,5)
x_y_red = cv2.flip(red,-3)
cv2.imshow("original",red)
cv2.imshow("x_flip",x_red)
cv2.imshow("y_flip",y_red)
cv2.imshow("x_and_y_flip",x_y_red)
cv2.waitKey()
cv2.destroyAllWindows()](https://i-blog.csdnimg.cn/direct/68ac93d04db649e691a47862b189cb7a.png)

3 变换(难点)

(学前提醒:这里的东西有一点点难,但是没有大碍,基础的理论解释你可能看不懂,看不懂就往后看,后面的案例看懂了,再回来看前面就轻而易举了。)

他是通过一个矩阵进行仿射变换

dst(x,y) = src(M11x+M12y+M13,M21x+M22y+M23)

公式看着很烦,我把这个公式说成人话

变换后的坐标 的 横坐标 = 矩阵的这些位置的元素与xy相乘,相加的结果:M11x+M12y+M13

变换后的坐标 的 纵坐标 = 矩阵的这些位置的元素与xy相乘,相加的结果:M21x+M22y+M23

记不住没关系,你要是记得住走近科学就该观察你了,北京动物园我们就得买门票看你去了,大家不要急稍安勿躁看后面的案例,这玩意也没什么含义,重要的是知道怎么用,我会在3.1讲平移 3.2讲旋转 3.3讲复杂变换

3.1 平移

想要实现平移效果,该这样去设计矩阵

dst(x,y) = src(M11x+M12y+M13,M21x+M22y+M23)

M11 = 1 M12 = 0 M13 = 横坐标平移距离

M12 = 0 M22 = 1 M23 = 纵坐标平移距离

为什么这么设计呢?我们要知其然还得知其所以然,因为横坐标 = 原来的x +平移距离 ,这是平移,所以就得把 y的系数设置为0 x的系数设置为1,剩下一个x轴平移距离

纵坐标 = y +平移距离 ,所以就得把x的系数设置为0 y = 系数设置为1 ,剩下一个y轴平移距离

这下理解了吧?记不住没关系,点赞收藏一下我的文章,啥时候用到啥时候查。

我们下面看一个代码案例,还是用猪猪侠的图片pig.jpg:

python 复制代码
import numpy as np
import cv2 
red = cv2.imread("pig.jpg")
height,width,channel = red.shape
x_move = 100
y_move = 100
M = np.float32([[1,0,x_move],[0,1,y_move]])
move = cv2.warpAffine(red,M,(width,height))
cv2.imshow("original",red)
cv2.imshow("move_x_100_y_100",move)
cv2.waitKey()
cv2.destroyAllWindows()

3.2 旋转

先学一个制作M矩阵的函数

cv2.getRotationMatrix2D(中心点坐标center,旋转角度angle,大小缩放倍数scale)

要先调用它去制作M矩阵才能使用cv2.warpAffine达到旋转的效果

设置中心点为图片的中心,所以center = (height/2,width/2)

请看下面的代码:

python 复制代码
import numpy as np
import cv2
red = cv2.imread("pig.jpg")
height,width,channel = red.shape
M = cv2.getRotationMatrix2D((height/2,width/2),45,0.5)
move = cv2.warpAffine(red,M,(width,height))
cv2.imshow("original",red)
cv2.imshow("move_flip",move)
cv2.waitKey()
cv2.destroyAllWindows()

3.3三点确定变换

矩阵M,是通过三点的变换两对np数组,第一个数组是原来的点的坐标,第二个数组是变换后的对应坐标。通过两个数组和cv2.getAffineTransform()获得矩阵M

python 复制代码
import numpy as np
import cv2
red = cv2.imread("pig.jpg")
height,width,channel = red.shape
before = np.float32([[0,0],[width-1,0],[0,height-1]])
after = np.float32([[0,height*0.33],[width*0.85,height*0.25],[width*0.15,height*0.7]])
M = cv2.getAffineTransform(before,after)
move = cv2.warpAffine(red,M,(width,height))

cv2.imshow("original",red)
cv2.imshow("move_flip",move)
cv2.waitKey()
cv2.destroyAllWindows()

3.4 四点确定变换(透视)

使用cv2.getPerspectiveTransform去接收两个四点的np数组获得变换矩阵M

使用cv2.warpPerspective接受矩阵M去进行变换

因为我的pig.jpg图片的size是 (宽度 = 690,高度 = 920)所以我选择如下图的方式变换

python 复制代码
import numpy as np
import cv2
red = cv2.imread("pig.jpg")
height,width,channel = red.shape
before = np.float32([[0,0],[width-1,0],[0,height-1],[width-1,height-1]])
after = np.float32([[300,0],[width-1,0],[0,height-1],[300,height-1]])
M = cv2.getPerspectiveTransform(before,after)
move = cv2.warpPerspective(red,M,(width,height))
cv2.imshow("original",red)
cv2.imshow("move_flip",move)
cv2.waitKey()
cv2.destroyAllWindows()

致谢

本文参考了一些博主的文章,博取了他们的长处,也结合了我的一些经验,对他们表达诚挚的感谢,使我对图像变换 的使用有更深入的了解,也推荐大家去阅读一下他们的文章。纸上学来终觉浅,明知此事要躬行:
OpenCV学习笔记15_仿射变换与透视变换
【OpenCV 例程200篇】29. 图像的翻转(cv2.flip)

相关推荐
QQ同步助手5 分钟前
如何正确使用人工智能:开启智慧学习与创新之旅
人工智能·学习·百度
AIGC大时代8 分钟前
如何使用ChatGPT辅助文献综述,以及如何进行优化?一篇说清楚
人工智能·深度学习·chatgpt·prompt·aigc
流浪的小新13 分钟前
【AI】人工智能、LLM学习资源汇总
人工智能·学习
martian6651 小时前
【人工智能数学基础篇】——深入详解多变量微积分:在机器学习模型中优化损失函数时应用
人工智能·机器学习·微积分·数学基础
人机与认知实验室2 小时前
人、机、环境中各有其神经网络系统
人工智能·深度学习·神经网络·机器学习
黑色叉腰丶大魔王2 小时前
基于 MATLAB 的图像增强技术分享
图像处理·人工智能·计算机视觉
迅易科技5 小时前
借助腾讯云质检平台的新范式,做工业制造企业质检的“AI慧眼”
人工智能·视觉检测·制造
古希腊掌管学习的神6 小时前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI7 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
靴子学长7 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp