OpenCV 4基础篇| OpenCV图像的裁切

目录

  • [1. Numpy切片](#1. Numpy切片)
    • [1.1 注意事项](#1.1 注意事项)
    • [1.2 代码示例](#1.2 代码示例)
  • [2. cv2.selectROI()](#2. cv2.selectROI())
    • [2.1 语法结构](#2.1 语法结构)
    • [2.2 注意事项](#2.2 注意事项)
    • [2.3 代码示例](#2.3 代码示例)
  • [3. Pillow.crop](#3. Pillow.crop)
    • [3.1 语法结构](#3.1 语法结构)
    • [3.2 注意事项](#3.2 注意事项)
    • [3.3 代码示例](#3.3 代码示例)
  • [4. 扩展示例:单张大图裁切成多张小图](#4. 扩展示例:单张大图裁切成多张小图)
  • [5. 总结](#5. 总结)

1. Numpy切片

语法结构:

csharp 复制代码
retval = img[y:y+h, x:x+w] #对图像 img 裁剪并返回指定的矩阵区域图像。
  • img:图像数据,nparray 多维数组
  • x, y:整数,像素值,裁剪矩形区域左上角的坐标值
  • w, h:整数,像素值,裁剪矩形区域的宽度、高度
  • retval:裁剪后获得的 OpenCV 图像,nparray 多维数组

1.1 注意事项

  • Numpy 多维数组的切片是原始数组的浅拷贝,切片修改后原始数组也会改变。推荐采用 .copy() 进行深拷贝,得到原始图像的副本。
  • Numpy 数组切片,当上界或下界为数组边界时可以省略,如:img[y:, :x] 表示高度方向从 y 至图像底部(像素ymax),宽度方向从图像左侧(像素 0)至 x。

1.2 代码示例

csharp 复制代码
import cv2

imgFile = "./img/lena.jpg"
img1 = cv2.imread(imgFile, flags=1)  # flags=1 读取彩色图像(BGR)
xmin, ymin, w, h = 200, 200, 200, 200  # 矩形裁剪区域 (ymin:ymin+h, xmin:xmin+w) 的位置参数
imgCrop = img1[ymin:ymin + h, xmin:xmin + w].copy()  # 切片获得裁剪后保留的图像区域
cv2.imshow("CropDemo", imgCrop)  # 在窗口显示 彩色随机图像
cv2.waitKey(0)
cv2.destroyAllWindows()

2. cv2.selectROI()

2.1 语法结构

csharp![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/73651873cd4c48c1b36a49b34b389890.png#pic_center) 复制代码
cv2.selectROI(windowName, img, showCrosshair=None, fromCenter=None):#可以通过鼠标选择感兴趣的矩形区域(ROI)
  • windowName:选择的区域被显示在的窗口的名字
  • img:要在什么图片上选择ROI
  • showCrosshair:是否在矩形框里画十字线.
  • fromCenter:是否是从矩形框的中心开始画

2.2 注意事项

  • 由于 cv2.selectROI 是一个交互式的函数,它可能不适合用于自动化脚本或没有图形用户界面的环境。在这种情况下,你可能需要寻找其他方法来选择图像中的 ROI,例如使用固定坐标、图像分割算法等。

2.3 代码示例

csharp 复制代码
import cv2

imgFile = "img/lena.jpg"  
img1 = cv2.imread(imgFile, flags=1)  # flags=1 读取彩色图像(BGR)
roi = cv2.selectROI(img1, showCrosshair=True, fromCenter=False)
xmin, ymin, w, h = roi  # 矩形裁剪区域 (ymin:ymin+h, xmin:xmin+w) 的位置参数
imgROI = img1[ymin:ymin + h, xmin:xmin + w].copy()  # 切片获得裁剪后保留的图像区域
cv2.imshow("RIODemo", imgROI)
cv2.waitKey(0)
cv2.destroyAllWindows()

3. Pillow.crop

3.1 语法结构

csharp![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/73651873cd4c48c1b36a49b34b389890.png#pic_center) 复制代码
retval = Image.crop(left, up, right, lower) 
  • left: 整数,表示裁剪区域左上角的 x 坐标。
  • up:整数,表示裁剪区域左上角的 y 坐标。
  • right:整数,表示裁剪区域右下角的 x 坐标。这个值通常大于 left。
  • below:整数,表示裁剪区域右下角的 y 坐标。这个值通常大于 upper。
  • retval:一个新的 Image 对象,原始图像中被裁剪出来的矩形区域

3.2 注意事项

  • crop()函数接受一个包含四个数字的元组参数,表示裁剪区域的左上角和右下角的坐标。这个元组的格式是(left, upper, right, lower),其中left和upper是裁剪区域的左上角坐标,right和lower是右下角坐标。坐标的原点(0,0)通常在图像的左上角。
  • Pillow库使用坐标系的原点在左上角,x轴向右增加,y轴向下增加。这与一些其他图像处理库(如OpenCV)的坐标系原点在左下角的约定不同,需要注意坐标的顺序和方向。
  • 裁剪区域的坐标必须在图像的边界内。如果裁剪区域的坐标超出了图像的边界,将会引发一个ValueError异常。因此,在调用crop()函数之前,最好先检查裁剪区域的坐标是否有效。
  • crop()函数不会修改原始图像,而是返回一个新的裁剪后的图像对象。原始图像保持不变,如果需要保存裁剪后的图像,需要将其保存到文件或进行其他操作。

3.3 代码示例

csharp 复制代码
from PIL import Image
import matplotlib.pyplot as plt

imgFile = "./img/lena.jpg"
img = Image.open(imgFile)  # W*H
plt.rcParams['font.sans-serif'] = ['FangSong']  # 支持中文标签
plt.subplot(221), plt.title("原图"), plt.axis('off')
plt.imshow(img)  
img_c = img.crop([img.size[0] / 4, img.size[1] / 4, img.size[0] * 3 / 4, img.size[1] * 3 / 4])
plt.rcParams['font.sans-serif'] = ['FangSong']  # 支持中文标签
plt.subplot(222), plt.title("裁切之后"), plt.axis('off')
plt.imshow(img_c)  
plt.show()

4. 扩展示例:单张大图裁切成多张小图

csharp 复制代码
from PIL import Image

imgFile = "./img/lena.jpg"
img = Image.open(imgFile)
size = img.size
print(size)
# 准备将图片切割成9张小图片
weight = int(size[0] // 3)
height = int(size[1] // 3)
# 切割后的小图的宽度和高度
print(weight, height)
for j in range(3):
    for i in range(3):
        box = (weight * i, height * j, weight * (i + 1), height * (j + 1))
        region = img.crop(box)
        region.save('{}{}.png'.format(j, i))

5. 总结

  • Numpy切片和Pillow.crop()都是非交互式的裁剪方法,适用于在代码中直接指定裁剪区域。
  • cv2.selectROI()是一个交互式的裁剪方法,允许用户通过图形界面选择ROI。
相关推荐
onejason2 分钟前
《利用 Python 爬虫获取 Amazon 商品详情实战指南》
前端·后端·python
aneasystone本尊27 分钟前
学习 Coze Studio 的工作流执行逻辑
人工智能
aneasystone本尊35 分钟前
再学 Coze Studio 的智能体执行逻辑
人工智能
苏婳66636 分钟前
【最新版】怎么下载mysqlclient并成功安装?
数据库·python·mysql
xuanwuziyou38 分钟前
LangChain 多任务应用开发
人工智能·langchain
新智元1 小时前
一句话,性能暴涨 49%!马里兰 MIT 等力作:Prompt 才是大模型终极武器
人工智能·openai
猫头虎1 小时前
猫头虎AI分享|一款Coze、Dify类开源AI应用超级智能体Agent快速构建工具:FastbuildAI
人工智能·开源·github·aigc·ai编程·ai写作·ai-native
0wioiw01 小时前
Python基础(Flask①)
后端·python·flask
新智元1 小时前
AI 版华尔街之狼!o3-mini 靠「神之押注」狂赚 9 倍,DeepSeek R1 最特立独行
人工智能·openai
天下弈星~1 小时前
GANs生成对抗网络生成手写数字的Pytorch实现
人工智能·pytorch·深度学习·神经网络·生成对抗网络·gans