Python----计算机视觉处理(Opencv:ROI图像切割)

ROI切割

ROI:Region of Interest,翻译过来就是感兴趣的区域。比如对于一个人的照片,假如我 们要检测眼睛,因为眼睛肯定在脸上,所以我们感兴趣的只有脸这部分,其他都不care,所以可以单独 把脸截取出来,这样就可以大大节省计算量,提高运行速度。

我们在使用OpenCV进行读取图像时,图像数据会被存储为Numpy数组,这也意味着我们可以使用Numpy数组的一些操作来对图像数据进行处理,比如切片是 基于Numpy数组的切片操作来完成的,因此在对应的组件中就需要填我们要切割的ROI区域的坐标来完 成ROI切割操作。

注意:

在OpenCV中,坐标的x轴的正方向是水平向右,y轴的正方向是垂直向下,与数学上的二维坐标 并不相同。

在计算机视觉中,当我们使用OpenCV读取RGB三通道图像时,它会被转换成一个三维的Numpy数组。 这个数组里的每个元素值都表示图像的一个像素值。这个三维数组的第一个维度(即轴0)通常代表图像 的高度,第二个维度(即轴1)代表图像的宽度,而第三个维度(即轴2)代表图像的三个颜色通道 (B、G、R,OpenCV读取到的图像以BGR的方式存储)所对应的像素值。

因此,我们可以通过指定切片的范围来选择特定的高度和宽度区域。

这样,我们就能够获取这个区域内 的所有像素值,即得到了这个区域的图像块,通过Numpy的切片操作,我们就完成了ROI切割的操作。 这种提取ROI的方法允许我们仅获取感兴趣区域内的像素,而忽略其他不相关的部分,从而大大减少数 据处理和存储的负担。

导入模块

python 复制代码
import cv2

读取图像

python 复制代码
img=cv2.imread('lena.png')

获取np图像形状

python 复制代码
img_shape=img.shape
h,w,_=img_shape

设置切割范围

python 复制代码
x_min, x_max = 190, 330
y_min, y_max = 170, 355

对切割区域进行框选

python 复制代码
img_rect=cv2.rectangle(img,(x_min,y_min),(x_max,y_max),(0,0,255),2)

进行切割操作

python 复制代码
img_roi=img[y_min:y_max,x_min:x_max]

输出图像

python 复制代码
cv2.imshow('img_rect', img_rect)
cv2.imshow('img_roi',img_roi)
cv2.waitKey(0)

完整代码

利用try--except来捕获可能出现的异常

python 复制代码
import cv2  # 导入OpenCV库  

# 读取图像  
img = cv2.imread('lena.png')  

# 获取图像的形状(高、宽、通道数)  
img_shape = img.shape  
h, w, _ = img_shape  # h: 高度, w: 宽度, _: 通道数(我们不需要使用它)  

try:  
    # 定义要绘制的矩形区域的坐标  
    x_min, x_max = 190, 330  # 矩形的横坐标范围  
    y_min, y_max = 170, 355  # 矩形的纵坐标范围  

    # 检查定义的坐标是否在图像范围内  
    if not (x_min >= 0 and x_max <= w and y_min >= 0 and y_max <= h):  
        raise OverflowError('over')  # 如果超出范围,抛出异常  

    # 在图像上绘制矩形,颜色为红色(0,0,255),线宽为2  
    img_rect = cv2.rectangle(img, (x_min, y_min), (x_max, y_max), (0, 0, 255), 2)  

    # 从图像中提取感兴趣区域(ROI)  
    img_roi = img[y_min:y_max, x_min:x_max]  

    # 显示绘制了矩形的图像  
    cv2.imshow('img_rect', img_rect)  

    # 显示提取的ROI  
    cv2.imshow('img_roi', img_roi)  

    # 等待用户按键后关闭窗口  
    cv2.waitKey(0)  

except Exception as e:  
    # 捕捉并打印异常信息  
    print(e)  

库函数

cv2.rectangle()

python 复制代码
cv.rectangle(	img, pt1, pt2, color[, thickness[, lineType[, shift]]]	) ->	img
cv.rectangle(	img, rec, color[, thickness[, lineType[, shift]]]	) ->	img

| 函数 | 描述 |
| img | 图像。 |
| pt1 | 矩形的顶点。 |
| pt2 | 与 pt1 相对的矩形的顶点。 |
| color | 矩形颜色或亮度(灰度图像)。 |
| thickness | 构成矩形的线条的粗细。负值(如 FILLED)表示函数必须绘制填充矩形 -1表示实心 1,2,...表示线的粗细 |
| lineType | 线路的类型。 |

shift 点坐标中的小数位数。
相关推荐
老胖闲聊3 小时前
Python Copilot【代码辅助工具】 简介
开发语言·python·copilot
Blossom.1183 小时前
使用Python和Scikit-Learn实现机器学习模型调优
开发语言·人工智能·python·深度学习·目标检测·机器学习·scikit-learn
曹勖之3 小时前
基于ROS2,撰写python脚本,根据给定的舵-桨动力学模型实现动力学更新
开发语言·python·机器人·ros2
DFminer4 小时前
【LLM】fast-api 流式生成测试
人工智能·机器人
lyaihao4 小时前
使用python实现奔跑的线条效果
python·绘图
郄堃Deep Traffic5 小时前
机器学习+城市规划第十四期:利用半参数地理加权回归来实现区域带宽不同的规划任务
人工智能·机器学习·回归·城市规划
ai大师5 小时前
(附代码及图示)Multi-Query 多查询策略详解
python·langchain·中转api·apikey·中转apikey·免费apikey·claude4
GIS小天5 小时前
AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月7日第101弹
人工智能·算法·机器学习·彩票
小小爬虾5 小时前
关于datetime获取时间的问题
python
阿部多瑞 ABU5 小时前
主流大语言模型安全性测试(三):阿拉伯语越狱提示词下的表现与分析
人工智能·安全·ai·语言模型·安全性测试