【python】OpenCV—findContours(4.6)

文章目录

1、功能描述

给出一张仅含有手指的图片,判断图片中有多少根手指

2、代码实现

导入库函数,图像预处理

python 复制代码
import numpy as np
import cv2 as cv
img = cv.imread("./5.png")
mask_img = skinmask(img)
cv.imwrite("mask_img.jpg", mask_img)

其中 def skinmask 实现如下

python 复制代码
def skinmask(img):
    hsvim = cv.cvtColor(img, cv.COLOR_BGR2HSV)
    lower = np.array([0, 48, 80], dtype = "uint8")
    upper = np.array([20, 255, 255], dtype = "uint8")
    skinRegionHSV = cv.inRange(hsvim, lower, upper)
    cv.imwrite("skinRegionHSV.jpg", skinRegionHSV)
    blurred = cv.blur(skinRegionHSV, (2,2))
    ret, thresh = cv.threshold(blurred,0,255,cv.THRESH_BINARY)
    return thresh

先转化为 HSV 彩色模式,然后 cv2.inRange 二值化处理,接着模糊,二值化

skinRegionHSV.jpg

mask_img.jpg

接下里计算轮廓和凸包

python 复制代码
contours, hull = getcnthull(mask_img)

cv.drawContours(img, [contours], -1, (255,255,0), 2)
cv.imwrite("contours.jpg", img)

cv.drawContours(img, [hull], -1, (0, 255, 255), 2)
cv.imwrite("hull.jpg", img)

其中 def getcnthull 实现如下

python 复制代码
def getcnthull(mask_img):
    contours, hierarchy = cv.findContours(mask_img, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
    contours = max(contours, key=lambda x: cv.contourArea(x))
    hull = cv.convexHull(contours)
    return contours, hull

可以看到凸包是通过计算最大面积的轮廓计算得到的

轮廓 contours.jpg

凸包 hull.jpg

接着计算凸缺陷,也即介于凸包和轮廓间的区域

python 复制代码
defects = getdefects(contours)

其中 def getdefects 的实现如下

python 复制代码
def getdefects(contours):
    hull = cv.convexHull(contours, returnPoints=False)
    defects = cv.convexityDefects(contours, hull)
    return defects

遍历凸缺陷,计算角度,判断是否为手指夹缝,输出手指个数

python 复制代码
if defects is not None:
    cnt = 0
    for i in range(defects.shape[0]):  # calculate the angle
        s, e, f, d = defects[i][0]
        start = tuple(contours[s][0])
        end = tuple(contours[e][0])
        far = tuple(contours[f][0])
        a = np.sqrt((end[0] - start[0]) ** 2 + (end[1] - start[1]) ** 2)
        b = np.sqrt((far[0] - start[0]) ** 2 + (far[1] - start[1]) ** 2)
        c = np.sqrt((end[0] - far[0]) ** 2 + (end[1] - far[1]) ** 2)
        angle = np.arccos((b ** 2 + c ** 2 - a ** 2) / (2 * b * c))  #      cosine theorem
        if angle <= np.pi / 2:  # angle less than 90 degree, treat as fingers
            cnt += 1
            cv.circle(img, far, 4, [0, 0, 255], -1)
    if cnt > 0:
        cnt = cnt+1
    cv.putText(img, str(cnt), (0, 50), cv.FONT_HERSHEY_SIMPLEX,1, (255, 0, 0) , 2, cv.LINE_AA)
cv.imshow("img", img)
cv.imwrite(f"result_{str(cnt)}.jpg", img)
cv.waitKey()
cv.destroyAllWindows()

其中 angle 的计算原理如下

当然仔细看代码这图和代码中对应的字母有差异,代码中 start 到 end 是 a 对应上图的 c,代码中 start 到 far 和 end 到 far 为 b 和 c 对应上图的 a 和 b,

小于 90 度我们才认为是手指

3、效果展示

5 根手指

输入

输出

4 根手指

3 根手指


2 根手指

1 根手指


翻车

可以看到几个缺点

十分依赖前处理,前处理不行,轮廓不对,后续结果判断则会相应的出现问题

只有一个手指的时候,或者握拳的时候,这套流程应该是判断不出来有几根手指的

4、完整代码

python 复制代码
import cv2
import numpy as np
import cv2 as cv

def skinmask(img):
    hsvim = cv.cvtColor(img, cv.COLOR_BGR2HSV)
    lower = np.array([0, 48, 80], dtype = "uint8")
    upper = np.array([20, 255, 255], dtype = "uint8")
    skinRegionHSV = cv.inRange(hsvim, lower, upper)
    cv.imwrite("skinRegionHSV.jpg", skinRegionHSV)
    blurred = cv.blur(skinRegionHSV, (2,2))
    ret, thresh = cv.threshold(blurred,0,255,cv.THRESH_BINARY)
    return thresh

def getcnthull(mask_img):
    contours, hierarchy = cv.findContours(mask_img, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
    contours = max(contours, key=lambda x: cv.contourArea(x))
    hull = cv.convexHull(contours)
    return contours, hull

def getdefects(contours):
    hull = cv.convexHull(contours, returnPoints=False)
    defects = cv.convexityDefects(contours, hull)
    return defects

img = cv.imread("./5.png")
mask_img = skinmask(img)
cv.imwrite("mask_img.jpg", mask_img)

contours, hull = getcnthull(mask_img)

cv.drawContours(img, [contours], -1, (255,255,0), 2)
cv.imwrite("contours.jpg", img)

cv.drawContours(img, [hull], -1, (0, 255, 255), 2)
cv.imwrite("hull.jpg", img)

defects = getdefects(contours)

if defects is not None:
    cnt = 0
    for i in range(defects.shape[0]):  # calculate the angle
        s, e, f, d = defects[i][0]
        start = tuple(contours[s][0])
        end = tuple(contours[e][0])
        far = tuple(contours[f][0])
        a = np.sqrt((end[0] - start[0]) ** 2 + (end[1] - start[1]) ** 2)
        b = np.sqrt((far[0] - start[0]) ** 2 + (far[1] - start[1]) ** 2)
        c = np.sqrt((end[0] - far[0]) ** 2 + (end[1] - far[1]) ** 2)
        angle = np.arccos((b ** 2 + c ** 2 - a ** 2) / (2 * b * c))  #      cosine theorem
        if angle <= np.pi / 2:  # angle less than 90 degree, treat as fingers
            cnt += 1
            cv.circle(img, far, 4, [0, 0, 255], -1)
    if cnt > 0:
        cnt = cnt+1
    cv.putText(img, str(cnt), (0, 50), cv.FONT_HERSHEY_SIMPLEX,1, (255, 0, 0) , 2, cv.LINE_AA)
cv.imshow("img", img)
cv.imwrite(f"result_{str(cnt)}.jpg", img)
cv.waitKey()
cv.destroyAllWindows()

5、涉及到的库函数

关于 cv2.convexHullcv2.convexityDefects 的使用说明可以参考 【python】OpenCV---findContours(4.2)

cv2.inRange

cv2.inRange 是 OpenCV 库中的一个函数,用于检查数组元素是否位于两个指定的范围之间。这个函数通常用于图像处理和计算机视觉任务中,特别是在进行图像阈值处理、颜色空间转换后的颜色过滤等场景。

python 复制代码
cv2.inRange(src, lowerb, upperb, dst=None)
  • src: 输入数组(通常是图像),它应该是一个单通道或多通道的数组。
  • lowerb: 范围的下限(包含),与 src 同类型、同大小的数组,或者是一个标量值。
  • upperb: 范围的上限(不包含),与 src 同类型、同大小的数组,或者是一个标量值。
  • dst: 输出数组,与 src 同大小、同类型。函数将结果存储在这里。如果为 None,则会自动创建一个与 src 同大小、同类型的数组。

工作原理

  • 对于 src 中的每个元素,cv2.inRange 会检查它是否位于 [lowerb, upperb) 范围内(注意,上限是开区间,即不包括上限值)。如果元素值在这个范围内,则对应的 dst 中的元素被设置为 255(对于 8 位图像),否则被设置为 0。这样,dst 数组最终会是一个二值图像(只有 0 和 255 的值),其中白色(255)表示满足条件的像素,黑色(0)表示不满足条件的像素。

应用场景

  • 颜色过滤:在 HSV 颜色空间中,可以通过 cv2.inRange 来提取特定颜色的物体。例如,提取图像中的红色部分。
  • 阈值处理:在灰度图像中,可以用来提取特定亮度范围内的像素。
  • 背景分割:如果背景的颜色或亮度与前景有明显的区别,可以用这个函数来分离背景和前景。

示例代码

以下是一个简单的示例,展示如何使用 cv2.inRange 来提取图像中的红色部分:

python 复制代码
import cv2
import numpy as np
 
# 读取图像
image = cv2.imread('example.jpg')
 
# 转换到 HSV 颜色空间
hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
 
# 定义红色的 HSV 范围
lower_red = np.array([0, 120, 70])
upper_red = np.array([10, 255, 255])
mask1 = cv2.inRange(hsv, lower_red, upper_red)
 
lower_red = np.array([170, 120, 70])
upper_red = np.array([180, 255, 255])
mask2 = cv2.inRange(hsv, lower_red, upper_red)
 
# 合并两个掩码
mask = mask1 | mask2
 
# 使用掩码提取红色部分
result = cv2.bitwise_and(image, image, mask=mask)
 
# 显示结果
cv2.imshow('Original Image', image)
cv2.imshow('Red Extracted', result)
cv2.waitKey(0)
cv2.destroyAllWindows()

这个示例首先读取一张图像,然后将其转换到 HSV 颜色空间。接着,定义了两个红色的 HSV 范围(因为红色在 HSV 空间中跨越了两个范围),并使用 cv2.inRange 生成两个掩码。之后,合并这两个掩码,并使用掩码提取图像中的红色部分。最后,显示原始图像和提取的红色部分。

6、参考

相关推荐
海棠AI实验室12 分钟前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself14 分钟前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
IT古董1 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee1 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能
mahuifa1 小时前
混合开发环境---使用编程AI辅助开发Qt
人工智能·vscode·qt·qtcreator·编程ai
四口鲸鱼爱吃盐1 小时前
Pytorch | 从零构建GoogleNet对CIFAR10进行分类
人工智能·pytorch·分类
蓝天星空1 小时前
Python调用open ai接口
人工智能·python
睡觉狂魔er1 小时前
自动驾驶控制与规划——Project 3: LQR车辆横向控制
人工智能·机器学习·自动驾驶
jasmine s1 小时前
Pandas
开发语言·python
郭wes代码1 小时前
Cmd命令大全(万字详细版)
python·算法·小程序