毕设随记-3-实现图像子块的分割

首先的想法是,基于RGB来分割。首先写一个函数,读取原图片,当鼠标点击对应位置时返回其坐标(X,Y)以及对应的RGB值,便于后续作为阈值的设置。

函数实现如下:

ini 复制代码
# 定义鼠标点击事件的回调函数
def on_click(event):
    # 当鼠标左键被按下
    if event.button == 1:  # 1 代表鼠标左键
        # 打印点击位置的坐标(注意:这里的坐标是以图像的左上角为原点的)
        # 获取点击位置的坐标
        x = int(event.xdata)
        y = int(event.ydata)
         # 获取点击位置的RGB值
        rgb = image[y, x]
        # 打印点击位置的坐标和RGB值
        print(f"X: {x}, Y: {y}, RGB: {rgb}")
# 读取图像
image = cv2.imread('mini1.jpg')  
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # 将图像从BGR转换为RGB

# 显示图像
fig, ax = plt.subplots()
ax.imshow(image)

# 连接事件回调函数
fig.canvas.mpl_connect('button_press_event', on_click)

plt.show()

但实际上,RGB是不利于实现分割的,HSV空间才是更为合适的那个。为此我改写了上述函数,并对背景部分,以及黑色杂质部分进行hsv值的读取,并依次设定范围

改写后的函数如下:

ini 复制代码
def on_click(event):
    # 当鼠标左键被按下
    if event.button == 1:  # 1 代表鼠标左键
        # 打印点击位置的坐标(注意:这里的坐标是以图像的左上角为原点的)
        # 获取点击位置的坐标
        x = int(event.xdata)
        y = int(event.ydata)
        # 获取点击位置的RGB值
        rgb = image[y, x]
        # 打印点击位置的坐标和RGB值
        # print(f"X: {x}, Y: {y}, RGB: {rgb}")

        # 将RGB值转换为HSV值
        hsv = colorsys.rgb_to_hsv(rgb[0] / 255, rgb[1] / 255, rgb[2] / 255)
        # 调整H、S、V值到0~180、0~255、0~255范围
        # 在OpenCV中,HSV的取值范围有时会稍微不同,这取决于实现。通常,H在0到179之间,而S和V在0到255之间。
        h = int(hsv[0] * 180)
        s = int(hsv[1] * 255)
        v = int(hsv[2] * 255)
        # 打印点击位置的坐标和HSV值
        print(f"X: {x}, Y: {y}, HSV: ({h}, {s}, {v})")


# 读取图像
image = cv2.imread('mini1.jpg')
image = cv2.pyrMeanShiftFiltering(image, 10, 20)
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # 将图像从BGR转换为RGB

# 显示图像
fig, ax = plt.subplots()
ax.imshow(image)

# 连接事件回调函数
fig.canvas.mpl_connect('button_press_event', on_click)

plt.show()

实现初步分割后,效果还是不错的。进一步的,就是要对像素点大小等进行一定的限制,比如,若黑色杂质点的hsv值满足初步分割的条件会导致计数时发生错检,但往往杂质点的所占像素范围是比较小的。因此,可以根据图像中的非白色点的所占空间以进一步去除黑色杂点。

那么最简单的思想当然是滑动窗口法了。同样的,也需要想怎样才能在去除黑色杂质时不误去除铜屑部分。---直接进行形态学处理可能也行?先试试开运算


**开运算:先腐蚀再膨胀 ** dst = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)--

  • 针对kernel,可以使用cv2.getStructuringElement(cv2.MORPH_RECT, kernel_size))指定核的形状,常用的有矩形结构和椭圆形结构(我感觉用起来差异不大)

图1是预处理后的原图,图2、3分别是使用椭圆形结构和矩形结构的开运算后的图像。


直方图均衡化用于图像增强:

左图是经直方图均衡化后再结合腐蚀与膨胀操作后的图,右图是直方图均衡化后的图。明显可见,细小的点(杂质小点)被去除了,相对"大块头"的铜屑部分得以保留。


进一步,增强后要对原图像中的闭合图像个数进行计数

对一个子图能实现边框检测+计数啦,今天就先点到为止,明天继续考虑优化以及其他可能算法的对比。

相关推荐
聚客AI11 小时前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
大怪v14 小时前
前端:人工智能?我也会啊!来个花活,😎😎😎“自动驾驶”整起!
前端·javascript·算法
惯导马工16 小时前
【论文导读】ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and
深度学习·算法
骑自行车的码农17 小时前
【React用到的一些算法】游标和栈
算法·react.js
博笙困了17 小时前
AcWing学习——双指针算法
c++·算法
moonlifesudo18 小时前
322:零钱兑换(三种方法)
算法
NAGNIP1 天前
大模型框架性能优化策略:延迟、吞吐量与成本权衡
算法
美团技术团队2 天前
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
人工智能·算法
Fanxt_Ja2 天前
【LeetCode】算法详解#15 ---环形链表II
数据结构·算法·leetcode·链表
侃侃_天下2 天前
最终的信号类
开发语言·c++·算法