Halcon图像分隔

一、图像分割基础(对应 5.1)

\1. 定义

图像分割是计算机视觉的核心技术之一,指根据图像中像素的灰度、颜色、纹理、形状 等特征,将图像自动划分为若干个互不重叠、语义连贯且具有明确物理意义的子区域的过程。其核心目标是简化图像信息,突出感兴趣区域(ROI),为后续的图像分析、识别、理解提供基础。

\2. 三种经典分割算法(含核心特点)

算法类型核心原理优点缺点阈值分割法基于像素灰度值的统计分布,设定阈值将像素划分为前景(目标)和背景两类 / 多类计算简单、速度快、实时性强对光照不均、灰度重叠敏感区域生长法从种子点出发,按预设相似性准则(如灰度差、纹理一致)合并相邻像素形成区域分割区域完整、边界连续依赖种子点选择、对噪声敏感边缘检测法检测图像中灰度突变的边缘(灰度梯度极值 / 二阶导数过零点),间接划分区域边界定位精准、保留细节易受噪声干扰、可能出现边缘断裂

二、区域生长法分割过程(对应 5.2)

区域生长法是 "从点到面" 的分割技术,核心是基于像素相似性的逐步合并,具体步骤如下:

  1. 种子点选取
  • 手动选取:直接指定感兴趣区域的起始像素(适用于目标明确的场景);

  • 自动选取:通过阈值筛选、灰度峰值检测等方式确定(如选择灰度值最大 / 最小的像素集群中心)。

  1. 相似性准则定义

最常用的是灰度差值准则(即相邻像素与当前区域的灰度差≤阈值 T),也可采用纹理一致性、颜色距离、梯度相似度等准则。

  1. 区域生长执行
  • 初始化:将种子点归入目标区域,标记为 "已合并";

  • 迭代合并:遍历当前区域的所有边界像素,检查其 8 邻域(或 4 邻域)中未标记的像素,若满足相似性准则,则将其并入当前区域并标记;

  • 终止条件:当没有新的像素满足准则可添加到区域中时,生长停止,最终形成完整的分割区域。

  1. 后处理(可选)

去除小面积噪声区域、平滑区域边界,提升分割精度。

三、直方图阈值分割方法(对应 5.3)

直方图阈值法是最常用的阈值分割技术,核心是利用灰度直方图的 "峰谷特征" 确定最佳阈值,具体步骤如下:

  1. 计算灰度直方图

统计图像中每个灰度级(0~255,8 位图像)对应的像素数量,绘制横坐标为灰度级、纵坐标为像素频率的直方图。

  1. 分析直方图特征

理想情况下,目标与背景的灰度分布会形成两个分离的峰值,两峰之间的谷点即为最佳阈值;若存在多个目标,则会出现多个峰值,需采用多阈值分割。

  1. 阈值确定方法
  • 手动法:直接观察直方图谷点位置确定阈值(适用于峰谷明显的图像);

  • 自动法:通过算法计算最优阈值(如 Otsu 法,基于最大类间方差自动确定阈值,适用于灰度重叠较少的图像)。

  1. 像素分类与输出
  • 单阈值分割:将灰度值>阈值的像素归为前景(如 255,白色),灰度值≤阈值的归为背景(如 0,黑色),输出二值图像;

  • 多阈值分割:设定多个阈值(如 T1、T2),将灰度值在 [0,T1)、[T1,T2)、[T2,255] 的像素分为三类,输出多区域图像。

四、边缘检测(对应 5.4)

\1. 理论依据

图像边缘是目标与背景、不同区域之间的边界,其本质是灰度值的突变

  • 一阶导数:边缘处的灰度梯度(一阶导数)取值最大(灰度变化率最快);

  • 二阶导数:边缘处的二阶导数会穿过零点(从正变负或反之);

边缘检测的核心是通过数学算子提取这些灰度变化特征,从而定位边缘位置。

\2. 三种经典边缘检测算法(含对比)

算法名称核心原理特点适用场景Sobel 算子采用 3×3 梯度模板(水平、垂直方向)与图像卷积,计算梯度幅值,定位边缘计算简单、抗噪声能力较强对边缘精度要求不高的快速检测Canny 算子四步流程:①高斯平滑(去噪声)→②计算梯度幅值与方向→③非极大值抑制(细化边缘)→④双阈值筛选(连接边缘)边缘定位准、抗噪声强、无假边缘高精度边缘检测(如目标识别、医学影像)Laplacian 算子基于二阶导数的线性算子,通过卷积计算像素灰度的二阶变化,检测过零点定位边缘对灰度突变敏感、可检测任意方向边缘快速边缘检测、边缘增强

五、Hough 变换(对应 5.5)

\1. 定义

Hough 变换是一种将图像空间中的特征映射到参数空间,通过统计投票检测目标的技术,核心优势是对噪声、边缘断裂具有强鲁棒性,可检测直线、圆、椭圆等规则几何形状。

\2. 直线检测原理

图像空间与参数空间的映射是核心,具体步骤如下:

  1. 参数表示转换

图像空间(x,y)中,直线的笛卡尔方程为 y =k**x +b (k 为斜率,b 为截距),但 k 趋于无穷大时(垂直线)无法表示,因此采用极坐标方程ρ =x cosθ +y sinθ

其中:ρ 为原点到直线的垂直距离(取值范围:-D~D,D 为图像对角线长度);θ 为垂直距离与 x 轴的夹角(取值范围:0~π)。

  1. 像素映射与投票

图像空间中每个边缘像素(x0,y0),对应参数空间(ρ,θ)中的一条正弦曲线(因 ρ 随 θ 变化满足极坐标方程);

若多个边缘像素属于同一条直线,则它们在参数空间的正弦曲线会相交于同一点(ρ0,θ0),该点的 "投票数"(曲线交点数)达到峰值。

  1. 峰值检测与直线重建

设定投票数阈值,筛选出参数空间中的峰值点,每个峰值点对应的(ρ0,θ0)即为图像空间中一条直线的参数;

根据极坐标方程,可反向计算出直线上的像素点,完成直线检测。

\3. 适用场合

  • 场景特征:图像中存在明确的直线结构(如工程图纸、建筑轮廓、道路标线、棋盘格、机械零件边缘);

  • 噪声耐受:适用于边缘存在轻微断裂、图像含少量噪声的场景(如模糊图像、低分辨率图像);

  • 应用领域:目标定位(如车牌检测中的直线边框)、图像配准、医学影像分析(如 CT 图像中的骨骼直线边缘)。

六、简单区域增长法分割实例(对应 5.6)

前提说明

由于未提供 "图像 1" 的具体灰度矩阵 / 像素分布,以下基于通用灰度图像模型(假设图像为 5×5 灰度图,种子点为中心像素(2,2),灰度值为 10),结合灰度差值阈值 T=1、2、3,描述分割结果(以区域标记为核心,可结合像素坐标理解)。

假设图像 1 的灰度矩阵(行号 0~4,列号 0~4)

plaintext取消自动换行复制8 9 10 9 89 10 10 10 910 10 10 10 109 10 10 10 98 9 10 9 8

(中心区域灰度值集中为 10,边缘逐渐降低至 8)

三种 T 值下的分割结果

  1. T=1(灰度差≤1)

合并条件:像素灰度值与当前区域灰度值(初始为 10)的差值≤1,即灰度值∈[9,11](因图像最大灰度为 10,实际为 [9,10])。

分割区域:所有灰度值为 9、10 的像素,即整个图像的中间 4×4 区域 + 边缘部分像素,边界为灰度 8 的像素(不合并),分割区域完整但边缘紧凑。

  1. T=2(灰度差≤2)

合并条件:灰度值∈[8,12](实际为 [8,10])。

分割区域:整个图像的所有像素(因图像最小灰度为 8,最大为 10,均满足差值≤2),即图像被划分为一个完整区域,无明显分割边界(所有像素并入种子点区域)。

  1. T=3(灰度差≤3)

合并条件:灰度值∈[7,13](实际为 [8,10])。

分割结果与 T=2 一致:所有像素均满足差值条件,整个图像被划分为单一区域(因图像灰度范围仅 8~10,T=3 已覆盖全部灰度级),分割区域最宽泛,细节完全融合。

补充说明

  • 若图像 1 存在多个不同灰度的独立区域(如中心 10、左上角 7、右下角 13),则:

  • T=1 时,仅中心 10 及其相邻 9 的区域被合并,其他区域独立;

  • T=2 时,中心 10、相邻 9、边缘 8 的区域合并,左上角 7、右下角 13 仍独立;

  • T=3 时,中心 10、8、9 与左上角 7(10-7=3)合并,右下角 13(13-10=3)也合并,最终形成一个完整区域。

  • 实际分割图像可通过 "不同颜色标记不同区域" 表示,满足条件的像素标记为同一颜色(如白色),不满足的标记为另一颜色(如黑色)。

相关推荐
还不秃顶的计科生4 小时前
如何快速用cmd知道某个文件夹下的子文件以及子文件夹的这个目录分支具体的分支结构
人工智能
九河云4 小时前
不同级别华为云代理商的增值服务内容与质量差异分析
大数据·服务器·人工智能·科技·华为云
Elastic 中国社区官方博客4 小时前
Elasticsearch:Microsoft Azure AI Foundry Agent Service 中用于提供可靠信息和编排的上下文引擎
大数据·人工智能·elasticsearch·microsoft·搜索引擎·全文检索·azure
大模型真好玩4 小时前
Gemini3.0深度解析,它在重新定义智能,会是前端工程师噩梦吗?
人工智能·agent·deepseek
机器之心4 小时前
AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型
人工智能·openai
AAA修煤气灶刘哥4 小时前
从Coze、Dify到Y-Agent Studio:我的Agent开发体验大升级
人工智能·低代码·agent
陈佬昔没带相机5 小时前
MiniMax M2 + Trae 编码评测:能否与 Claude 4.5 扳手腕?
前端·人工智能·ai编程
美狐美颜SDK开放平台5 小时前
从0到1开发直播美颜SDK:算法架构、模型部署与跨端适配指南
人工智能·架构·美颜sdk·直播美颜sdk·第三方美颜sdk·美狐美颜sdk
小陈phd5 小时前
RAG从入门到精通(四)——结构化数据读取与导入
人工智能·langchain
玖日大大5 小时前
Trae:字节跳动 AI 原生 IDE 的技术革命与实战指南
ide·人工智能