一、图像分割基础(对应 5.1)
\1. 定义
图像分割是计算机视觉的核心技术之一,指根据图像中像素的灰度、颜色、纹理、形状 等特征,将图像自动划分为若干个互不重叠、语义连贯且具有明确物理意义的子区域的过程。其核心目标是简化图像信息,突出感兴趣区域(ROI),为后续的图像分析、识别、理解提供基础。
\2. 三种经典分割算法(含核心特点)
算法类型核心原理优点缺点阈值分割法基于像素灰度值的统计分布,设定阈值将像素划分为前景(目标)和背景两类 / 多类计算简单、速度快、实时性强对光照不均、灰度重叠敏感区域生长法从种子点出发,按预设相似性准则(如灰度差、纹理一致)合并相邻像素形成区域分割区域完整、边界连续依赖种子点选择、对噪声敏感边缘检测法检测图像中灰度突变的边缘(灰度梯度极值 / 二阶导数过零点),间接划分区域边界定位精准、保留细节易受噪声干扰、可能出现边缘断裂
二、区域生长法分割过程(对应 5.2)
区域生长法是 "从点到面" 的分割技术,核心是基于像素相似性的逐步合并,具体步骤如下:
- 种子点选取:
-
手动选取:直接指定感兴趣区域的起始像素(适用于目标明确的场景);
-
自动选取:通过阈值筛选、灰度峰值检测等方式确定(如选择灰度值最大 / 最小的像素集群中心)。
- 相似性准则定义:
最常用的是灰度差值准则(即相邻像素与当前区域的灰度差≤阈值 T),也可采用纹理一致性、颜色距离、梯度相似度等准则。
- 区域生长执行:
-
初始化:将种子点归入目标区域,标记为 "已合并";
-
迭代合并:遍历当前区域的所有边界像素,检查其 8 邻域(或 4 邻域)中未标记的像素,若满足相似性准则,则将其并入当前区域并标记;
-
终止条件:当没有新的像素满足准则可添加到区域中时,生长停止,最终形成完整的分割区域。
- 后处理(可选):
去除小面积噪声区域、平滑区域边界,提升分割精度。
三、直方图阈值分割方法(对应 5.3)
直方图阈值法是最常用的阈值分割技术,核心是利用灰度直方图的 "峰谷特征" 确定最佳阈值,具体步骤如下:
- 计算灰度直方图:
统计图像中每个灰度级(0~255,8 位图像)对应的像素数量,绘制横坐标为灰度级、纵坐标为像素频率的直方图。
- 分析直方图特征:
理想情况下,目标与背景的灰度分布会形成两个分离的峰值,两峰之间的谷点即为最佳阈值;若存在多个目标,则会出现多个峰值,需采用多阈值分割。
- 阈值确定方法:
-
手动法:直接观察直方图谷点位置确定阈值(适用于峰谷明显的图像);
-
自动法:通过算法计算最优阈值(如 Otsu 法,基于最大类间方差自动确定阈值,适用于灰度重叠较少的图像)。
- 像素分类与输出:
-
单阈值分割:将灰度值>阈值的像素归为前景(如 255,白色),灰度值≤阈值的归为背景(如 0,黑色),输出二值图像;
-
多阈值分割:设定多个阈值(如 T1、T2),将灰度值在 [0,T1)、[T1,T2)、[T2,255] 的像素分为三类,输出多区域图像。
四、边缘检测(对应 5.4)
\1. 理论依据
图像边缘是目标与背景、不同区域之间的边界,其本质是灰度值的突变:
-
一阶导数:边缘处的灰度梯度(一阶导数)取值最大(灰度变化率最快);
-
二阶导数:边缘处的二阶导数会穿过零点(从正变负或反之);
边缘检测的核心是通过数学算子提取这些灰度变化特征,从而定位边缘位置。
\2. 三种经典边缘检测算法(含对比)
算法名称核心原理特点适用场景Sobel 算子采用 3×3 梯度模板(水平、垂直方向)与图像卷积,计算梯度幅值,定位边缘计算简单、抗噪声能力较强对边缘精度要求不高的快速检测Canny 算子四步流程:①高斯平滑(去噪声)→②计算梯度幅值与方向→③非极大值抑制(细化边缘)→④双阈值筛选(连接边缘)边缘定位准、抗噪声强、无假边缘高精度边缘检测(如目标识别、医学影像)Laplacian 算子基于二阶导数的线性算子,通过卷积计算像素灰度的二阶变化,检测过零点定位边缘对灰度突变敏感、可检测任意方向边缘快速边缘检测、边缘增强
五、Hough 变换(对应 5.5)
\1. 定义
Hough 变换是一种将图像空间中的特征映射到参数空间,通过统计投票检测目标的技术,核心优势是对噪声、边缘断裂具有强鲁棒性,可检测直线、圆、椭圆等规则几何形状。
\2. 直线检测原理
图像空间与参数空间的映射是核心,具体步骤如下:
- 参数表示转换:
图像空间(x,y)中,直线的笛卡尔方程为 y =k**x +b (k 为斜率,b 为截距),但 k 趋于无穷大时(垂直线)无法表示,因此采用极坐标方程 :ρ =x cosθ +y sinθ
其中:ρ 为原点到直线的垂直距离(取值范围:-D~D,D 为图像对角线长度);θ 为垂直距离与 x 轴的夹角(取值范围:0~π)。
- 像素映射与投票:
图像空间中每个边缘像素(x0,y0),对应参数空间(ρ,θ)中的一条正弦曲线(因 ρ 随 θ 变化满足极坐标方程);
若多个边缘像素属于同一条直线,则它们在参数空间的正弦曲线会相交于同一点(ρ0,θ0),该点的 "投票数"(曲线交点数)达到峰值。
- 峰值检测与直线重建:
设定投票数阈值,筛选出参数空间中的峰值点,每个峰值点对应的(ρ0,θ0)即为图像空间中一条直线的参数;
根据极坐标方程,可反向计算出直线上的像素点,完成直线检测。
\3. 适用场合
-
场景特征:图像中存在明确的直线结构(如工程图纸、建筑轮廓、道路标线、棋盘格、机械零件边缘);
-
噪声耐受:适用于边缘存在轻微断裂、图像含少量噪声的场景(如模糊图像、低分辨率图像);
-
应用领域:目标定位(如车牌检测中的直线边框)、图像配准、医学影像分析(如 CT 图像中的骨骼直线边缘)。
六、简单区域增长法分割实例(对应 5.6)
前提说明
由于未提供 "图像 1" 的具体灰度矩阵 / 像素分布,以下基于通用灰度图像模型(假设图像为 5×5 灰度图,种子点为中心像素(2,2),灰度值为 10),结合灰度差值阈值 T=1、2、3,描述分割结果(以区域标记为核心,可结合像素坐标理解)。
假设图像 1 的灰度矩阵(行号 0~4,列号 0~4)
plaintext取消自动换行复制8 9 10 9 89 10 10 10 910 10 10 10 109 10 10 10 98 9 10 9 8
(中心区域灰度值集中为 10,边缘逐渐降低至 8)
三种 T 值下的分割结果
- T=1(灰度差≤1):
合并条件:像素灰度值与当前区域灰度值(初始为 10)的差值≤1,即灰度值∈[9,11](因图像最大灰度为 10,实际为 [9,10])。
分割区域:所有灰度值为 9、10 的像素,即整个图像的中间 4×4 区域 + 边缘部分像素,边界为灰度 8 的像素(不合并),分割区域完整但边缘紧凑。
- T=2(灰度差≤2):
合并条件:灰度值∈[8,12](实际为 [8,10])。
分割区域:整个图像的所有像素(因图像最小灰度为 8,最大为 10,均满足差值≤2),即图像被划分为一个完整区域,无明显分割边界(所有像素并入种子点区域)。
- T=3(灰度差≤3):
合并条件:灰度值∈[7,13](实际为 [8,10])。
分割结果与 T=2 一致:所有像素均满足差值条件,整个图像被划分为单一区域(因图像灰度范围仅 8~10,T=3 已覆盖全部灰度级),分割区域最宽泛,细节完全融合。
补充说明
-
若图像 1 存在多个不同灰度的独立区域(如中心 10、左上角 7、右下角 13),则:
-
T=1 时,仅中心 10 及其相邻 9 的区域被合并,其他区域独立;
-
T=2 时,中心 10、相邻 9、边缘 8 的区域合并,左上角 7、右下角 13 仍独立;
-
T=3 时,中心 10、8、9 与左上角 7(10-7=3)合并,右下角 13(13-10=3)也合并,最终形成一个完整区域。
-
实际分割图像可通过 "不同颜色标记不同区域" 表示,满足条件的像素标记为同一颜色(如白色),不满足的标记为另一颜色(如黑色)。