摘要:芯片制造过程中的微小缺陷(5-7像素)检测是质量控制的关键环节,但现有目标检测算法在处理此类微小目标时存在特征信息丢失、检测精度低和漏检率高等问题。针对上述问题,本文提出了一种基于YOLO11的改进检测方法YOLO11-P2-MDH。
项目简介
基于改进YOLO11算法的芯片微缺陷智能检测系统,通过P2高分辨率检测分支和P2_MDH微缺陷增强模块实现5-7像素微小缺陷的高精度实时检测
系统概述
在YOLO11网络架构中引入P2高分辨率检测分支(stride=4),该分支在网络浅层提取并保留高分辨率特征图,有效缓解了多次下采样导致的微小目标空间信息丢失问题。其次,设计了P2_MDH微缺陷增强模块,该模块采用深度可分离卷积结构降低计算复杂度,结合轻量级通道感知机制自适应调整特征权重,并通过残差连接保持特征传递的稳定性,从而增强了微缺陷的局部特征表达能力。
在自建的芯片微缺陷数据集上进行了充分的实验验证,该数据集包含7810张图像和12119个标注框,涵盖划痕(Scratch)、针孔(Pin)、污染(Contamination)和封装(Package)4类典型缺陷。实验结果表明:改进模型的mAP@0.5达到98.1%,mAP@0.5:0.95达到90.5%,精确率为98.5%,召回率为95.9%,相比基线YOLO11模型分别提升了2.3%、3.8%、1.7%和2.4%。同时,模型参数量仅为2.66M,单张图像推理时间为4.9ms,在保持轻量化的同时满足了工业实时检测的需求。
本文所提方法有效解决了芯片微缺陷检测中的关键技术难题,为工业微小目标检测提供了新的解决思路,具有重要的理论意义和应用价值。
系统架构
本系统采用经典的架构设计:

图1 芯片微缺陷检测系统
核心亮点
本系统以YOLO11-P2-MDH目标检测为核心,融合高分辨率特征提取、微缺陷增强模块与可视化界面,实现了芯片微缺陷识别、类型分类和质量控制的一体化智能检测。
算法特点
本算法以YOLO11-P2-MDH目标检测为基础,融合P2高分辨率检测分支、微缺陷增强模块、缺陷类型识别及风险等级评估等多维特征,并结合处理建议完成芯片质量控制,具有检测与分析一体化的特点。
性能突破
本文在芯片微缺陷检测数据集上开展实验,数据集共包含7810张图像和12119个标注框,其中训练集5467张、验证集1561张、测试集782张。通过150轮训练,YOLO11-P2-MDH模型能够较好地完成芯片微缺陷检测任务,为后续质量控制提供了有效支撑。

图2 基线模型性能分析图
核心技术
YOLO11-P2-MDH改进目标检测模型,结合P2高分辨率检测分支与微缺陷增强模块技术,在芯片微缺陷数据集(7810张图像,12119个标注框)上训练150轮,实现对划痕、针孔、污染和封装四类缺陷的高精度实时识别,并结合可视化界面、风险预警和处理建议提升芯片制造质量控制能力。
算法详解
本系统采用Ultralytics最新发布的YOLO11模型并进行P2-MDH改进作为核心检测算法。YOLO11采用经典的Backbone--Neck--Head三段式架构。Backbone以1024×1024输入图像为基础,通过两层初始卷积完成下采样,并利用6个C3k2轻量化模块逐步降低特征图分辨率、提升通道维度(64→256),实现从低层纹理到高层语义的多尺度特征提取。末端引入SPPF扩大感受野以增强多尺度上下文建模能力,同时通过C2PSA并行空间注意力强化芯片表面场景中划痕、针孔、污染点等关键缺陷特征。本文创新性地引入P2高分辨率检测分支(stride=4)和P2_MDH微缺陷增强模块,在网络浅层保留高分辨率特征图,有效缓解多次下采样导致的5-7像素微小目标空间信息丢失问题。最终输出P2/4、P3/8、P4/16、P5/32四个尺度特征图,分别对应微小、小、中、大缺陷目标,实现对划痕缺陷、针孔缺陷、污染缺陷、封装缺陷四类芯片微缺陷的精准识别。

图3 YOLO11网络架构图
创新点1:P2高分辨率检测分支
在YOLO11原有检测结构基础上引入P2(stride=4)高分辨率检测分支,通过自顶向下特征融合(FPN风格)将高层语义信息逐级上采样并与浅层高分辨率特征融合,构建用于微缺陷检测的P2特征图。
创新点2:P2_MDH微缺陷增强模块
高分辨率P2特征直接用于检测仍存在特征判别性不足问题,芯片微缺陷以局部边缘与细粒度纹理为主,需要针对性增强。
创新点3:稳定可控的特征增强机制
通过残差结构与可学习增强系数实现稳定、可控的特征增强机制,残差连接保留原始特征信息防止梯度消失,可学习增强权重自适应调节增强强度,增强过程可控保证训练与推理稳定性,避免噪声放大和过拟合,提升模型训练收敛性和推理鲁棒性。
创新点4:轻量化高精度检测架构
在不改变YOLO11主体结构与训练流程的前提下,通过结构级改进实现性能-效率平衡,模型参数量仅为2.66M、单张图像推理时间4.9ms的轻量化架构下,mAP@0.5达到98.1%、mAP@0.5:0.95达到90.5%、精确率98.5%、召回率95.9%,满足工业实时检测需求。
系统功能
本系统集成用户登录注册、图像/视频/摄像头芯片缺陷检测、缺陷类型识别、风险等级评估、处理建议推荐、检测结果存储及统计分析等功能。
功能概述
本系统面向芯片微缺陷检测与质量控制需求,基于YOLO11-P2-MDH目标检测模型实现对图像、视频及摄像头实时画面中芯片缺陷的识别、定位与可视化展示;系统提供用户登录注册与管理功能,能够对检测结果进行缺陷类型统计,并结合风险等级评估与处理建议推荐完成质量控制,同时将检测结果与分析数据进行存储和展示,在统计分析模块中实现检测与预警结果的综合呈现,为芯片制造智能化管理和质量控制提供一体化支持。
系统流程图
系统采用Python 3.12开发,基于Ultralytics YOLO11框架并进行P2-MDH改进实现芯片微缺陷目标检测,使用PySide6构建图形化界 面,通过OpenCV处理图像、视频和摄像头数据,并结合风险等级评估与处理建议推荐实现质量控制;同时采用SQLite数据库存储用 户信息,并对检测结果和分析数据进行管理与展示。系统面向芯片微缺陷检测与质量控制需求,集成用户登录注册、图片检测、视 频检测、实时检测、缺陷分类、风险评估、结果存储与统计分析等功能,为芯片制造智能化管理提供了一体化技术支持。

图4 系统总流程图
系统优势
本系统基于YOLO11-P2-MDH目标检测模型,能够精准完成芯片微缺陷识别与类型分类,并结合风险等级评估和处理建议推荐实现质量控制,具备检测与分析一体化的特点。相比传统人工检测方式,系统具有自动化程度高、处理效率快、结果一致性好等优势。与此同时,系统支持图像、视频和摄像头等多种输入方式,并结合PySide6构建可视化界面,具备较好的交互性、实用性和扩展性,可为芯片制造智能管理和质量控制提供有效支持。
运行展示
系统界面采用模块化布局设计,包含顶部标题栏、左侧检测显示区域和右侧功能控制面板。系统能够完成图像、视频及摄像头场景下的芯片微缺陷检测,并对检测结果进行可视化展示,同时支持缺陷类型统计、风险等级评估、处理建议推荐及统计分析等功能,具有界面清晰、交互友好和操作便捷等特点。
检测效果展示
登录界面:

图5 登录主界面
用户登录界面,展示系统入口

图6 注册主界面
用户注册界面,新用户创建账号
系统运行模块:

图7 系统运行界面

图8 单张检测:封装缺陷

图9 单张检测:划痕缺陷

图10 单张检测:污染缺陷

图11 单张检测:引脚缺陷

图12 视频检测:引脚缺陷

图13 实时检测:封装缺陷
分析模块:

图14 数据概览

图15 缺陷分析

图16 详细记录
处理建议:

图17 引脚缺陷:处理建议

图18 划痕缺陷:处理建议

图19 封装缺陷:处理建议

图20 污染缺陷:处理建
数据集与训练
本文构建了芯片微缺陷检测数据集,共包含7810张图像与12119个标注框,其中训练集5467张、验证集1561张、测试集782张。模型 训练采用YOLO11-P2-MDH目标检测框架,输入图像尺寸设为1024×1024,batch size为8,优化器为SGD,训练轮数为150。在NVIDIA GeForce RTX 4070 Ti SUPER显卡环境下完成训练后,模型在验证集上取得了优异的检测效果(mAP@0.5达到98.1%,mAP@0.5:0.95 达到90.5%,精确率98.5%,召回率95.9%),能够满足芯片微缺陷识别与质量控制任务需求。
数据集构建
本文构建并使用芯片微缺陷检测数据集开展实验研究。该数据集以半导体芯片制造与封装过程中的表面缺陷为目标对象,包含不同光照、拍摄角度和背景条件下采集的图像数据,同时覆盖缺陷在微小尺寸(5-7像素)、形态细碎和局部分布等情况下的视觉特征,具有较好的场景代表性。数据集共包含7810张图像和12119个标注框,涵盖划痕(Scratch)、针孔(Pin)、污染(Contamination)和封装(Package)四类典型缺陷,其中训练集5467张、验证集1561张、测试集782张,对应标注框数量分别为8508、2420和1191。该数据集为YOLO11-P2-MDH模型训练、性能验证以及后续系统部署提供了可靠的数据基础。

图24 数据集划分及类别信息统计示意图
训练流程
模型训练采用端到端的方式,首先加载训练集和验证集进行数据预处理,然后加载 YOLO11n 预训练权重进行模型初始化,接着使用 SGD 优化器进行 150 轮迭代训练,每轮训练后在验证集上评估性能指标,系统自动保存验证集上性能最佳的模型权重,最终输出完整 的性能指标和训练曲线。

图25 模型训练流程
训练流程:
-
开始训练 → 加载训练集和验证集进行数据预处理
-
模型初始化 → 加载YOLO11预训练权重(yolo11n.pt),引入P2高分辨率检测分支和P2_MDH微缺陷增强模块
-
模型训练 → 使用SGD优化器进行150轮迭代训练,应用数据增强技术
-
模型验证 → 每轮训练后在验证集上评估性能指标(Precision, Recall, mAP@0.5, mAP@0.5:0.95)
-
最佳模型保存 → 系统自动监控验证性能,保存验证集上性能最佳的模型权重(best.pt)
-
训练完成 → 输出完整的性能指标报告和训练曲线图
训练配置
硬件环境:

软件环境

训练结果
训练曲线分析:
下图展示了模型在150轮训练过程中的完整性能变化,包括损失函数曲线和精度指标曲线:

图26 训练曲线分析
图中展示了10个关键指标的训练过程:训练损失(box/cls/dfl)、验证损失(box/cls/dfl)、精确率、召回率、mAP@50和mAP@50-95
(1)损失函数曲线
从训练结果可以看出,模型在训练过程中各项损失函数均呈现稳定下降趋势,说明YOLO11-P2-MDH模型能够较好地学习芯片微缺陷目标特征。其中,train/box_loss由约1.50下降至1.10,train/cls_loss由约1.60下降至0.50,train/dfl_loss由约1.40下降至1.15;验证集上的val/box_loss、val/cls_loss和val/dfl_loss也表现出与训练集基本一致的下降趋势,且整体曲线变化平滑、波动较小,表明模型训练过程较为稳定,未出现明显的过拟合现象。
(2)精度指标曲线
从精度指标变化情况来看,模型各项性能指标均随训练轮次增加而持续提升。Precision曲线由初始约85.0%逐步提升并最终稳定在98.5%;Recall曲线由初始约82.0%稳步上升至95.9%;mAP@0.5由初始约88.0%快速提升,最终达到98.1%;mAP@0.5:0.95由初始约60.0%持续增长至90.5%。从整体趋势看,模型训练过程大致经历了快速提升、稳定优化和收敛趋稳三个阶段,最终在验证集上取得了优异的检测效果,说明所构建的YOLO11-P2-MDH模型在芯片微缺陷检测任务中具有高精度和良好的收敛性,特别是在微小缺陷(5-7像素)的精细定位方面表现突出。
(3)Precision-Recall 曲线

图27 Precision-Recall 曲线
展示模型在不同置信度阈值下的精确率和召回率关系
(4)混淆矩阵(归一化)

图28 归一化混淆矩阵
归一化混淆矩阵展示模型的分类准确性
最佳模型选择
在模型训练过程中,系统依据验证集性能指标自动保存最优模型权重,并以验证集mAP@0.5:0.95作为最佳模型判定标准。当该指标达到当前训练过程中的最高值时,对应模型权重将被保存为best.pt。本次实验中,最优模型出现在第150轮,其验证集mAP@0.5:0.95为0.905,模型文件保存于scripts/runs/train/yolo11_P2_MDH/weights/best.pt。
训练稳定性分析
- 收敛速度:前30轮快速收敛(60.0% → 78.0%),30-100轮稳定提升,100轮后收敛
- 过拟合控制:训练集与验证集损失走势一致,无过拟合
- 训练稳定性:损失曲线平滑,学习率逐步衰减,训练稳定
- 最终状态:最佳模型第150轮,mAP@50-95达90.5%
项目资源
我们提供项目的完整技术资源,包括源代码、训练脚本、配置文件、数据集和模型权重等全部内容。代码采用模块化设计,结构清晰,注释完善,支持完全复现论文中的所有实验结果。项目提供详细的文件清单和技术架构说明(网页已经提供),帮助用户快速理解项目结构,便于二次开发和功能扩展。所有资源均已开源,遵循AGPL-3.0协议,用户可自由使用、修改和分发。

关于项目
作者信息
作者:Bob (张家梁)
原创声明:本项目为原创作品