【AI加持】基于PyQt+YOLO+DeepSeek的PCB缺陷检测系统（详细介绍）

文章目录

一．前言
二．核心技术&知识
- 1.PyQt5
- 2.YOLOv8
- 3.DeepSeek
- 4.Sqlite3
- 5.多线程
- 6.PCB缺陷检测的意义
- - [1. PCB生产线在线质量检测场景](#1. PCB生产线在线质量检测场景)
  - [2. PCB出厂前终检与质量评估场景](#2. PCB出厂前终检与质量评估场景)
  - [3. 研发与工艺优化分析场景](#3. 研发与工艺优化分析场景)
  - [4. 教学与科研实验平台场景](#4. 教学与科研实验平台场景)
  - [5. 中小企业智能化升级场景](#5. 中小企业智能化升级场景)
三．核心功能
四．数据集
五．关于项目
六．总结

本系统功能强大！支持对图片、视频、视频流、摄像头中的PCB缺陷：包含缺孔、鼠咬、断路、短路、毛刺、多余铜，进行检测，支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估，欢迎了解！

@项目名称：基于PyQt+YOLO+DeepSeek的PCB缺陷检测系统

@仓库名称：yolov8-pcb-defect-detect

@作者：懷淰メ

@主页地址：https://blog.csdn.net/a1397852386

@定制：A1397852386

@开发日期：2026年4月

一．前言

随着电子制造业的快速发展，印制电路板（PCB）作为电子产品的核心基础部件，其质量直接决定整机性能与可靠性。在传统检测流程中，PCB缺陷（如缺孔、鼠咬、断路、短路、毛刺及多余铜等）主要依赖人工目检或基于规则的机器视觉方法，不仅效率低、成本高，还容易受到人为经验和疲劳因素影响，难以满足高精度与规模化生产需求。近年来，深度学习技术，尤其是以YOLOv8为代表的目标检测算法，在工业视觉领域展现出卓越性能，为复杂缺陷识别提供了新的解决思路。同时，借助PyQt5构建友好的人机交互界面，使检测系统具备良好的可视化与操作性；结合DeepSeek等智能模型，还可进一步实现检测结果分析与辅助决策。基于此，开发一款融合PyQt5、YOLOv8与DeepSeek的PCB缺陷检测系统，不仅能够显著提升检测速度与准确率，降低人工成本，还可推动电子制造向智能化、自动化方向升级，对提升产品质量控制水平、增强企业竞争力以及促进智能制造发展具有重要意义。

二．核心技术&知识

在这章我将要介绍本系统的核心技术。

1.PyQt5

PyQt5 是一套用于创建跨平台桌面应用程序的 Python GUI 工具包，它是 Qt 应用框架的 Python 绑定。通过 PyQt5，开发者可以使用 Python 编写具有现代图形界面的应用程序，支持丰富的控件、信号与槽机制、窗口管理、事件处理等功能。它兼容主流操作系统（如 Windows、macOS 和 Linux），适用于开发各种规模的桌面软件，常与 Qt Designer 配合使用以加快开发效率。

2.YOLOv8

YOLOv8（You Only Look Once version 8）是由 Ultralytics 推出的最新一代实时目标检测模型，属于 YOLO 系列的改进版本。相比前代模型，YOLOv8 在精度、速度和灵活性上都有显著提升，支持目标检测、图像分割、姿态估计等多任务处理。它采用了更加高效的网络结构和训练策略，并提供开箱即用的 Python 接口和命令行工具，适用于边缘设备和云端部署，广泛应用于安防监控、自动驾驶、工业检测等场景。

3.DeepSeek

DeepSeek是由深度求索公司开发的AI大模型助手，作为纯文本模型，我擅长自然语言处理、文档分析和智能对话。当与YOLO（You Only Look Once）实时目标检测系统结合时，可以形成强大的多模态应用架构------YOLO系统负责实时视觉识别和目标检测，快速准确地识别图像或视频流中的物体；而我则对YOLO检测到的结果进行深度语义分析和上下文理解，提供物体属性的详细解读、场景描述、行为分析以及决策建议。这种结合使得计算机视觉的"看到"与AI的"理解"完美融合，可广泛应用于智能监控、自动驾驶、工业质检等领域，实现从视觉感知到智能决策的完整闭环。

4.Sqlite3

本系统使用Sqlite3进行数据的存储与管理。

SQLite3是一种轻量级的嵌入式关系型数据库管理系统，广泛应用于桌面软件、移动应用以及各类嵌入式设备中。与传统的客户端-服务器数据库（如MySQL、PostgreSQL）不同，SQLite3无需独立的数据库服务器进程，整个数据库以单一文件形式存储在本地，应用程序可直接通过库文件进行读写操作。这种架构使其具有部署简单、占用资源少、跨平台性强等显著优势。SQLite3遵循ACID事务特性，能够保证数据的一致性与可靠性，同时支持标准SQL语法，包括表的创建、查询、索引、触发器等常见功能，能够满足中小规模数据管理需求。在性能方面，SQLite3在读操作上表现高效，并通过锁机制实现多线程环境下的基本并发控制。由于其零配置特性和稳定性，SQLite3被广泛集成于Android、iOS等操作系统中，也常用于缓存数据存储、本地日志管理以及离线数据处理等场景。总体而言，SQLite3以其简洁高效的设计理念，在轻量级数据管理领域占据了重要地位。

5.多线程

QThread 是 PyQt5 提供的线程类，主要用于在图形界面程序中安全、高效地执行耗时任务，从而避免主线程阻塞导致界面卡顿或无响应的问题。在典型的GUI应用中，界面渲染与用户交互通常运行在主线程，一旦在该线程中直接执行诸如数据处理、深度学习模型推理、视频流分析或文件读写等耗时操作，就容易造成界面冻结，严重影响用户体验。QThread 的引入正是为了解决这一问题。

通过 QThread，开发者可以将这些计算密集型或IO密集型任务封装到子线程中独立运行，使主线程专注于界面更新与交互响应。同时，QThread 提供了基于信号与槽机制的线程间通信方式，能够在不同线程之间安全地传递数据与状态信息。例如，子线程在完成检测或处理任务后，可以通过发送信号将结果传递给主线程，由主线程负责更新界面控件，从而避免直接跨线程操作UI带来的风险。

此外，QThread 还支持线程的生命周期管理，包括启动、暂停、退出以及资源回收等，使得多线程程序结构更加清晰可控。合理使用 QThread 不仅可以显著提升应用程序的响应速度和运行效率，还能增强系统的稳定性与扩展能力。在涉及实时数据处理、视频监控或智能分析等复杂桌面应用开发场景中，QThread 已成为不可或缺的重要工具。

6.PCB缺陷检测的意义

1. PCB生产线在线质量检测场景

在大规模PCB生产流水线上，产品需要经过蚀刻、钻孔、电镀等多道工序，任何一个环节的微小偏差都可能导致缺孔、鼠咬或短路等问题。传统人工抽检方式不仅效率低，而且无法实现全覆盖检测，容易遗漏隐性缺陷。基于YOLOv8的检测模型能够对高速传送带上的PCB图像进行实时分析，实现毫秒级识别各类缺陷；同时结合PyQt5开发的界面，可实时显示检测结果、标注缺陷位置并生成统计数据。系统还可以接入生产设备，实现自动剔除不良品，从而构建闭环质量控制体系。此外，通过DeepSeek对检测数据进行分析，可帮助工程师快速定位工艺异常来源，例如某一工序导致毛刺增多，从而及时调整参数。这种在线检测场景不仅提高了检测效率，还显著降低了次品流入下游的风险，是智能制造生产线中的关键一环。

2. PCB出厂前终检与质量评估场景

在PCB完成全部制造流程后，出厂前的终检是保障产品质量的重要关口。此阶段通常需要对整批产品进行全面检查，以确保不存在断路、短路或多余铜等严重缺陷。传统方法依赖人工或AOI设备，但AOI规则配置复杂，对复杂缺陷识别能力有限。引入基于YOLOv8的深度学习检测系统后，可以显著提升复杂缺陷识别的准确率，尤其是在不规则边缘（如鼠咬、毛刺）检测方面表现更优。借助PyQt5界面，质检人员可以直观查看缺陷分布情况，并快速导出检测报告。而结合DeepSeek的分析能力，系统还可以自动生成质量评估总结，例如缺陷类型占比、严重程度分类以及是否符合出厂标准等。这一应用场景不仅提升了终检效率，还为企业建立标准化质量评估体系提供了技术支撑，使质量控制更加数据驱动和可追溯。

3. 研发与工艺优化分析场景

在PCB产品研发或新工艺导入阶段，需要对不同设计方案和工艺参数进行反复验证，检测系统不仅承担"找缺陷"的任务，还需要提供数据支持以指导优化决策。利用YOLOv8对不同批次样本进行批量检测，可以快速获取缺孔率、短路率等关键指标；通过PyQt5界面进行数据可视化展示，工程师可以直观比较不同工艺参数下的缺陷分布趋势。进一步结合DeepSeek，系统能够对检测结果进行智能分析，例如总结"某一蚀刻时间过长导致毛刺增加"或"钻孔偏移导致缺孔率上升"等规律，从而辅助研发人员优化设计与制造流程。这种应用不仅缩短了研发周期，还降低了试错成本，使PCB设计与制造更加科学化与高效化。

4. 教学与科研实验平台场景

在高校或科研机构中，PCB缺陷检测系统可以作为智能制造与计算机视觉课程的重要实验平台。学生可以通过PyQt5构建的可视化界面，直观了解图像采集、数据标注与模型推理流程；借助YOLOv8，可以学习目标检测模型的训练、调参与优化过程。同时，引入DeepSeek，还能让学生体验智能分析与人机交互，例如通过自然语言查询检测结果或生成实验报告。这种系统不仅具有较强的实践教学价值，还可以作为科研平台，用于探索更高精度的缺陷检测算法或多模态融合方法。通过真实工业场景数据的引入，学生能够更好地理解理论与实践之间的联系，从而培养面向智能制造领域的复合型技术人才。

5. 中小企业智能化升级场景

对于中小型PCB制造企业而言，全面引入昂贵的自动化检测设备往往成本过高，而人工检测又难以保证稳定性。基于YOLOv8的轻量化检测方案可以部署在普通工业相机与计算设备上，大幅降低硬件成本；通过PyQt5提供简单易用的操作界面，即使非专业人员也能快速上手使用。结合DeepSeek，系统还可以提供操作指导、异常解释甚至改进建议，降低使用门槛。这一场景使中小企业能够以较低投入实现质量检测自动化，逐步向智能制造转型，同时提升产品一致性与市场竞争力。

三．核心功能

1.登录注册

1.登录

软件启动后首先进入登录页面，用户需要输入正确的用户名和密码，经过系统验证后方可使用本系统的正式功能。登录页面整体采用垂直布局，使信息层次清晰、结构简洁，同时在局部区域辅以水平布局，以提升界面的灵活性与可读性。整体设计风格遵循"简约而不简单"的原则，在保证视觉美观的同时，也兼顾操作的直观性与易用性。

在功能实现方面，登录模块的后端采用sqlite3文件型数据库来存储用户信息，包括用户名、密码及相关基础数据。每次用户发起登录请求时，系统都会通过查询数据库进行身份校验，确保输入信息的准确性与安全性，从而实现规范化、标准化的登录流程。

同时，我们设计了统一风格的登录与注册界面，用于展示系统与用户交互所需的全部组件。界面顶部以醒目的标题形式展示系统名称，增强整体识别度与专业性。通过合理布局输入框、按钮及提示信息，使用户在使用过程中能够快速理解操作步骤，从而提升整体使用体验。

2.注册

对于尚未拥有账号的用户，需要先完成注册操作后才能使用系统功能。整体注册流程设计得较为简洁直观，用户只需在登录界面点击"注册"按钮，即可快速跳转至注册窗口，无需复杂的页面切换或额外步骤。在注册界面中，用户需要填写自定义的用户名，并输入两次一致的密码以完成身份信息的确认。这种双重密码输入机制可以有效避免因输入错误而导致的登录失败问题，从而提升系统的可靠性与用户体验。

在用户成功完成注册后，系统还提供了一项便捷的优化设计：自动将刚刚注册的用户名和密码填充到登录界面中。用户无需再次手动输入信息，即可直接进行登录操作。这一设计在一定程度上简化了登录流程路径，减少了重复操作，提高了整体使用效率。同时，该功能也体现了系统在交互细节上的人性化考虑，使用户在首次使用时能够获得更加顺畅和友好的体验。

2.主界面

用户通过输入自己的用户名和密码登录到本系统后进入主界面，主界面内容十分丰富，我来一一介绍：首先软件整体是垂直布局，顶部是系统的标题，从左到右依次展示了系统的作者信息、系统名称、当前时间以及CPU内存占用情况，下方为水平布局，左侧是系统的导航区域，我们设计了windows风格支持展开与收缩的内容导航区域，右侧是内容核心区域，通过点击导航按钮切换展示内容，主界面主要展示了以日期为维度统计的数据、用户信息操作按钮、系统信息、系统环境信息以及实时CPU、内存可视化折线图

3.图像检测界面

1.检测结果展示

用户通过点击左侧导航栏按钮切换到图像检测界面，在此界面支持选择图像进行输入，用户选择完之后被选择的图像会展示在左侧并且展示图像绝对路径信息，用户可以通过点击右侧的"进行检测"按钮对输入的图像数据进行检测，系统会自动调用YOLOv8相关算法根据指定的参数对输入图像内容进行检测，最后将检测结果展示到右侧，这样用户可以通过比对左右图像的区别得到直观的检测结果，系统自动使用红色边框框选出目标区域并且使用红色文字展示出目标类别以及它的置信度，这些参数和展示效果都可以在设置页面进行详细设置。

2.导出检测结果

我们在界面中专门设置了检测结果展示区域，用于集中呈现系统输出的信息。该区域不仅包含检测目标数量的统计展示，还提供了结构清晰的详细检测结果表格。通过这种方式，用户可以直观地查看每一条检测数据，包括目标类别、置信度以及对应位置信息等内容，从而更全面地了解检测情况。整体布局兼顾信息密度与可读性，使数据展示既完整又不显杂乱。

此外，在检测任务完成之后，界面右侧的三个功能按钮会自动由不可用状态切换为可点击状态，避免用户在未生成结果前进行误操作。这三个按钮分别承担不同的功能，其中"导出结果"按钮允许用户将检测数据保存到本地。系统支持多种导出格式，包括Excel、CSV以及TXT，用户可以根据实际需求灵活选择合适的文件类型，以便后续分析或归档使用。以Excel格式为例，导出的文件通常采用表格结构，对应字段清晰排列，便于用户进一步查看与处理数据。

3.可视化展示

然后就是可视化展示，用户可以点击进行可视化按钮，查看对于本次检测的可视化效果，系统内置了四种可视化效果：分别是：目标位置热力图、目标面积占比、置信度分布直方图、检测能力柱状图，这些图标通过不同维度对当前数据进行了可视化展示，更便于用户理解，这里指的一体的是，支持可视化图表进行导出操作，用户可以点击紫色的导出按钮，对当前的可视化效果图表进行导出，生成一张本地的PNG图像文件。

4.AI（DeepSeek）智能分析

在每次检测任务完成并展示检测结果之后，系统为用户提供了一种便捷且智能的交互方式：用户只需点击界面右下角悬浮的机器人图标，即可触发对当前检测结果的深度AI分析功能。系统会自动将本次检测所得到的所有关键信息------包括检测到的目标类别、置信度分数、目标位置坐标、数量统计以及可能存在的异常或遮挡情况等------完整地作为输入传递给后端AI大模型。AI模型接收到这些数据后，会基于其强大的语义理解与逻辑推理能力，对本次检测结果进行多维度的智能评估。评估内容可以包括：检测结果的准确性与可靠性判断、识别结果中可能存在的误检或漏检风险提示、针对当前场景的优化建议、对异常情况的详细解释，甚至能够根据历史检测数据的模式给出趋势分析或预警信息。这一设计不仅使用户无需手动复制或整理检测数据就能获得即时的专业分析反馈，更重要的是，它实现了一种通用化的AI能力接入机制：检测模块与分析模块实现了解耦，任何检测结果都可以以统一格式传递给AI进行分析，而AI的具体分析逻辑可以根据需要灵活替换、升级或定制。这使得系统在未来可以轻松扩展更多智能功能，例如接入不同的大模型、增加多模态分析能力、实现检测策略的自适应调整等，极大地提升了整个系统的可扩展性与智能化水平。

这里是软件的另外一个核心：AI智能分析，我们的目标检测系统接入了DeepSeek大模型，支持对当前检测结果数据进行AI分析，AI会通过不同维度对当前检测结果进行多角度分析，最后生成检测结果分析报告，用户可以根据这个结果对系统进行调整，不断完善系统功能和目标检测准确度！

在AI分析结束后下方会展示一些按钮，用户可以方便地复制结果、导出文本内容、生成PDF报告、重新生成以及关闭，多重的操作方式给于用户了多种选择！

4.视频检测界面

1.视频文件检测

我们的系统支持视频内容中的球体检测，支持输入的视频类型包括：视频文件、视频流以及摄像头，通过识别视频画面的内容对内容中的目标球体进行检测，试试标注与展示，通过相关帧率控制保证了视频的流畅性，用户可以通过比对左右两侧的画面使用肉眼评估当前检测结果，我们的视频检测界面拥有图像检测界面相同的操作功能，这里不多赘述。

2.摄像头内容检测

用户点击"进行检测"按钮之后系统会自动调用摄像头，打开摄像头展示摄像头画面，实时检测目标画面中的球体，通过左右画面比对让用户看到检测结果，这里本人就不露脸啦~

5.模型指标评估

在这个页面中我们通过三个tab展示了模型训练结果评估，分别是：训练结果图、训练结果详情、整体评估，所有的训练结果文件（夹）以及相关作用可见下面图标：

文件/文件夹名	类型	作用说明
`weights/`	文件夹	存放训练得到的模型权重
├─ `best.pt`	文件	在验证集上表现最好的模型（推荐用于推理/部署）
├─ `last.pt`	文件	最后一轮训练结束时的模型（包含最新状态）
`results.csv`	文件	每个 epoch 的训练与验证指标（loss、mAP、precision 等）
`results.png`	图片	训练过程中各类指标变化曲线（loss、mAP 等可视化）
`confusion_matrix.png`	图片	混淆矩阵，展示类别预测情况
`confusion_matrix_normalized.png`	图片	归一化后的混淆矩阵
`PR_curve.png`	图片	Precision-Recall 曲线
`P_curve.png`	图片	Precision 曲线
`R_curve.png`	图片	Recall 曲线
`F1_curve.png`	图片	F1-score 曲线
`labels.jpg`	图片	数据集中标签分布（类别统计）
`labels_correlogram.jpg`	图片	标签相关性图（用于分析数据分布）
`train_batch*.jpg`	图片	训练批次样本可视化（带标注框）
`val_batch*.jpg`	图片	验证批次样本可视化
`args.yaml`	文件	本次训练的完整参数配置（超参数、路径等）
`hyp.yaml`（部分版本）	文件	超参数配置（学习率、增强策略等）
`opt.yaml`（旧版本可能有）	文件	训练选项记录（已逐渐被 args.yaml 替代）
`events.out.tfevents.*`	文件	TensorBoard 日志文件（用于可视化训练过程）

1.训练结果图tab

本系统基于 PyQt5 + YOLOv8 + DeepSeek 构建，实现对口罩佩戴状态的智能检测与可视化分析。在结果展示模块的该 tab 页面中，集中呈现模型训练与评估阶段生成的多维度指标图像，包括训练损失与性能指标曲线图、PR 曲线、Precision 曲线、Recall 曲线、F1 曲线，以及混淆矩阵与归一化混淆矩阵。同时还提供标签分布图与标签相关性图，用于分析数据集结构与类别关系。

这些图像以直观的方式嵌入界面中，用户无需额外操作即可快速浏览模型整体表现。例如，PR 曲线可反映模型在不同阈值下的查准率与召回率平衡，F1 曲线用于综合衡量模型性能，而混淆矩阵则清晰展示分类正确与误判情况。标签分布与相关性图则有助于判断数据是否均衡及类别间的潜在关联。

在交互设计上，用户可通过点击图像本身，或点击底部提供的图像路径，调用系统默认图像查看工具进行放大查看，提升细节分析能力。每张图像下方均附有简明且专业的说明文案，帮助用户理解其评估意义及应用价值，从而更全面地掌握模型训练效果与优化方向。

2.训练结果详情tab

在该子 tab 页面中，系统进一步对训练过程中的 results.csv 数据进行了结构化展示。通过将原始训练日志解析为二维表格，完整呈现模型在每一轮（epoch）中的关键指标变化情况，使用户能够以更加清晰、系统化的方式回顾训练全过程。界面设计上采用了简洁清新的视觉风格，并结合横向渐变配色对不同数值区间进行区分，使数据变化趋势更加直观，重点指标一目了然。

表格中包含了完整的字段信息，例如"轮次"和"时间"用于标识训练进度；"训练/边界框损失""训练/分类损失""训练/DFL损失"反映模型在训练阶段的收敛情况；"指标/精确率(B)""指标/召回率(B)"以及"指标/mAP@0.5(B)"和"指标/mAP@0.5:0.95(B)"用于综合评估模型检测性能；对应的"验证/边界框损失""验证/分类损失""验证/DFL损失"则用于判断模型的泛化能力与是否存在过拟合现象。此外，"学习率/pg0""学习率/pg1""学习率/pg2"展示了不同参数组在训练过程中的学习率动态变化，有助于分析优化策略的效果。

在交互体验方面，表格支持滚动浏览与高亮显示，用户可以快速定位关键轮次的数据变化。同时结合渐变色视觉编码，能够快速识别性能提升或波动区间。通过这一模块，用户不仅可以精确掌握模型训练的细节，还能够为后续参数调优与模型改进提供可靠的数据支撑，实现从"可视化观察"到"数据驱动优化"的有效过渡。

3.整体评估tab

在该页面中，系统对模型训练结果进行了更高层次的综合评估与总结分析。通过对关键指标进行统一整理与可视化表达，结合细致的颜色编码机制，将不同阶段的性能变化趋势清晰呈现出来，使用户能够从整体上把握模型训练的动态过程，而不仅仅停留在单一指标的观察。

在评估维度上，系统重点围绕多个核心方面展开。首先是收敛质量 ，通过训练与验证损失曲线的变化趋势，判断模型是否稳定收敛以及是否存在震荡或过早收敛的问题；其次是检测性能 ，结合 Precision、Recall 以及 F1 等指标，分析模型在目标检测任务中的准确性与覆盖能力；在泛化能力 方面，通过对比训练集与验证集指标差异，评估模型是否存在过拟合或欠拟合现象；同时利用 mAP 综合表现 （包括 mAP@0.5 与 mAP@0.5:0.95）对模型整体检测能力进行量化衡量，从多阈值角度反映检测精度的稳定性。

此外，系统还对学习率调度策略 进行了分析，通过展示不同参数组学习率随训练轮次的变化情况，帮助用户判断当前优化策略是否合理，以及是否需要进一步调整以提升训练效率或稳定性。所有评估结果均通过分层颜色与趋势变化进行突出展示，使关键结论更加直观易读。

在页面的最后部分，系统基于上述多维度分析结果，自动生成整体评估结论，并从工程应用视角给出总结性判断。例如模型是否已达到可部署标准、是否需要继续训练或优化数据集、以及在实际口罩检测场景中的预期表现。这种从数据到结论的完整闭环设计，有助于用户快速完成模型质量评估，并为后续系统部署与迭代提供明确依据。

6.数据查看界面

"历史数据"页面是系统中用于集中查看与管理过往记录的重要模块，整体设计清晰直观，通过两个独立的 Tab 实现不同维度数据的分类展示，方便用户快速切换与定位信息。

总体而言，"历史数据"页面通过清晰的结构划分与完善的功能设计，实现了检测记录与用户信息的高效管理与展示，为系统的运维与决策提供了有力支持。

1.历史数据tab

在"检测历史数据"Tab中，页面以结构化表格的形式呈现所有检测相关记录。每一条数据都包含关键字段：数据库ID用于唯一标识记录，目标类型用于说明检测对象的类别，检测结果用于反馈检测结论，检测日期则记录具体的时间信息。该模块不仅实现了数据的完整展示，还特别强化了可用性与交互体验------支持分页浏览功能，用户可以根据数据量分批查看内容，同时提供"跳转到第一页"、"上一页"、"下一页"以及"最后一页"等操作按钮，便于在大量数据中高效导航。这种分页机制有效避免了数据过载带来的性能问题，同时也提升了界面的响应速度和用户体验。

2.用户数据tab

其次，在"用户数据"Tab中，系统汇总展示了所有已注册用户的信息，是一个用于用户管理与审计的重要视图。页面同样采用表格形式，列出了数据库ID、用户名、用户角色以及最后登录日期时间等核心字段。通过这些信息，管理员可以快速了解系统用户的基本情况及活跃状态，例如判断某些用户是否长期未登录，从而进行进一步管理操作。该部分数据覆盖范围全面，确保系统管理者能够掌握整体用户分布与使用情况。

7.系统设置界面

本系统提供了较为完善且直观的参数配置功能，能够满足用户在目标检测过程中的多样化需求。用户可以根据实际应用场景，自由选择和切换不同的目标检测模型，以获得更合适的检测效果。同时，系统支持对字体位置进行灵活调整，方便在界面中展示检测结果信息。此外，还可以设置关键的检测参数，例如置信度阈值（Conf）和交并比阈值（IOU），从而在检测精度与召回率之间取得平衡。

在检测结果的展示方面，系统同样提供了多种控制选项，包括是否显示检测框、是否展示目标类别标签、是否显示目标置信度数值，以及是否启用文字背景等。这些细致的配置可以帮助用户根据需求优化可视化效果，提高信息的清晰度和可读性。

为了提升使用体验，系统还设计了便捷的操作按钮。用户可以点击绿色的刷新按钮以更新当前可用的模型列表，也可以通过刷新字体功能加载新的字体文件。此外，系统支持通过点击退出按钮快速退出当前界面或直接退出登录。整体而言，该设置页面实现了目标检测参数的灵活配置与高效管理，兼顾实用性与易用性。

8.关于软件界面

我们使用富文本html的形式展示了软件相关的信息，包括系统用到的相关技术，对于二维的数据使用二维表进行了展示，最底部放置了四个按钮，分别是：关于YOLO、关于软件、关于作者、关于QT，点击之后都会弹出对应的信息提示框，这个页面的作用是让用户更多的了解软件和创作者信息，跨过技术的鸿沟！

四．数据集

本系统所使用的数据集围绕老鼠目标的多场景、多角度、多状态采集构建而成，旨在提升模型在真实环境中的适应性与鲁棒性。数据来源涵盖多类复杂场景，结合不同光照条件、摄像头分辨率、遮挡程度与背景干扰，使模型能够学习到多样化的外观特征与环境变化。图像中包含站立、奔跑、觅食、半遮挡、远距离、小尺寸目标等多种姿态，并覆盖不同体型、颜色与运动模糊情况下的样本。数据集中不仅包含清晰标注的边界框，还对类别与置信度进行了严格校验，以确保训练时标签可信度和质量的一致性。经过清洗、去重、增强与格式化处理后，最终数据集能够满足 YOLOv8 等高性能检测模型的训练需求，使模型在实际部署中具备更强的泛化能力，即便在光照不足、目标部分遮挡或背景复杂的情况下，也能保持稳定识别效果。该数据集为系统实现高精度、高实时性的老鼠检测奠定了坚实基础。

1.数据准备

本系统附带699张不同车型图像和699个数据标注文件，大家可以根据自己的情况自行训练数据自己的模型！

我们使用VOC的格式存储数据标注文件，单数据标注文件内容如下：

bash 复制代码

0 0.2740606460118655 0.20870113493064313 0.018787079762689517 0.04287515762925599
0 0.10398813447593935 0.21027742749054223 0.024719841793012523 0.0510718789407314
0 0.3587673038892551 0.6800126103404792 0.014172709294660513 0.035939470365699874
0 0.5420237310481213 0.2682849936948298 0.02142386288727752 0.043505674653215635

2.数据集处理

1.数据集标注文件类型转换

直接使用VOC格式的数据标注文件进行训练是不行的，需要我们将xml转成txt文件，

这段代码的作用是将指定文件夹中的 Pascal VOC 格式的 XML 标注文件批量转换为 YOLO 格式的 TXT 标注文件。它会先遍历所有 XML 自动统计有效类别并生成类别到 ID 的映射表，忽略类别名为 "not" 的标注，然后读取对应图片的尺寸，将 XML 中的边界框坐标转换为 YOLO 的归一化格式（class_id x_center y_center width height），最后将生成的 TXT 文件保存到指定目录中，便于直接用于 YOLO 训练。

大家首先执行step1_json_to_txt.py

python 复制代码

import json
import os
from collections import defaultdict
import cv2

# ====== 路径配置 ======
import numpy as np

from train_conf import BASE_DIR

json_path = BASE_DIR + r"Annotations\val.json"
img_dir = BASE_DIR + "\defect"
output_dir = os.path.join(BASE_DIR, "labels")


os.makedirs(output_dir, exist_ok=True)

with open(json_path, 'r', encoding='utf-8') as f:
    data = json.load(f)

# 建立 image_id -> image 信息映射
images = {img['id']: img for img in data['images']}

# 分类映射（如果有 categories）
category_map = {}
if 'categories' in data:
    for i, cat in enumerate(data['categories']):
        category_map[cat['id']] = i  # YOLO要求从0开始

# 生成每张图的txt
label_dict = {}

for ann in data['annotations']:
    image_id = ann['image_id']
    bbox = ann['bbox']  # [x, y, w, h]
    cat_id = ann['category_id']

    img = images[image_id]
    img_w = img['width']
    img_h = img['height']

    # 转YOLO格式
    x, y, w, h = bbox
    x_center = (x + w / 2) / img_w
    y_center = (y + h / 2) / img_h
    w /= img_w
    h /= img_h

    yolo_cat = category_map.get(cat_id, cat_id)

    line = f"{yolo_cat} {x_center} {y_center} {w} {h}\n"

    file_name = img['file_name'].replace('.jpg', '.txt')

    if file_name not in label_dict:
        label_dict[file_name] = []
    label_dict[file_name].append(line)

# 写入txt文件
for file_name, lines in label_dict.items():
    with open(os.path.join(output_dir, file_name), 'w') as f:
        f.writelines(lines)

print("转换完成！")

2.数据集拆分

YOLO 推荐训练集和测试集按 8:2 划分，主要是因为目标检测对样本量非常依赖，需要尽可能多的训练数据来学习特征，同时又必须保留足够的独立测试数据来评估模型的真实泛化能力。8:2 被证明在"训练数据够多"与"测试评估足够稳定"之间取得了较好平衡，因此成为默认且通用的实践比例。

这个脚本的作用是从已有的图片和 YOLO 标注文件中随机抽取 200 张图片，并将它们按照训练集和验证集的比例进行划分，然后将对应的图片和 TXT 标注文件复制到新的数据集目录中，方便直接用于训练 YOLO 模型。脚本会先创建训练集和验证集的图片、标签子目录，然后随机选择指定数量的张图片，其中五分之一作为验证集，其余五分之四作为训练集，复制过程中会保证每张图片对应的标注文件也被同步复制，如果标注文件不存在，会生成一个空的 TXT 文件，以保持文件结构完整。运行完成后，新的数据集就整理好了，可以直接用于训练和验证。。最终会在目标目录下生成：

执行脚本step2_auto_part.py

bash 复制代码

import os
import random
import shutil
from train_conf import BASE_DIR

# 原始数据路径
img_dir = BASE_DIR + "images"
label_dir = BASE_DIR + "labels"

# 新数据集路径
dataset_dir = BASE_DIR + "dataset"
MAX_IMAGE_COUNT = 200
train_img_dir = os.path.join(dataset_dir, "train", "images")
train_label_dir = os.path.join(dataset_dir, "train", "labels")
val_img_dir = os.path.join(dataset_dir, "val", "images")
val_label_dir = os.path.join(dataset_dir, "val", "labels")

# 创建目录
for dir_path in [train_img_dir, train_label_dir, val_img_dir, val_label_dir]:
    os.makedirs(dir_path, exist_ok=True)

# 获取所有图片文件
all_images = [f for f in os.listdir(img_dir) if f.lower().endswith((".jpg", ".png", ".jpeg"))]

# 随机抽取MAX_IMAGE_COUNT张
if len(all_images) < MAX_IMAGE_COUNT:
    raise ValueError(f"图片数量不足MAX_IMAGE_COUNT张，当前数量: {len(all_images)}")

selected_images = random.sample(all_images, MAX_IMAGE_COUNT)

# 分割训练集和验证集
random.shuffle(selected_images)
val_images = selected_images[:40]
train_images = selected_images[40:]


def copy_files(image_list, target_img_dir, target_label_dir):
    for img_file in image_list:
        # 复制图片
        src_img_path = os.path.join(img_dir, img_file)
        dst_img_path = os.path.join(target_img_dir, img_file)
        shutil.copy(src_img_path, dst_img_path)

        # 对应的txt
        label_file = os.path.splitext(img_file)[0] + ".txt"
        src_label_path = os.path.join(label_dir, label_file)
        if os.path.exists(src_label_path):
            dst_label_path = os.path.join(target_label_dir, label_file)
            shutil.copy(src_label_path, dst_label_path)
        else:
            # 如果没有对应txt文件，创建一个空文件
            open(os.path.join(target_label_dir, label_file), "w").close()


# 复制训练集
copy_files(train_images, train_img_dir, train_label_dir)
# 复制验证集
copy_files(val_images, val_img_dir, val_label_dir)

print(f"随机抽取完成！训练集: {len(train_images)} 张，验证集: {len(val_images)} 张")
print(f"数据集路径: {dataset_dir}")

3.模型训练

数据集准备好之后就可以开始模型训练了，我们首先准备一个训练的配置文件，比如说是data.yaml

然后就可以开始模型训练了，直接执行我们准备好的train.bat文件，内容就是下面的内容

bash 复制代码

yolo task=detect mode=train model=../data/model/yolov8n.pt data=./data.yaml epochs=30 imgsz=640  batch=16 lr0=0.01

用户亦可执行step4_train_model.py脚本进行模型训练

python 复制代码

from ultralytics import YOLO


def main():
    # 加载模型
    model = YOLO("../data/model/yolov8n.pt")

    # 开始训练
    model.train(
        data="./data.yaml",  # 数据集配置
        epochs=50,  # 训练轮数
        imgsz=640,  # 输入尺寸
        batch=16,  # batch size
        lr0=0.01,  # 初始学习率
        task="detect"  # 任务类型
    )


if __name__ == "__main__":
    main()

然后模型就开始训练了

这里我贴一些训练验证结果截图

最后的results.png见下图，训练效果还是可以的！

bash 复制代码

# ✅ **整体结论**

这次训练表现为：

👉 **前期稳定启动 → 中期快速学习 → 后期高质量收敛**

属于典型的**优质训练曲线形态**，并且：

* 没有明显震荡或崩溃
* 没有过拟合迹象
* 后期指标稳定在高位

👉 可以直接归类为：
**"收敛充分 + 泛化良好 + 可用性较强"的模型结果**

---

# 📉 **一、收敛质量**

### ✅ 1. train loss 全面、持续下降

从 epoch 1 → 50：

* `train/box_loss`：**4.32 → 1.69（↓60%+）**
* `train/cls_loss`：**9.77 → 1.68（↓80%+，极其明显）**
* `train/dfl_loss`：**2.26 → 0.95（↓50%+）**

👉 特点：

* 下降**连续且平滑**
* 几乎没有异常抖动
* 中后期仍在缓慢优化

📌 这说明：
👉 模型在**分类 + 定位 + 边界学习**三个维度都学到了东西
👉 是"真实学习"，不是碰运气收敛

---

### ✅ 2. 验证集 loss 同步下降（非常关键）

* `val/box_loss`：3.09 → 1.90
* `val/cls_loss`：8.12 → 2.01
* `val/dfl_loss`：1.56 → 1.00

👉 和 train 几乎**同趋势下降**

📌 这点非常重要：
👉 **训练集 ≈ 验证集走势一致**

说明：

✅ 没有明显过拟合
✅ 泛化能力健康
✅ 数据分布匹配良好

👉 这是工业场景里**最有价值的特征之一**

---

# 🚀 **二、检测性能（提升过程非常漂亮）**

## ✅ 1. 模型"不是一开始就会，而是学出来的"

前 5 epoch：

* precision / recall / mAP 全是 **0**

👉 这反而是好事：
说明模型是**从完全不会 → 逐步学会**

---

## ✅ 2. 中期进入"加速学习阶段"（第 10--25 epoch）

关键变化：

* mAP50：**0.12 → 0.42**
* mAP50-95：**0.04 → 0.20**
* recall：**0.07 → 0.38**

👉 提升是**连续+稳定+无断层**

📌 说明：
👉 数据是"可学习的"
👉 模型结构是"匹配任务的"

---

## ✅ 3. 后期（30 epoch 之后）进入稳定高性能区间

### 核心指标：

* **mAP50：稳定在 0.45 -- 0.52**
* **mAP50-95：稳定在 0.20 -- 0.24**
* **precision：最高达到 0.79**
* **recall：稳定在 0.43 -- 0.49**

👉 特点：

✔ 没有回退
✔ 没有震荡
✔ 高位"横盘稳定"

📌 这非常关键：
👉 说明模型已经**真正收敛，而不是偶然峰值**

---

# 🎯 **三、Precision / Recall（结构非常健康）**

整体表现：

* precision：**0.63 → 0.79（最高）**
* recall：**0.35 → 0.49**

👉 呈现典型优质特征：

✅ precision 持续上升（误检减少）
✅ recall 稳步提高（漏检减少）

📌 更重要的是：

👉 **两者没有严重失衡**

这意味着：

✔ 模型不是"只会保守预测"
✔ 也不是"乱检测"

👉 是一个**可控、可调优的检测器**

---

# 📊 **四、mAP 表现（真实可靠型，而非虚高型）**

最终水平：

* mAP50 ≈ **0.50+**
* mAP50-95 ≈ **0.24 左右**

👉 这个数值的优点在于：

✔ 稳定
✔ 连续提升得到
✔ 与 loss / PR 曲线一致

📌 换句话说：

👉 **不是"刷指标"，而是"真实能力"**

---

# ⚙️ **五、学习率策略（非常标准且有效）**

学习率变化：

* warmup：**9e-5 → 8e-4**
* 后期衰减到：**~3e-5**

👉 对应效果：

* 前期：快速下降 loss
* 中期：性能快速提升
* 后期：细节优化稳定

📌 特征：

👉 **没有出现 loss 爆炸 / 指标震荡**

说明：

✅ LR 设置合理
✅ 调度策略有效
✅ 模型对优化器响应良好

---

# 🧠 **六、工程视角（这一段很加分）**

这份结果从工程角度看有几个很强的优点：

### ✅ 1. 训练过程"可复现性强"

* 曲线平滑
* 没有随机异常点

👉 很适合复现实验 / 写论文 / 做对比

---

### ✅ 2. 模型"稳定性很好"

* 后期指标几乎不波动
* 没有性能崩塌

👉 非常适合：

✔ 实际部署
✔ 长时间运行
✔ 批量推理

---

### ✅ 3. 已经具备"可用级别能力"

虽然不是极致 SOTA，但：

👉 已经达到了：

✔ 可用
✔ 可优化
✔ 可迭代

的工程标准

---

# 🏁 **最终评价（强化版总结）**

这次训练可以定义为：

👉 **一次"收敛充分 + 过程稳定 + 泛化良好 + 指标可靠"的高质量训练**

核心优点总结：

✅ loss 三项全面、持续下降（非常干净）
✅ train / val 完全同趋势（泛化优秀）
✅ mAP 持续提升且后期稳定（不是虚高）
✅ precision / recall 平衡良好（结构健康）
✅ 学习率策略发挥正常（无异常）
✅ 后期稳定性强（适合部署）

---

# 📌 一句话结论（给你用在报告里）

👉
**该模型训练过程稳定、收敛充分，性能指标持续提升且在后期保持稳定高位，表现出良好的泛化能力与工程可用性，是一次质量较高的训练结果。**

五．关于项目

1.开发环境

本系统是在 Windows 11 操作系统上进行开发的，Python 环境采用的是 Python 3.8 版本，硬件方面使用的是 AMD 处理器 ，未配备独立显卡，开发工具为 PyCharm 2021.3 版本。在整个开发与测试过程中，我们严格遵循了上述环境配置，确保了系统的稳定运行。在此特别建议所有使用者：为了避免出现因版本过新而导致的"不兼容"情况，请大家尽量不要使用过高的 Python 版本（如 Python 3.11 及以上），也不要使用最新的 PyCharm 或操作系统版本。因为较新的环境可能对部分依赖库或语法特性支持不佳，容易引发意外的报错或功能异常。遵循本项目所推荐的版本配置，能够最大程度地保证系统的顺利部署与稳定运行。

2.项目部署

1.项目依赖

博主是在Windows电脑上使用Python3.8开发的本系统，建议大家使用的Python版本别太高。

其中项目依赖为：

bash 复制代码

PyQt5==5.15.11
QtAwesome==1.3.1
torch==2.4.1
torchvision==0.19.1
Pillow==9.3.0
pyqtgraph===0.13.3
PyQtWebEngine==5.15.5
opencv-python==4.10.0.82
ultralytics==8.3.234
Requests==2.32.5
pandas==2.0.3
numpy==1.24.4
Markdown==3.4.4

我已经整理到了requirements.txt，大家直接使用命令
pip install -r requirements.txt

即可一键安装项目依赖，其中的torch和torchvision只要匹配即可，不一定非要和博主开发环境的版本一致。

2.项目结构

很多小伙伴担心拿到代码后项目看不懂，这个大家不必担心，我们采用文件+类名对相关功能进行了模块化定义，大家见名知意。

下图博主采用tree命令生成了文件、目录树

bash 复制代码

tree "D:\projects\gitee\2026\yolo_projects\yolov8-pcb-defect-detect" /f /a

bash 复制代码

D:\PROJECTS\GITEE\2026\YOLO_PROJECTS\yolov8-pcb-defect-detect
|   main.py（系统入口）
|   requirements.txt（项目依赖）
|
+---data（数据目录）
|   +---database（数据库）
|   |       data.db
|   |
|   |
|   +---font（字体目录）
|   |       hanyi_yahei.ttf
|   |
|   \---model（模型目录）
|           best.pt
|           yolov8n.pt
|
+---model_train（模型训练脚本目录）
|   |   data.yaml
|   |   step1_yolo_to_txt.py
|   |   step2_auto_part.py
|   |   step3_train_model.py
|   |   step4_test_model.py
|   |   train.bat
|   |
|   +---runs
|   |   \---detect
|   |       \---train
|   |           |   args.yaml
|   |           |   confusion_matrix.png
|   |           |   confusion_matrix_normalized.png
|   |           |   events.out.tfevents.1776169070.Admin.10148.0
|   |           |   F1_curve.png
|   |           |   labels.jpg
|   |           |   labels_correlogram.jpg
|   |           |   PR_curve.png
|   |           |   P_curve.png
|   |           |   results.csv
|   |           |   results.png
|   |           |   R_curve.png
|   |           |   train_batch0.jpg
|   |           |   train_batch1.jpg
|   |           |   train_batch2.jpg
|   |           |   train_batch400.jpg
|   |           |   train_batch401.jpg
|   |           |   train_batch402.jpg
|   |           |   val_batch0_labels.jpg
|   |           |   val_batch0_pred.jpg
|   |           |   val_batch1_labels.jpg
|   |           |   val_batch1_pred.jpg
|   |           |
|   |           \---weights
|   |                   best.pt
|   |                   last.pt
|   |
|   \---test_images
|           train_5.jpg
|
+---script
|       create_qrc.py
|
\---src（项目源码目录）
    +---conf（配置目录）
    |       icon_conf.py
    |       style_conf.py
    |       system_conf.py
    |       test_data.py
    |       __init__.py
    |
    +---engine（引擎目录）
    |       engines.py
    |       __init__.py
    |
    +---resource（资源目录）
    |   |   resource.qrc
    |   |   resource_rc.py
    |   |   __init__.py
    |   |
    |   +---imgs
    |   |       ai.gif
    |   |       ai.svg
    |   |       bg.jpeg
    |   |       login_gif.gif
    |   |
    |   \---js
    |           echarts.min.js
    |
    +---threads（线程目录）
    |       main_threads.py
    |       signal_bus.py
    |       __init__.py
    |
    +---utils（工具目录）
    |       custom_utils.py
    |       user_manager.py
    |       __init__.py
    |
    \---widgets（核心组件目录）
            base_widgets.py
            custom_pages.py
            custom_widgets.py
            main_page.py
            unique_widgets.py
            __init__.py

3.项目启动

本系统的项目启动十分简单：在安装好所有相关依赖之后，直接执行 main.py 文件，即可自动打开系统的登录注册页面。用户进入该页面后，通过输入匹配的用户名和密码完成登录操作。为方便初次体验，系统内置了一个默认账号，用户名为 admin，密码也为 admin，用户可以直接使用这组账号进行快速登录。当用户成功登录后，系统主界面会完整展示出来，而之前的登录注册页面则会自动隐藏，从而为用户提供清晰、流畅的操作体验。

4.往期优秀作品

序号	项目名称
1	python3GUI---基于PyQt5+YOLOv8+DeepSort的智慧行车可视化系统（详细介绍）
2	python3GUI--基于PyQt5+YOLOv8的智慧厨房系统（详细介绍）
3	python3GUI--基于YOLOv8深度学习的车牌识别系统（详细图文介绍）
4	【AI加持】基于PyQt5+YOLOv8+DeepSeek的钢筋点数系统（详细介绍）
5	【AI加持】基于PyQt5+YOLOv8+DeepSeek的水稻叶片疾病检测系统（详细介绍）
6	【AI加持】基于PyQt5+YOLOv8+DeepSeek的摔倒行为检测系统（详细介绍）
7	【AI加持】基于PyQt5+YOLOv8+DeepSeek的吸烟行为检测系统（详细介绍）
8	【AI加持】基于PyQt5+YOLOv8+DeepSeek的输电隐患检测系统（详细介绍）
9	【AI加持】基于PyQt5+YOLOv8+DeepSeek的结核杆菌检测系统（详细介绍）
10	python3GUI--基于PyQt5+DeepSort+YOLOv8智能人员入侵检测系统（详细图文介绍）
11	python3GUI--车牌、车牌颜色识别可视化系统 By:PyQt5（带文档）
12	python3GUI--智慧交通分析平台：By:PyQt5+YOLOv8（详细介绍）
13	python3GUI--基于YOLOv8的行车追踪与可视化分析系统 By:PyQt5（详细分享、配套文档）
14	python3GUI--网络流量分析系统 By:PyQt5（有配套文档）
15	python3GUI--基于深度学习的人脸识别管理系统（详细图文介绍）
16	【AI加持】基于PyQt+YOLO+DeepSeek的口罩佩戴检测系统（详细介绍）
17	【AI加持】基于PyQt+YOLO+DeepSeek的车型检测系统（详细介绍）

六．总结

本程序主要实现了一个集成化的目标检测与分析平台，提供图像检测、视频检测（支持本地视频、实时流媒体和摄像头）等多种输入方式，并能够实时展示检测结果与目标数量统计。同时，系统支持检测结果的保存与历史记录管理，可将数据导出为 CSV、Excel 或 TXT 文件，方便后续使用。

此外，程序还提供结果可视化展示功能，以及基于 AI 的智能分析评估功能，用于对检测数据进行进一步解读。用户可以通过界面进行模型参数配置、切换不同功能页面，并完成登录、登出等基本操作。整体功能涵盖数据采集、检测处理、结果展示、数据管理与智能分析等完整流程。

本次给大家介绍了我使用PyQt5+YOLOv8+DeepSeek的PCB缺陷检测系统，本系统功能强大，支持多种数据源输入，包含多种用户交互按钮以及模式，内置数据可视化方案、大模型AI加持，是您学习、工作使用的不错选择！

需要代码的朋友可以点击箭头下方的二维码加我好友，欢迎您了解！

如需帮助请私聊博主！