【图像算法 - 28】基于YOLO与PyQt5的多路智能目标检测系统设计与实现

摘要

本文介绍了一个基于YOLO和PyQt5框架实现的多路智能目标检测系统。该系统不仅支持从本地文件、摄像头或网络流中加载视频源，还能实时进行目标检测，并记录检测结果。此外，它还提供了模型切换和检测记录导出功能，非常适合用于监控、安防等多个领域。

系统概述

本项目利用了YOLO模型进行目标检测，并通过PyQt5构建了一个用户友好的图形界面，让用户能够轻松地添加视频源、调整检测参数、查看检测结果及日志信息。整个系统的设计注重灵活性和扩展性，支持多路视频流的同时处理。

主要特性

多路视频流支持：可同时处理最多8路不同的视频流。
灵活的视频源选择：支持本地文件、摄像头、RTSP/HTTP URL等多种视频源。
实时目标检测：使用YOLO模型对视频流中的对象进行实时检测。
检测结果可视化：在界面上实时显示检测结果，并高亮显示识别到的对象。
模型切换与参数调整：允许用户随时更换使用的YOLO模型，并调整置信度、IOU等检测参数。
检测记录与导出：记录每个通道的检测日志，并支持将这些记录导出为CSV文件。

实现细节

1. 初始化YOLO模型

python 复制代码

def load_model(self):
    try:
        self.model = YOLO(self.model_path)
        # 初始化类别颜色映射
        self.class_colors = generate_random_color_mapping(self.model.names)
        self.update_status(f"模型加载成功: {os.path.basename(self.model_path)}")
        self.model_label.setText(f"当前模型: {os.path.basename(self.model_path)}")
    except Exception as e:
        self.update_status(f"模型加载失败: {str(e)}")
        self.model = None

此段代码展示了如何初始化YOLO模型并生成随机的颜色映射以便于区分不同类别的检测结果。

2. 视频流处理线程

InferenceThread 类负责从指定的视频源读取帧，调用YOLO模型进行推理，并更新UI上的结果显示。

python 复制代码

class InferenceThread(QThread):
    ...
    def run(self):
        ...
        while True:
            ...
            ret, frame = self.cap.retrieve()
            if not ret:
                continue

            frame, _ = self.process_frame(frame, current_conf, current_iou)
            self.last_processed_frame = frame
            self.update_frame_signal.emit(frame)
            self.msleep(30)
        ...

3. 用户界面设计

主窗口 (MainWindow) 包含多个组件，如按钮、滑块、标签等，用于控制视频流的选择、开始/停止操作以及调整检测参数。

python 复制代码

class MainWindow(QMainWindow):
    def init_ui(self):
        ...
        self.tabs = QTabWidget()
        scroll = QScrollArea()
        scroll.setWidgetResizable(True)
        self.streams_container = QWidget()
        self.streams_layout = QGridLayout(self.streams_container)
        scroll.setWidget(self.streams_container)
        self.tabs.addTab(scroll, "视频流")
        ...

4. 检测日志管理

系统会自动记录每个通道的检测日志，并提供导出为CSV文件的功能，方便用户进一步分析数据。

python 复制代码

def export_detection_log(self):
    if not self.all_detection_logs:
        self.update_status("无检测记录可导出")
        return

    file_path, _ = QFileDialog.getSaveFileName(
        self, "导出检测记录", "detection_log.csv", "CSV Files (*.csv)"
    )
    if file_path:
        try:
            with open(file_path, mode='w', newline='', encoding='utf-8-sig') as f:
                writer = csv.DictWriter(f, fieldnames=["时间", "通道", "源", "目标数量"])
                writer.writeheader()
                writer.writerows(self.all_detection_logs)
            self.update_status(f"检测记录已导出: {file_path}")
        except Exception as e:
            self.update_status(f"导出失败: {str(e)}")

结语

通过上述步骤，我们构建了一个功能强大且易于使用的多路智能目标检测系统。无论是对于研究者还是开发者来说，这个系统都是一个很好的起点，可以根据实际需求进行定制和扩展。希望本文能为你提供一些灵感和技术指导！