深度学习YOLO实战:5、基于YOLO的自动化图像批量检测方案

前言

在实际应用中,我们经常会遇到需要对整个文件夹下的所有图像进行批量目标检测的场景。例如:

  • 在安防监控领域,常常要对多路摄像头拍摄的图像进行成批分析,及时发现可能存在的安全威胁;
  • 在医学影像分析中,经常需要批量读取CT或X光图像,完成病灶检测,从而帮助医生进行临床诊断;
  • 而在工业制造环节,也广泛采用图像检测技术,对产品图像做自动化的质量检测与缺陷识别。

YOLO(You Only Look Once)作为一种高效且广泛使用的目标检测算法,提供了非常便捷的接口,能够轻松应对这类批量图像处理任务。接下来,我们将通过具体代码示例,一步步说明如何对指定目录下的全部图像执行推理,并保存检测后的结果。

示例代码

假设目标图像存储在 ultralytics/assets 目录下,我们可以使用以下代码对该目录中的所有图像进行目标检测,并将检测结果保存到指定位置:

python 复制代码
from ultralytics import YOLO
# 加载预训练的 YOLO 模型
model = YOLO("yolo11n.pt") 
# 进行预测,对目录中的所有图像进行推理
model.predict(
    source=r"ultralytics/assets/",  # 指定输入目录路径
    save=True,  # 保存预测结果
    show=False,  # 不显示结果
)

参数说明

  • source 参数
    类型为字符串,用于指定待检测的数据来源。除了目录路径外,它还可以接受单张图像、视频、URL或设备ID等多种输入形式。在本例中,我们传入一个目录路径,YOLO会自动识别该目录下所有支持格式的图像文件,并依次进行检测。
  • save 参数
    类型为布尔值,用于控制是否保存检测结果。当设置为 True 时,系统会自动将标注后的结果图像输出到 runs/detect/predict 目录中。如果该目录不存在,程序会自动创建。
  • show 参数
    类型为布尔值,决定是否在推理过程中实时显示检测结果。对于批量图像处理任务,建议保持 False,这样可以避免因图形界面渲染而消耗额外资源,从而显著提升处理效率。

示例输出

运行代码后,我们可以在终端中看到类似以下的输出信息:

bash 复制代码
image 1/2 /media/becase/common/yolo/Learning/01_predict/ultralytics/assets/bus.jpg: 640x480 4 persons, 1 bus, 62.3ms
image 2/2 /media/becase/common/yolo/Learning/01_predict/ultralytics/assets/zidane.jpg: 384x640 2 persons, 1 tie, 54.2ms
Speed: 1.8ms preprocess, 58.2ms inference, 1.1ms postprocess per image at shape (1, 3, 384, 640)
Results saved to /media/becase/common/yolo/Learning/01_predict/runs/detect/predict

输出解读

这段输出提供了完整的处理详情:

  • 图像序列image 1/2 表示当前处理的是批次中的第1张图像,总共需要处理2张
  • 文件路径:显示每个被处理图像的完整存储位置
  • 分辨率信息 :如 640x480 展示了图像的尺寸规格
  • 检测结果:列出识别到的物体类别及数量,例如检测到"4 persons, 1 bus"
  • 处理速度:包含单张图像的预处理、推理和后处理耗时,以及处理时采用的张量维度
  • 结果保存路径:标注完成后文件的最终存储位置

结果可视化

处理完成后,系统会为每张输入图像生成对应的标注结果文件。以下图为例:

从图中可以看到,YOLO算法成功检测出了人物、公交车等多个目标,并使用边界框与类别标签进行了清晰标注。

总结

通过本文的演示,我们了解了使用YOLO模型对目录中所有图像进行批量检测的完整流程。只需合理设置源目录路径、保存选项和显示参数,就能快速搭建一个高效的图像分析流水线。

这种批处理能力在安防监控、医疗影像分析和工业质量检测等需要处理大量图像的场景中特别有用,不仅大幅提升了工作效率,还能保证检测结果的准确性和一致性。

相关推荐
浆果02074 小时前
【图像卷积基础】卷积过程&卷积实现通道扩充与压缩&池化Pooling原理和可视化
深度学习·神经网络·计算机视觉
xiaok4 小时前
dify绑定飞书多维表格工具使用
人工智能
piggy侠5 小时前
百度PaddleOCR-VL:基于0.9B超紧凑视觉语言模型,支持109种语言,性能超越GPT-4o等大模型
人工智能·算法·机器学习
xiaoxiaoxiaolll5 小时前
封面论文丨薄膜铌酸锂平台实现强耦合电光调制,《Light Sci. Appl. 》报道机器学习优化新范式
人工智能·学习
XiaoYu20025 小时前
AI精准提问手册:从模糊需求到精准输出的核心技能(上)
前端·人工智能·程序员
java_logo5 小时前
Docker 部署 MinerU 教程:打造你的本地 PDF 智能处理中心
linux·运维·人工智能·docker·ai·容器·aigc
蜀中廖化5 小时前
关于架空输电线识别树障or测距相关论文阅读
论文阅读·深度学习·输电线与杆塔·输电线与树木测距
做运维的阿瑞5 小时前
鸿蒙6.0技术解析:五大行业迎来的智能化革命
人工智能·harmonyos