深度学习YOLO实战:5、基于YOLO的自动化图像批量检测方案

前言

在实际应用中,我们经常会遇到需要对整个文件夹下的所有图像进行批量目标检测的场景。例如:

  • 在安防监控领域,常常要对多路摄像头拍摄的图像进行成批分析,及时发现可能存在的安全威胁;
  • 在医学影像分析中,经常需要批量读取CT或X光图像,完成病灶检测,从而帮助医生进行临床诊断;
  • 而在工业制造环节,也广泛采用图像检测技术,对产品图像做自动化的质量检测与缺陷识别。

YOLO(You Only Look Once)作为一种高效且广泛使用的目标检测算法,提供了非常便捷的接口,能够轻松应对这类批量图像处理任务。接下来,我们将通过具体代码示例,一步步说明如何对指定目录下的全部图像执行推理,并保存检测后的结果。

示例代码

假设目标图像存储在 ultralytics/assets 目录下,我们可以使用以下代码对该目录中的所有图像进行目标检测,并将检测结果保存到指定位置:

python 复制代码
from ultralytics import YOLO
# 加载预训练的 YOLO 模型
model = YOLO("yolo11n.pt") 
# 进行预测,对目录中的所有图像进行推理
model.predict(
    source=r"ultralytics/assets/",  # 指定输入目录路径
    save=True,  # 保存预测结果
    show=False,  # 不显示结果
)

参数说明

  • source 参数
    类型为字符串,用于指定待检测的数据来源。除了目录路径外,它还可以接受单张图像、视频、URL或设备ID等多种输入形式。在本例中,我们传入一个目录路径,YOLO会自动识别该目录下所有支持格式的图像文件,并依次进行检测。
  • save 参数
    类型为布尔值,用于控制是否保存检测结果。当设置为 True 时,系统会自动将标注后的结果图像输出到 runs/detect/predict 目录中。如果该目录不存在,程序会自动创建。
  • show 参数
    类型为布尔值,决定是否在推理过程中实时显示检测结果。对于批量图像处理任务,建议保持 False,这样可以避免因图形界面渲染而消耗额外资源,从而显著提升处理效率。

示例输出

运行代码后,我们可以在终端中看到类似以下的输出信息:

bash 复制代码
image 1/2 /media/becase/common/yolo/Learning/01_predict/ultralytics/assets/bus.jpg: 640x480 4 persons, 1 bus, 62.3ms
image 2/2 /media/becase/common/yolo/Learning/01_predict/ultralytics/assets/zidane.jpg: 384x640 2 persons, 1 tie, 54.2ms
Speed: 1.8ms preprocess, 58.2ms inference, 1.1ms postprocess per image at shape (1, 3, 384, 640)
Results saved to /media/becase/common/yolo/Learning/01_predict/runs/detect/predict

输出解读

这段输出提供了完整的处理详情:

  • 图像序列image 1/2 表示当前处理的是批次中的第1张图像,总共需要处理2张
  • 文件路径:显示每个被处理图像的完整存储位置
  • 分辨率信息 :如 640x480 展示了图像的尺寸规格
  • 检测结果:列出识别到的物体类别及数量,例如检测到"4 persons, 1 bus"
  • 处理速度:包含单张图像的预处理、推理和后处理耗时,以及处理时采用的张量维度
  • 结果保存路径:标注完成后文件的最终存储位置

结果可视化

处理完成后,系统会为每张输入图像生成对应的标注结果文件。以下图为例:

从图中可以看到,YOLO算法成功检测出了人物、公交车等多个目标,并使用边界框与类别标签进行了清晰标注。

总结

通过本文的演示,我们了解了使用YOLO模型对目录中所有图像进行批量检测的完整流程。只需合理设置源目录路径、保存选项和显示参数,就能快速搭建一个高效的图像分析流水线。

这种批处理能力在安防监控、医疗影像分析和工业质量检测等需要处理大量图像的场景中特别有用,不仅大幅提升了工作效率,还能保证检测结果的准确性和一致性。

相关推荐
Niuguangshuo43 分钟前
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
人工智能·计算机视觉·stable diffusion
迈火1 小时前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
wfeqhfxz25887821 小时前
YOLO13-C3k2-GhostDynamicConv烟雾检测算法实现与优化
人工智能·算法·计算机视觉
芝士爱知识a1 小时前
2026年AI面试软件推荐
人工智能·面试·职场和发展·大模型·ai教育·考公·智蛙面试
Li emily1 小时前
解决港股实时行情数据 API 接入难题
人工智能·python·fastapi
Aaron15881 小时前
基于RFSOC的数字射频存储技术应用分析
c语言·人工智能·驱动开发·算法·fpga开发·硬件工程·信号处理
J_Xiong01172 小时前
【Agents篇】04:Agent 的推理能力——思维链与自我反思
人工智能·ai agent·推理
星爷AG I2 小时前
9-26 主动视觉(AGI基础理论)
人工智能·计算机视觉·agi
2501_941837262 小时前
蛤蜊生存状态分类识别 _ 基于YOLOv10n的海洋生物检测与分类_1
yolo·数据挖掘
爱吃泡芙的小白白2 小时前
CNN参数量计算全解析:从基础公式到前沿优化
人工智能·神经网络·cnn·参数量