主流深度学习目标检测模型性能对比表

主流深度学习目标检测模型性能对比表

测试基准 :基于 COCO 2017 数据集 ,硬件参考 NVIDIA Tesla V100 GPU,输入尺寸默认模型标准配置(如 640×640),指标仅供选型参考(实际性能受骨干网络、训练策略、硬件影响)。

模型类别 模型名称 骨干网络 mAP@0.5:0.95(精度) FPS(速度) 参数量(M) 核心特点 适用场景
二阶段检测器 Faster R-CNN ResNet50+FPN 37.4 ~5 41 精度高,锚框+RPN经典架构,端到端训练 高精度需求场景(如医疗影像、卫星图像检测)
Mask R-CNN(检测+分割) ResNet50+FPN 39.8(检测) ~3 45 扩展实例分割,RoIAlign优化边框回归 检测+分割联合任务(如工业质检)
一阶段检测器 YOLOv3 Darknet53 33.0 45 61 多尺度检测,锚框机制成熟,部署简单 中等精度+实时场景(如视频监控)
YOLOv5s(轻量版) CSPDarknet53 36.7 140 7.2 工程化优化极致,训练速度快,社区生态丰富 边缘端实时检测(如无人机、机器人视觉)
YOLOv8s CSPDarknet53 44.9 110 11 Anchor-Free,支持检测/分类/分割多任务 通用实时检测,兼顾精度与速度
SSD300 VGG16 28.8 58 35 多特征图检测,早期实时模型代表 轻量级实时场景(如移动端简单目标检测)
RetinaNet ResNet50+FPN 39.1 8 38 Focal Loss解决样本不平衡,精度媲美二阶段 复杂场景检测(如密集目标、小目标)
无锚框检测器 CenterNet Hourglass-104 41.7 142 130 检测中心点+宽高,无锚框设计,小目标效果好 小目标密集场景(如行人检测、文本检测)
CornerNet Hourglass-104 40.5 29 150 检测目标角点配对,对异形目标适应性强 不规则目标检测(如工业零件、农产品检测)
Transformer基检测器 DETR ResNet50 42.0 ~2 41 纯Transformer架构,端到端无NMS,全局注意力 复杂长距离依赖场景(如遮挡目标检测)
YOLOv11 CSPDarknet53+Transformer 46.8 95 13 融合CNN+Transformer,兼顾局部/全局特征 高精度实时检测(如自动驾驶感知)
轻量化检测器 MobileNet-SSD MobileNetV2 22.2 120 4.4 深度可分离卷积,参数量极小 移动端/嵌入式设备(如手机拍照识别)
Tiny-YOLOv5 CSPDarknet-Nano 28.0 240 1.9 极致轻量化,牺牲少量精度换取速度 超低算力设备(如单片机、智能摄像头)

关键指标说明

  1. mAP@0.5:0.95:COCO 标准精度指标,覆盖 IoU 从 0.5 到 0.95 的阈值,数值越高精度越好。
  2. FPS:每秒处理图像帧数,数值越高速度越快,实时场景一般要求 FPS ≥ 30。
  3. 参数量:模型参数总量,越小越适合边缘端部署。

相关推荐
无心水15 小时前
【Harness:设计规范】15、Harness 成熟度模型(H0-H3):你的 AI 智能体在第几层
人工智能·设计规范·openclaw·养龙虾·harness·hermes·honcho
Raink老师21 小时前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
脑极体21 小时前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar21 小时前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官21 小时前
Claude Code的自动化编程
人工智能
意图共鸣1 天前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@1 天前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai1 天前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU1 天前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS1 天前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造