目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
lightinging8 分钟前
五款主流AI智能体多维对比
人工智能
love530love19 分钟前
ComfyUI MediaPipe 猴子补丁终极完善版:补全上下文管理与姿态检测兼容
人工智能·windows·python·comfyui·protobuf·mediapipe
Bruce_Liuxiaowei20 分钟前
AI攻防时间差:当漏洞发现速度碾压修复速度— 聚焦技术核心
网络·人工智能·网络安全·ai·系统安全
悟纤21 分钟前
AI生成MV
人工智能·seedance2.0·ai mv·一键mv
学会870上岸华师23 分钟前
C 语言程序设计——第一章课后编程题
c语言·开发语言·学习·算法
Clark1126 分钟前
手写LLM推理框架时,内存管理99%的人会踩的坑 | TFFInfer解析(五)——Tensor 张量系统与内存抽象(下)
人工智能
逸风尊者28 分钟前
Robotaxi 行业日报 | 2026-05-17
人工智能
Tutankaaa30 分钟前
知识竞赛的“锦囊”设计:场外求助、免答权、双倍分
人工智能
小马过河R31 分钟前
RAG检索优化策略:系统性四层框架解析
人工智能·python·算法·ai·llm·rag·问答
~kiss~38 分钟前
AI 大模型自主涌现专家 EMO 解读 : Pretraining Mixture of Experts for Emergent Modularity
人工智能