目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
知来者逆1 分钟前
视觉语言模型应用开发——Qwen 2.5 VL模型视频理解与定位能力深度解析及实践指南
人工智能·语言模型·自然语言处理·音视频·视觉语言模型·qwen 2.5 vl
IT_陈寒2 分钟前
Java性能优化:10个让你的Spring Boot应用提速300%的隐藏技巧
前端·人工智能·后端
Android出海6 分钟前
Android 15重磅升级:16KB内存页机制详解与适配指南
android·人工智能·新媒体运营·产品运营·内容运营
cyyt7 分钟前
深度学习周报(9.1~9.7)
人工智能·深度学习
聚客AI10 分钟前
🌸万字解析:大规模语言模型(LLM)推理中的Prefill与Decode分离方案
人工智能·llm·掘金·日新计划
max50060012 分钟前
图像处理:实现多图点重叠效果
开发语言·图像处理·人工智能·python·深度学习·音视频
麦麦麦造26 分钟前
国外网友的3个步骤,实现用Prompt来写Prompt!超简单!
人工智能
skytier35 分钟前
Construct内报错和定位解决
算法
skytier39 分钟前
Ascend print数据落盘使用
算法
闲看云起39 分钟前
从BERT到T5:为什么说T5是NLP的“大一统者”?
人工智能·语言模型·transformer