目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
TGITCIC1 小时前
能源AI天团:多智能体如何破解行业复杂任务
人工智能·能源·新能源·ai agent·大模型ai·ai能源·能源大模型
我爱计算机视觉2 小时前
ICCV 2025 | VideoOrion: 将视频中的物体动态编码进大语言模型,理解视频涨点10%以上!
人工智能·语言模型·自然语言处理
不枯石2 小时前
Matlab通过GUI实现点云的随机一致性(RANSAC)配准
开发语言·图像处理·算法·计算机视觉·matlab
WWZZ20253 小时前
ORB_SLAM2原理及代码解析:Tracking::CreateInitialMapMonocular() 函数
人工智能·opencv·算法·计算机视觉·机器人·slam·感知
WWZZ20253 小时前
ORB_SLAM2原理及代码解析:Tracking::MonocularInitialization() 函数
人工智能·opencv·算法·计算机视觉·机器人·感知·单目相机
eve杭4 小时前
解锁数据主权与极致性能:AI本地部署的全面指南
大数据·人工智能·5g·ai
数字时代全景窗4 小时前
商业航天与数字经济(一):从4G、5G得与失,看6G时代商业航天如何成为新经济引擎?
大数据·人工智能·5g
L_09075 小时前
【Algorithm】双指针算法与滑动窗口算法
c++·算法
F_D_Z5 小时前
【一文理解】下采样与上采样区别
人工智能·深度学习·计算机视觉
CiLerLinux5 小时前
第三十五章 ESP32S3 摄像头实验
图像处理·人工智能·计算机视觉