目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
数智工坊8 小时前
【SAM-DETR论文阅读】:基于语义对齐匹配的DETR极速收敛检测框架
网络·论文阅读·人工智能·深度学习·transformer
风落无尘8 小时前
LangChain 完全入门指南:从基础到实战(附面试题)
人工智能·langchain
IT_陈寒8 小时前
Vue的这个响应式陷阱,我debug了一整天才爬出来
前端·人工智能·后端
zz_lzh8 小时前
arm版AI牛马:armbian(rk3588)设备部署openclaw
arm开发·人工智能·arm
AI医影跨模态组学8 小时前
如何通过影像组学模型无创预测三阴性乳腺癌中的三级淋巴结构(TLSs),并借助病理组学揭示其与治疗响应、预后及细胞侵袭性表型的机制联系
人工智能·论文·医学·医学影像·影像组学·医学科研
Awesome Baron9 小时前
skill、tool calling、MCP区别
开发语言·人工智能·python
CN-Dust9 小时前
【C++】while语句例题专题
数据结构·c++·算法
十铭忘9 小时前
FLUX.1架构的理解5——Transformer之前的预处理
人工智能
weixin_446260859 小时前
城市智能化的底层基石:基于腾讯地图服务生态的移动定位与导航架构指引
大数据·人工智能·架构