目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
happyprince3 小时前
Hugging Face Transformers 源码全景解读
人工智能
春风LiuK3 小时前
远程服务器安装 Claude Code 并配置 DeepSeek v4
人工智能
鱼很腾apoc3 小时前
【学习篇】第20期 超详解 C++ 多态:从语法规则到底层原理
java·c语言·开发语言·c++·学习·算法·青少年编程
冬奇Lab4 小时前
RAG 系列(二十):企业级 RAG 架构设计
人工智能·llm
冬奇Lab4 小时前
一天一个开源项目(第104篇):CLI-Anything - 让所有软件变成 AI 代理可调用的命令行接口
人工智能·开源·资讯
冬奇Lab4 小时前
RAG 系列(十九):增量更新——知识库如何保持新鲜
人工智能·llm
浪里行舟4 小时前
你的品牌正在被AI“遗忘”?用BuildSOM找回搜索的下一个风口
人工智能·python·程序员
程序员cxuan4 小时前
当 00 后开始用 token 给学校送礼
人工智能·后端·程序员
jkyy20144 小时前
轻量化AI营养师,如何适配多业态快速落地健康服务升级?
人工智能