目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
蓝绿色~菠菜14 小时前
Multi-Agent 架构全景:10 种协作模式深度解析
人工智能·架构
TracyCoder12314 小时前
LeetCode Hot100(66/100)——118. 杨辉三角
算法·leetcode·职场和发展
葳_人生_蕤14 小时前
Leetcode HOT 100
算法·leetcode·职场和发展
智算菩萨14 小时前
ChatGPT 5.4在英语学习中的应用:经典专四英语散文《Spring Thaw》赏析
人工智能·学习·ai·chatgpt·机器翻译
balmtv14 小时前
GPT-4o推理能力深度拆解:统一多模态与端到端推理的架构革命
人工智能·架构
JFSJFX14 小时前
2026 AI手机元年:从“功能辅助”到“个人智能体”的彻底蜕变
人工智能·智能手机
仟濹14 小时前
【算法打卡day23(2026-03-15 周日)今日算法or技巧:双指针 & 链表 & 回溯算法】6个题
数据结构·算法·链表
码路高手14 小时前
Trae-Agent中的llm核心交互逻辑
人工智能
码路高手14 小时前
Trae-Agent中的记忆(Memory)机制实现
人工智能
赋创小助手14 小时前
AMD OpenClaw:本地 AI Agent 运行平台解析,RyzenClaw 与 RadeonClaw 两种架构方案意味着什么?
服务器·人工智能·深度学习·自然语言处理·架构·数据挖掘·openclaw