目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
冬奇Lab2 小时前
每日一个开源项目(第140篇):AgentScope 2.0 - 阿里开源的生产级 Agent 框架
人工智能·开源·agent
冬奇Lab2 小时前
Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
人工智能·开源·llm
IT_陈寒3 小时前
Vite的静态资源打包让我熬夜到三点,这坑千万别跳
前端·人工智能·后端
玩转AI不是事4 小时前
用IndexedDB做AI对话离线缓存实战
人工智能
Asize5 小时前
多模态生图:从 Vite 工程化到前端调用 Qwen Image
javascript·人工智能·后端
MobotStone5 小时前
AI项目越多,为什么越容易失控
人工智能·aigc
十有八七5 小时前
AI时代的置身X内
前端·人工智能
Lkstar5 小时前
A2A协议深度解析|Agent2Agent通信标准,智能体互联网的"HTTP"
人工智能·llm
用户938515635075 小时前
从 O(n²) 到 O(nlogn):一文读懂快速排序的“快”与“妙”
javascript·算法
百度Geek说5 小时前
当代码越来越便宜,什么在变贵?
人工智能