目标检测经典算法的个人理解

one stage

1、RCNN -> Fast-RCNN:RPN部分从用传统的算法 -> 用深度学习网络来实现。

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。

two stage

1、SSD(2016):VGG做backbone,加入多尺度特征图融合

2、Retinanet(2017):最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。

3、YOLO

目标检测算法的主要思路

1、选择候选框

2、提取特征预测候选框的类别及区域优化,所以一个候选框通常有五个参数:box的四个参数和一个类别预测值

3、loss主要由类别损失和BoundingBox的损失组成

4、算法主要的改进思路:①候选框的选取(比例、中心等) ②特征提取的网络 ③损失函数的计算 ④计算损失时采样的规则

相关推荐
火山引擎开发者社区7 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab11 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab11 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾11 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒13 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术15 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122715 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队15 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇15 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端