目标检测前言,RCNN,Fast RCNN,Faster RCNN

一、RCNN:

找到概率最高的目标之后,与其他目标进行IOU交并比计算,若高于一定值,则说明这两张图片预测的是同一个目标,则把概率低的目标删掉

二、Fast RCNN

因为是直接得到特征图之后进行映射,所以不限制输入图像尺寸

Gx,Gy是调整中心点,Dx(P)是回归参数,exp就是e的多少次方

三、Faster RCNN

从提取到的feature map上,每个anchor生成2个概率,一个背景,一个目标。

256-d(一维向量)来历,指的是特征深度,这里使用ZF网络,如果VGG肯定就是512了。

感受野=(输出尺寸-1)*stride+kernel_size

再采用:

四、FPN结构(第四张图)

P2-P5如何分得anchor的计算方式

相关推荐
m0_650108241 小时前
【论文精读】STAR:基于文本到视频模型的空间-时间增强真实世界视频超分
计算机视觉·论文精读·真实世界视频超分·liem·dp loss·图像质量提升
EasyCVR3 小时前
视频融合平台EasyCVR在智慧水利中的实战应用:构建全域感知与智能预警平台
人工智能·音视频
DisonTangor3 小时前
阿里开源Qwen3-Omni-30B-A3B三剑客——Instruct、Thinking 和 Captioner
人工智能·语言模型·开源·aigc
独孤--蝴蝶3 小时前
AI人工智能-机器学习-第一周(小白)
人工智能·机器学习
西柚小萌新3 小时前
【深入浅出PyTorch】--上采样+下采样
人工智能·pytorch·python
丁学文武4 小时前
大语言模型(LLM)是“预制菜”? 从应用到底层原理,在到中央厨房的深度解析
人工智能·语言模型·自然语言处理·大语言模型·大模型应用·预制菜
fie88894 小时前
基于MATLAB的声呐图像特征提取与显示
开发语言·人工智能
文火冰糖的硅基工坊5 小时前
[嵌入式系统-100]:常见的IoT(物联网)开发板
人工智能·物联网·架构
刘晓倩5 小时前
实战任务二:用扣子空间通过任务提示词制作精美PPT
人工智能
却道天凉_好个秋5 小时前
OpenCV(七):BGR
opencv·计算机视觉