目标检测前言,RCNN,Fast RCNN,Faster RCNN

一、RCNN:

找到概率最高的目标之后,与其他目标进行IOU交并比计算,若高于一定值,则说明这两张图片预测的是同一个目标,则把概率低的目标删掉

二、Fast RCNN

因为是直接得到特征图之后进行映射,所以不限制输入图像尺寸

Gx,Gy是调整中心点,Dx(P)是回归参数,exp就是e的多少次方

三、Faster RCNN

从提取到的feature map上,每个anchor生成2个概率,一个背景,一个目标。

256-d(一维向量)来历,指的是特征深度,这里使用ZF网络,如果VGG肯定就是512了。

感受野=(输出尺寸-1)*stride+kernel_size

再采用:

四、FPN结构(第四张图)

P2-P5如何分得anchor的计算方式

相关推荐
巴里巴气43 分钟前
安装GPU版本的Pytorch
人工智能·pytorch·python
「、皓子~1 小时前
后台管理系统的诞生 - 利用AI 1天完成整个后台管理系统的微服务后端+前端
前端·人工智能·微服务·小程序·go·ai编程·ai写作
说私域1 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的抖音渠道力拓展与多渠道利润增长研究
人工智能·小程序·开源
笑衬人心。1 小时前
初学Spring AI 笔记
人工智能·笔记·spring
luofeiju2 小时前
RGB下的色彩变换:用线性代数解构色彩世界
图像处理·人工智能·opencv·线性代数
测试者家园2 小时前
基于DeepSeek和crewAI构建测试用例脚本生成器
人工智能·python·测试用例·智能体·智能化测试·crewai
张较瘦_2 小时前
[论文阅读] 人工智能 + 软件工程 | Call Me Maybe:用图神经网络增强JavaScript调用图构建
论文阅读·人工智能·软件工程
大模型真好玩2 小时前
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战
人工智能·python·mcp
Baihai_IDP2 小时前
vec2text 技术已开源!一定条件下,文本嵌入向量可“近乎完美地”还原
人工智能·面试·llm
江太翁2 小时前
Pytorch torch
人工智能·pytorch·python