目标检测前言,RCNN,Fast RCNN,Faster RCNN

一、RCNN:

找到概率最高的目标之后,与其他目标进行IOU交并比计算,若高于一定值,则说明这两张图片预测的是同一个目标,则把概率低的目标删掉

二、Fast RCNN

因为是直接得到特征图之后进行映射,所以不限制输入图像尺寸

Gx,Gy是调整中心点,Dx(P)是回归参数,exp就是e的多少次方

三、Faster RCNN

从提取到的feature map上,每个anchor生成2个概率,一个背景,一个目标。

256-d(一维向量)来历,指的是特征深度,这里使用ZF网络,如果VGG肯定就是512了。

感受野=(输出尺寸-1)*stride+kernel_size

再采用:

四、FPN结构(第四张图)

P2-P5如何分得anchor的计算方式

相关推荐
lijianhua_97123 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
EDPJ3 小时前
当图像与文本 “各说各话” —— CLIP 中的模态鸿沟与对象偏向
深度学习·计算机视觉
蔡俊锋3 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语3 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背3 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao4 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农4 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年4 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
charlee444 小时前
最小二乘问题详解17:SFM仿真数据生成
c++·计算机视觉·sfm·数字摄影测量·无人机航测
ai生成式引擎优化技术4 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能