Faster Rcnn

一、公用特征Feature Maps的获取

二、Region Proposal Network

Feature Maps[bs,1024,38,38]经过3*3卷积,然后分别经过两个1*1的卷积,通道数分别为18,36

18 = 9*2 代表每个位置9个先验框为背景和目标的概率

36 = 9*4 代表每个位置9个先验框的坐标调整参数(Faster Rcnn也是有先验框的)

先验框 + 位置调整参数 = 建议框

建议框的初筛

由于建议框非常多,要对建议框进行初筛,先根据建议框是目标的分数,选出得分最高的前K个建议框,再进行NMS,然后再选出得分最高的前K个建议框。如一张照片有300个建议框。

三、ROI Pooling

根据建议框的参数,在Feature Map上裁剪出对应特征,比如[1024,82,79],每个特征的大小是不一样的,

相关推荐
SEO_juper几秒前
应对 AI 概览导致的网站流量流失:诊断、优化与长期策略
人工智能·seo·数字营销
Mintopia5 分钟前
🌌 信任是否会成为未来的货币?
前端·人工智能·aigc
青春不败 177-3266-05207 分钟前
AI支持下的临床医学日常工作、论文撰写、数据分析与可视化、机器学习建模中的实践应用
人工智能·数据挖掘·数据分析·医学
闲看云起10 分钟前
大模型注意力机制进化史:从全局到稀疏,从标准到线性、滑动窗口、MQA……
人工智能·语言模型·nlp
数说星榆18111 分钟前
可信AI:透明度、公平性与问责制
人工智能
实战项目13 分钟前
基于深度学习的音乐分类算法研究
人工智能·深度学习·分类
才兄说13 分钟前
机器人租赁中的现场确认痛点
人工智能·机器人
传说故事15 分钟前
【论文自动阅读】Stable Language Guidance for Vision-Language-Action Models
人工智能·具身智能
打破砂锅问到底00717 分钟前
Claude--AI领域的安全优等生
大数据·人工智能·机器学习·ai
电棍23317 分钟前
记录:采用安装.whl而非编译的一种环境配置思路
运维·深度学习