Faster Rcnn

一、公用特征Feature Maps的获取

二、Region Proposal Network

Feature Maps[bs,1024,38,38]经过3*3卷积,然后分别经过两个1*1的卷积,通道数分别为18,36

18 = 9*2 代表每个位置9个先验框为背景和目标的概率

36 = 9*4 代表每个位置9个先验框的坐标调整参数(Faster Rcnn也是有先验框的)

先验框 + 位置调整参数 = 建议框

建议框的初筛

由于建议框非常多,要对建议框进行初筛,先根据建议框是目标的分数,选出得分最高的前K个建议框,再进行NMS,然后再选出得分最高的前K个建议框。如一张照片有300个建议框。

三、ROI Pooling

根据建议框的参数,在Feature Map上裁剪出对应特征,比如[1024,82,79],每个特征的大小是不一样的,

相关推荐
冬奇Lab2 小时前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
没事勤琢磨4 小时前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户5191495848454 小时前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人5285 小时前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆5 小时前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
BugShare5 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心5 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai
后端小肥肠6 小时前
公众号躺更神器!OpenClaw+Claude Skill 实现自动读对标 + 写文 + 配图 + 存入草稿箱
人工智能·aigc·agent
爱可生开源社区6 小时前
SCALE | 重构 AI 时代数据库能力的全新评估标准
人工智能
Jahzo7 小时前
openclaw本地化部署体验与踩坑记录--飞书机器人配置
人工智能·开源