一、公用特征Feature Maps的获取
二、Region Proposal Network
Feature Maps[bs,1024,38,38]经过3*3卷积,然后分别经过两个1*1的卷积,通道数分别为18,36
18 = 9*2 代表每个位置9个先验框为背景和目标的概率
36 = 9*4 代表每个位置9个先验框的坐标调整参数(Faster Rcnn也是有先验框的)
先验框 + 位置调整参数 = 建议框
建议框的初筛
由于建议框非常多,要对建议框进行初筛,先根据建议框是目标的分数,选出得分最高的前K个建议框,再进行NMS,然后再选出得分最高的前K个建议框。如一张照片有300个建议框。
三、ROI Pooling
根据建议框的参数,在Feature Map上裁剪出对应特征,比如[1024,82,79],每个特征的大小是不一样的,