Faster Rcnn

老男孩li2023-09-12 11:48

一、公用特征Feature Maps的获取

Feature Maps[bs,1024,38,38]经过3*3卷积，然后分别经过两个1*1的卷积，通道数分别为18，36

18 = 9*2 代表每个位置9个先验框为背景和目标的概率

36 = 9*4 代表每个位置9个先验框的坐标调整参数（Faster Rcnn也是有先验框的）

先验框 + 位置调整参数 = 建议框

建议框的初筛

由于建议框非常多，要对建议框进行初筛，先根据建议框是目标的分数，选出得分最高的前K个建议框，再进行NMS，然后再选出得分最高的前K个建议框。如一张照片有300个建议框。

根据建议框的参数，在Feature Map上裁剪出对应特征，比如[1024,82,79],每个特征的大小是不一样的，