DINO是检测,Mask DINO是检测+分割。
几个模型对比:
传统的检测+分割中,检测头和分割头是平行的,Mask DINO使用二分图匹配bipartite matching提高匹配结果的准确性。
box对大的类别不计算损失,因为太大了,会带坏模型。模型一样预测,但是损失取其他类别的平均数。
Backbone:ResNet-50 and SwinL,SwinL SOTA
We use the same multi-scale setting as in DINO [37] to use 4 scales in ResNet-50-based models and 5 scales in SwinL-based models.