论文阅读——Mask DINO(cvpr2023)

DINO是检测,Mask DINO是检测+分割。

几个模型对比:

传统的检测+分割中,检测头和分割头是平行的,Mask DINO使用二分图匹配bipartite matching提高匹配结果的准确性。

box对大的类别不计算损失,因为太大了,会带坏模型。模型一样预测,但是损失取其他类别的平均数。

Backbone:ResNet-50 and SwinL,SwinL SOTA

We use the same multi-scale setting as in DINO [37] to use 4 scales in ResNet-50-based models and 5 scales in SwinL-based models.

相关推荐
理智的煎蛋26 分钟前
CentOS/Ubuntu安装显卡驱动与GPU压力测试
大数据·人工智能·ubuntu·centos·gpu算力
知来者逆34 分钟前
视觉语言模型应用开发——Qwen 2.5 VL模型视频理解与定位能力深度解析及实践指南
人工智能·语言模型·自然语言处理·音视频·视觉语言模型·qwen 2.5 vl
IT_陈寒35 分钟前
Java性能优化:10个让你的Spring Boot应用提速300%的隐藏技巧
前端·人工智能·后端
Android出海39 分钟前
Android 15重磅升级:16KB内存页机制详解与适配指南
android·人工智能·新媒体运营·产品运营·内容运营
cyyt40 分钟前
深度学习周报(9.1~9.7)
人工智能·深度学习
聚客AI43 分钟前
🌸万字解析:大规模语言模型(LLM)推理中的Prefill与Decode分离方案
人工智能·llm·掘金·日新计划
max5006001 小时前
图像处理:实现多图点重叠效果
开发语言·图像处理·人工智能·python·深度学习·音视频
麦麦麦造1 小时前
国外网友的3个步骤,实现用Prompt来写Prompt!超简单!
人工智能
闲看云起1 小时前
从BERT到T5:为什么说T5是NLP的“大一统者”?
人工智能·语言模型·transformer
小麦矩阵系统永久免费1 小时前
小麦矩阵系统:让短视频分发实现抖音快手小红书全覆盖
大数据·人工智能·矩阵