论文阅读——Mask DINO(cvpr2023)

DINO是检测,Mask DINO是检测+分割。

几个模型对比:

传统的检测+分割中,检测头和分割头是平行的,Mask DINO使用二分图匹配bipartite matching提高匹配结果的准确性。

box对大的类别不计算损失,因为太大了,会带坏模型。模型一样预测,但是损失取其他类别的平均数。

Backbone:ResNet-50 and SwinL,SwinL SOTA

We use the same multi-scale setting as in DINO 37 to use 4 scales in ResNet-50-based models and 5 scales in SwinL-based models.

相关推荐
火山引擎开发者社区3 小时前
火山AgentPlan/CodingPlan同步上线GLM-5.2
人工智能
冬奇Lab4 小时前
Skill 系列(05):Skill 工作流串联——4 种模式实测,并发加速 1.5x
人工智能·开源
冬奇Lab4 小时前
每日一个开源项目(第141篇):hiring-agent - HackerRank 开源了他们的简历评分系统,你的简历能得几分?
人工智能·面试·开源
甲维斯5 小时前
又升级咯!坦克大战2026,科技与复古并存!
前端·人工智能·游戏开发
姗姗来迟了7 小时前
用React Hook封装AI对话状态
人工智能
Goodbye7 小时前
从 Token 到 Embedding:LLM 核心基础深度解析
javascript·人工智能
阿瑞IT7 小时前
AI Agent 在甘特计划变更场景中的动态响应工程实践
人工智能
用户938515635077 小时前
工具调用背后:LLM 如何突破“缸中大脑”,操控真实世界?
javascript·人工智能