小样本分割的新视角,Learning What Not to Segment【CVPR 2022】

论文地址:Excellent-Paper-For-Daily-Reading/image-segmentation at main

类别:图像分割

时间:2023/11/01

摘要

目前背景:少样本分割 (FSS) 得到了广泛的发展。以前的大多数工作都在努力通过分类任务衍生的元学习框架来实现泛化。

存在问题:但受过训练的模型偏向于预测可见类,从而阻碍了对新范式的认识。

论文贡献:本文提出了一个新鲜而直接的见解,以缓解此类问题。具体而言,将额外分支(基础学习器)应用于常规FSS模型(元学习器),以明确识别基类的目标,即不需要细分的区域。然后,将这两个学习器的粗略结果进行了自适应整合,以产生精确的分割预测。考虑到元学习器的灵敏度,进一步引入了一个调整因素,以估计输入图像对之间的场景差异,以促进模型集合预测。

实验效果:在数据集Pascal-5i和COCO-20i上的显著性能提升验证了效果。此外,鉴于提出的方法的独特性质,还将其扩展到更现实但具有挑战性的环境,即广义FSS。

代码已开源:

chunbolang/BAM:Learning What Not to Segment: A New Perspective on Few-Shot Segmentation

实验

左边的面板来自PASCAL-5,右边的面板来自COCO-20

基线方法为上图第三行,BAM的效果为上图第四行,经过比对可以发现基线方法错误分割的的目标被显著的抑制了。这里表明了研究工作的正确性。

总结

在原先的元学习框架中,是对大量的标注样本的基数据集上进行的元训练,其更加偏向于原先学习的类别,这阻碍了对于新概念的理解。论文方案的核心思想是利用基础学习器来识别查询图像中的可混淆(基)区域,并进一步细化元学习器的预测。令人惊讶的是,即使使用两个简单的学习器,我们的方案也设定了FSS基准的最新水平。此外,我们将当前的任务扩展到更具挑战性的广义设置,并产生了强有力的基线结果。

相关推荐
code_pgf1 分钟前
mllm指令微调的关键技术
人工智能·机器学习·计算机视觉
卷卷说风控2 分钟前
【卷卷观察】AI 安全与信任危机:恶意机器人、AI 买家秀、模型自保 安全、治理、虚假内容成为高频议题 “AI 越有用,越需要被约束”
人工智能·安全·机器人
漫游的渔夫2 分钟前
从 if-else 乱麻到状态机:前端开发者该怎么理解多 Agent 协作?
前端·人工智能·typescript
隐层漫游者2 分钟前
基于字符级RNN的多分类实战:从人名预测国籍的深度学习流水线(含LSTM与GRU对比)
深度学习
机器人零零壹3 分钟前
工业软件加速突围:iRobotCAM 如何以国产内核扛起机器人离线编程自主大旗
人工智能·具身智能·人形机器人·机器人仿真·工业软件·中望3d·机器人离线编程
Elastic 中国社区官方博客3 分钟前
一个索引,所有媒体:介绍 jina-embeddings-v5-omni
大数据·人工智能·elasticsearch·搜索引擎·ai·媒体·jina
嘛也学不会3 分钟前
Claude技能构建指南|第三章 测试流程与迭代优化
人工智能·教程·skill·技能构建
舞影天上4 分钟前
给 AI Agent 接上记忆系统:Honcho + DeepSeek 踩坑全记录
人工智能
王木风6 分钟前
GitHub 日增近 4k star 的 skills 项目:用 18 个技能,解决 Claude Code 的四大“翻车”现场
人工智能
covco7 分钟前
AI 原生营销矩阵系统:分布式架构设计与核心模块实现
人工智能·分布式·矩阵