深度学习·GFSS

GFSS General Few-Shot Segmentation

  • 任务实现方式与zero-shot有所不同
  • 本篇论文只涉及同一个模态 (图像),训练过程中,novel class有几个图像提供,提供k个就称之为k-shot
  • 先从图像中提取class prototype ,然后这个原型向量作为查询,与图像的patch嵌入计算相似度,然后得到最后的掩码矩阵。

RD

  • 先对patch嵌入和原型作逐元素乘法,然后赋予其特定权重。权重就是二者的相似度分数。

  • 从VIT中提取多个patch嵌入,拼接在一起,经过线性层作为key,value。

  • 拼接多个VIT layer的RD和类别原型向量,经过线性层作为query。

局限

依赖ViT单模态能力、计算成本高、对小样本噪声敏感。

相关推荐
一条破秋裤15 分钟前
零样本学习指标
深度学习·学习·机器学习
茶色岛^1 小时前
解析CLIP:从“看标签”到“读描述”
人工智能·深度学习·机器学习
All The Way North-1 小时前
一文系统性理清PyTorch多分类任务交叉熵损失:从 Softmax 到 CrossEntropyLoss
人工智能·pytorch·深度学习·机器学习·交叉熵损失·多分类损失
Lau_way1 小时前
AVadCLIP: Audio-Visual Collaboration for Robust Video Anomaly Detection
人工智能·深度学习
这张生成的图像能检测吗2 小时前
(论文速读)BV-DL:融合双目视觉和深度学习的高速列车轮轨动态位移检测
人工智能·深度学习·计算机视觉·关键点检测·双目视觉·激光传感器
轻赚时代2 小时前
PC 端 AI 图像处理工具实操指南:抠图 / 证件照优化 / 智能擦除全流程解析
图像处理·人工智能·经验分享·笔记·深度学习·创业创新·学习方法
Python极客之家3 小时前
基于深度学习的游戏评论情感分析系统
人工智能·深度学习·机器学习·毕业设计·课程设计
哥布林学者3 小时前
吴恩达深度学习课程三: 结构化机器学习项目 第二周:误差分析与学习方法(五)端到端学习
深度学习·ai
AI即插即用4 小时前
即插即用系列 | CVPR 2024 ABC-Attention:基于双线性相关注意力的红外小目标检测
图像处理·人工智能·深度学习·目标检测·计算机视觉·cnn·视觉检测