深度学习·GFSS

GFSS General Few-Shot Segmentation

  • 任务实现方式与zero-shot有所不同
  • 本篇论文只涉及同一个模态 (图像),训练过程中,novel class有几个图像提供,提供k个就称之为k-shot
  • 先从图像中提取class prototype ,然后这个原型向量作为查询,与图像的patch嵌入计算相似度,然后得到最后的掩码矩阵。

RD

  • 先对patch嵌入和原型作逐元素乘法,然后赋予其特定权重。权重就是二者的相似度分数。

  • 从VIT中提取多个patch嵌入,拼接在一起,经过线性层作为key,value。

  • 拼接多个VIT layer的RD和类别原型向量,经过线性层作为query。

局限

依赖ViT单模态能力、计算成本高、对小样本噪声敏感。

相关推荐
wjykp1 天前
part1~2 神经网络基础
人工智能·深度学习·神经网络
Ro Jace1 天前
机器学习、深度学习、信号处理领域常用符号速查表
深度学习·机器学习·信号处理
rengang661 天前
03-深度学习与机器学习的对比:分析深度学习与传统机器学习的异同
人工智能·深度学习·机器学习
咕咚-萌西1 天前
DeepSeek-OCR
人工智能·深度学习·ocr
rengang661 天前
04-深度学习的基本概念:涵盖深度学习中的关键术语和原理
人工智能·深度学习
java1234_小锋1 天前
PyTorch2 Python深度学习 - 卷积神经网络(CNN)介绍实例 - 使用MNIST识别手写数字示例
python·深度学习·cnn·pytorch2
雍凉明月夜1 天前
人工智能学习中深度学习之python基础之迭代器、生成器、文件处理和模块等
python·深度学习·学习·pycharm
文火冰糖的硅基工坊1 天前
[人工智能-大模型-122]:模型层 - RNN是通过神经元还是通过张量时间记录状态信息?时间状态信息是如何被更新的?
人工智能·rnn·深度学习
Dev7z1 天前
基于深度学习的中国交通警察手势识别与指令优先级判定系统
人工智能·深度学习