深度学习·GFSS

GFSS General Few-Shot Segmentation

  • 任务实现方式与zero-shot有所不同
  • 本篇论文只涉及同一个模态 (图像),训练过程中,novel class有几个图像提供,提供k个就称之为k-shot
  • 先从图像中提取class prototype ,然后这个原型向量作为查询,与图像的patch嵌入计算相似度,然后得到最后的掩码矩阵。

RD

  • 先对patch嵌入和原型作逐元素乘法,然后赋予其特定权重。权重就是二者的相似度分数。

  • 从VIT中提取多个patch嵌入,拼接在一起,经过线性层作为key,value。

  • 拼接多个VIT layer的RD和类别原型向量,经过线性层作为query。

局限

依赖ViT单模态能力、计算成本高、对小样本噪声敏感。

相关推荐
FL16238631292 小时前
电力设备红外图像与可见光图像配准数据集227对共454张无标注
深度学习
LaughingZhu3 小时前
Product Hunt 每日热榜 | 2026-04-27
人工智能·经验分享·深度学习·产品运营
LaughingZhu4 小时前
Product Hunt 每日热榜 | 2026-04-26
人工智能·经验分享·深度学习·百度·产品运营
DogDaoDao4 小时前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy
LaughingZhu5 小时前
Product Hunt 每日热榜 | 2026-04-29
人工智能·经验分享·深度学习·神经网络·产品运营
β添砖java5 小时前
深度学习(17)卷积层里的多输入多输出通道
人工智能·pytorch·深度学习
LaughingZhu7 小时前
Product Hunt 每日热榜 | 2026-04-30
人工智能·经验分享·深度学习·神经网络·产品运营
STLearner8 小时前
SIGIR 2026 | LLM × Graph论文总结(图增强LLM,GraphRAG,Agent,多模态,知识图谱,搜索,推
人工智能·python·深度学习·神经网络·机器学习·数据挖掘·知识图谱
老陈说编程8 小时前
12. LangChain 6大核心调用方法:invoke/stream/batch同步异步全解析,新手也能轻松学会
开发语言·人工智能·python·深度学习·机器学习·ai·langchain
AI医影跨模态组学9 小时前
如何将CT影像语义特征与肝癌术后辅助TACE获益相关的免疫抑制性肿瘤微环境建立关联,并进一步解释其与预后、PA-TACE治疗响应的机制联系
人工智能·深度学习·论文·医学·医学影像·影像组学