深度学习·GFSS

GFSS General Few-Shot Segmentation

  • 任务实现方式与zero-shot有所不同
  • 本篇论文只涉及同一个模态 (图像),训练过程中,novel class有几个图像提供,提供k个就称之为k-shot
  • 先从图像中提取class prototype ,然后这个原型向量作为查询,与图像的patch嵌入计算相似度,然后得到最后的掩码矩阵。

RD

  • 先对patch嵌入和原型作逐元素乘法,然后赋予其特定权重。权重就是二者的相似度分数。

  • 从VIT中提取多个patch嵌入,拼接在一起,经过线性层作为key,value。

  • 拼接多个VIT layer的RD和类别原型向量,经过线性层作为query。

局限

依赖ViT单模态能力、计算成本高、对小样本噪声敏感。

相关推荐
max50060012 小时前
实时多模态电力交易决策系统:设计与实现
图像处理·人工智能·深度学习·算法·音视频
尝试经历体验14 小时前
pycharm突然不能正常运行
python·深度学习·pycharm
大千AI助手14 小时前
灾难性遗忘:神经网络持续学习的核心挑战与解决方案
人工智能·深度学习·神经网络·大模型·llm·持续学习·灾难性遗忘
七元权15 小时前
论文阅读-SelectiveStereo
论文阅读·深度学习·双目深度估计·selectivestereo
F_D_Z15 小时前
【PyTorch】单对象分割
人工智能·pytorch·python·深度学习·机器学习
艾醒15 小时前
探索大语言模型(LLM):Ollama快速安装部署及使用(含Linux环境下离线安装)
人工智能·深度学习·算法
nju_spy15 小时前
南京大学 LLM开发基础(一)前向反向传播搭建
人工智能·pytorch·深度学习·大语言模型·梯度·梯度下降·反向传播
HUIMU_16 小时前
YOLOv5实战-GPU版本的pytorch虚拟环境配置
人工智能·pytorch·深度学习·yolo
猫天意16 小时前
【CVPR2023】奔跑而非行走:追求更高FLOPS以实现更快神经网络
人工智能·深度学习·神经网络·算法·机器学习·卷积神经网络
AI风老师16 小时前
深度学习入门:打好数学与机器学习基础,迈向AI进阶之路
人工智能·深度学习·机器学习