论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
开心星人11 小时前
【论文阅读】identifying backdoor data with optimized scaled prediction consistency
论文阅读
万里守约1 天前
【论文阅读】SAM-CP:将SAM与组合提示结合起来的多功能分割
论文阅读·图像分割·多模态·语义分割·实例分割·图像大模型
chnyi6_ya1 天前
2025/02/22阅读论文笔记
论文阅读
Jackilina_Stone3 天前
【论文阅读笔记】浅谈深度学习中的知识蒸馏 | 关系知识蒸馏 | CVPR 2019 | RKD
论文阅读·深度学习·蒸馏·rkd
HollowKnightZ3 天前
论文阅读笔记:Gated CRF Loss for Weakly Supervised Semantic Image Segmentation
论文阅读·笔记
regret~3 天前
【论文笔记】Mamba: Linear-time sequence modeling with selective state spaces
论文阅读
Jackilina_Stone3 天前
【论文阅读笔记】知识蒸馏:一项调查 | CVPR 2021 | 近万字翻译+解释
论文阅读·人工智能·深度学习·蒸馏
Zhouqi_Hua3 天前
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly
论文阅读·笔记·深度学习·语言模型·自然语言处理
X.Cristiano3 天前
月之暗面-KIMI-发布最新架构MoBA
论文阅读·moba·kimi·月之暗面
永远前进不waiting4 天前
论文阅读4——一种宽频带圆极化微带天线的设计
论文阅读