论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
Ayakanoinu1 小时前
【论文阅读】Dynamic Adversarial Patch for Evading Object Detection Models
论文阅读·目标检测·目标跟踪
寻丶幽风1 小时前
论文阅读笔记——ReconDreamer
论文阅读·笔记·自动驾驶·3dgs·世界模型·闭环仿真
金科铁码1 小时前
提示词工程 — 科研论文笔记
论文阅读
0x21111 小时前
[论文阅读]Attacking Open-domain Question Answering by Injecting Misinformation
论文阅读
黄雪超11 小时前
Flink介绍——实时计算核心论文之S4论文详解
大数据·论文阅读·flink
Matrix_1118 小时前
论文阅读:GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring
论文阅读·人工智能·计算摄影
s1ckrain1 天前
【论文阅读】LongDiff:Training-Free Long Video Generation in One Go
论文阅读·人工智能·计算机视觉
水深00安东尼1 天前
R-GCN-Modeling Relational Data with GraphConvolutional Networks(论文笔记)
论文阅读·神经网络·知识图谱
钟屿1 天前
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring论文阅读
论文阅读·图像处理·人工智能·深度学习·计算机视觉·图像去模糊·图像恢复
零澪灵2 天前
【论文阅读】Co2l: Contrastive continual learning
论文阅读