论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
学海一叶39 分钟前
论文精读-《ReAct: Synergizing Reasoning and Acting in Language Models》,2022
论文阅读·人工智能·语言模型·动态规划·agent
EEPI18 小时前
【论文阅读】Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware
论文阅读
一碗白开水一19 小时前
【论文阅读】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
论文阅读·数码相机
m0_650108241 天前
Gaussian Splatting SLAM:单目实时高保真 3D 重建的突破性进展
论文阅读·单目slam·3d 高斯溅射·解析雅可比位姿优化·统一的3d高斯表示·实时高保真单目3d重建
MoonOutCloudBack1 天前
CAGrad:保证收敛到平均损失最小的多任务梯度算法
论文阅读·人工智能·深度学习·机器学习·多任务
有Li1 天前
一种基于交叉注意力深度学习方法,利用4D CTP成像和临床元数据预测卒中功能预后/文献速递-基于人工智能的医学影像技术
论文阅读·医学生
s1ckrain2 天前
【论文阅读】Motus: A Unified Latent Action World Model
论文阅读·具身智能·世界模型
c0d1ng2 天前
一月第一周周报(论文阅读)
论文阅读
吾在学习路2 天前
【经典论文阅读】完整梳理 FCOS (Fully Convolutional One-Stage Object Detection)
论文阅读·人工智能·目标检测
starsky_walker3 天前
【论文阅读】--从OSDI里学习论文的引言
论文阅读·学习