论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
Mr Sorry9 小时前
Non-stationary Diffusion For Probabilistic Time Series Forecasting论文阅读笔记
论文阅读·笔记
dundunmm9 小时前
【论文阅读】SIMBA: single-cell embedding along with features(2)
论文阅读·人工智能·embedding·生物信息·单细胞·多组学·细胞类型识别
王上上9 小时前
【论文阅读69】-DeepHGNN复杂分层结构下的预测
论文阅读
AustinCyy9 小时前
【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation
论文阅读
PigeonGuan12 小时前
论文阅读 2025-8-9 [DiC, DropKey]
论文阅读
网安INF12 小时前
【论文阅读】-《SIGN-OPT: A QUERY-EFFICIENT HARD-LABEL ADVERSARIAL ATTACK》
论文阅读·人工智能·网络安全·对抗攻击
网安INF1 天前
【论文阅读】-《HopSkipJumpAttack: A Query-Efficient Decision-Based Attack》
论文阅读·人工智能·深度学习·网络安全·对抗攻击
张较瘦_1 天前
[论文阅读] 软件工程工具 | EVOSCAT可视化工具如何重塑软件演化研究
论文阅读·软件工程
果粒橙_LGC1 天前
论文阅读系列(一)Qwen-Image Technical Report
论文阅读·人工智能·学习
AustinCyy1 天前
【论文笔记】Multi-Agent Based Character Simulation for Story Writing
论文阅读