论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
张较瘦_1 天前
[论文阅读] AI+ | AI如何重塑审计行业?从“手工筛查”到“智能决策”:AI审计的核心逻辑与未来路径
论文阅读·人工智能
苦瓜汤补钙1 天前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程
CV-杨帆1 天前
论文阅读:arxiv 2025 Safety in Large Reasoning Models: A Survey
论文阅读
张较瘦_2 天前
[论文阅读] AI | 大语言模型服务系统服务级目标和系统级指标优化研究
论文阅读·人工智能·语言模型
Vizio<2 天前
《基于电阻层析成像(ERT)的机器人皮肤空间灵敏度均衡:通过应变系数分布优化》ICRA 2025 论文解读
论文阅读·机器人·机器人触觉
三木今天学习了嘛3 天前
【VLA & Markov】VLA 架构和构建模块 与 Markov 带来的时序思考
论文阅读
依夏c3 天前
[论文笔记•(多智能体)]LLMs Can Simulate Standardized Patients via Agent Coevolution
论文阅读·论文笔记
wzx_Eleven3 天前
【论文阅读】AAAI 2025 | 面向精确分割式联邦学习的多模型聚合与知识重放
论文阅读·人工智能·机器学习
Zack_Liu3 天前
LSS论文阅读
论文阅读·人工智能·目标跟踪
何如千泷3 天前
【论文阅读】SelfReg-UNet: Self-Regularized UNet for Medical Image Segmentation
论文阅读