论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构------主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构------层越深提取空间尺寸越小的特征

3 实验

图片分类任务:

相关推荐
walnut_oyb8 小时前
arXiv|SARLANG-1M:用于 SAR 图像理解的视觉-语言建模基准
论文阅读·人工智能·机器学习·计算机视觉·语言模型·自然语言处理
m0_6501082419 小时前
Gemini 2.5:重塑多模态 AI 边界的全面解读
论文阅读·人工智能·多模态大模型·gemini 2.5·跨模态融合
钟屿20 小时前
Back to Basics: Let Denoising Generative Models Denoise 论文阅读学习
论文阅读·人工智能·笔记·学习·计算机视觉
张较瘦_20 小时前
[论文阅读] AI + 数据库 | 拆解智能数据库:交互、管理、内核三层革新,AI 如何重塑数据处理
数据库·论文阅读·人工智能
橘子是码猴子1 天前
Patch-wise Structural Loss for Time Series Forecasting论文阅读
论文阅读
m0_650108242 天前
Flamingo:打破模态壁垒的少样本视觉语言模型
论文阅读·人工智能·视觉语言模型·deepmind·vlm·通用智能·通用小样本适配
诸葛思颖2 天前
【论文阅读笔记】FedProx
论文阅读·笔记
墨绿色的摆渡人2 天前
论文笔记(一百零三)π0.6 : a VLA That Learns From Experience(二)
论文阅读
诸葛思颖2 天前
【论文阅读笔记】FL+HC(联邦学习+层次聚类)
论文阅读·笔记·聚类
檐下翻书1733 天前
从入门到精通:流程图制作学习路径规划
论文阅读·人工智能·学习·算法·流程图·论文笔记