论文GAN(GRAPH ATTENTION NETWORKS)阅读笔记

简略版理解

背景

当前的局限性:

CNN数据具有规则的网格结构,但现实数据往往是不规则的(即图结构)

本文的核心思想:

每个节点在计算表示时:对邻居节点进行 attention 加权

GAT 架构

GAT 通过堆叠多个图注意力层构建深层网络,每一层都会对节点及其邻居的特征进行加权聚合

GAT 的计算流程

每一层:

线性变换

对所有节点的输入特征进行一次共享的线性变换

计算邻居 attention

在得到新的特征表示后,模型会为每个节点计算其与邻居节点之间的注意力系数,所有邻居的注意力系数会通过Softmax 函数进行归一化

加权聚合

在得到注意力权重后,节点会对所有邻居节点的特征进行加权求和:

  • 权重越大的邻居,对节点表示的贡献越大

  • 权重较小的邻居影响会被削弱

激活函数

Multi-head attention

用多个 attention:

  • 稳定训练

  • 提高表达能力

GCN:

邻居平均

GraphSAGE:

邻居聚合

GAT:

邻居加权(attention)

相关推荐
冬奇Lab1 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab1 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾2 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒3 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术5 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12275 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队5 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇5 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师6 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc