半监督节点分类上的HyperGCN

1.Title

HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification(Naganand Yadati、Prateek Yadav、Madhav Nimishakavi、Anand Louis、Partha Talukdar)【ACM Transactions on Knowledge Discovery from Data 2022】

2.Conclusion

This paper explore the use of GCNs for hypergraph-based SSL and propose HyperGCN, an SSL method which uses a layer-wise propagation rule for convolutional neural networks operating directly on hypergraphs. To the best of our knowledge, this is the first principled adaptation of GCNs to hypergraphs. HyperGCN is able to encode both the hypergraph structure and hypernode features in an effective manner. Through detailed experimentation, it demonstrate HyperGCN's effectiveness at hypergraph-based SSL.

3.Good Sentences

1、This assumption might restrict modeling capacity, as graph edges need not encode node similarity, but could instead contain other information such as pointwise mutual semantic information (Zhuang and Ma 2018), or knowledge graph relationship information (Wang, Ye, and Gupta 2018)(The restriction of graph Laplacian regulariser)

2、The crucial working principle here is that the hypernodes in the same hyperedge are similar and hence are likely to share the same label (The basic principal of Hypergraph).

3、HyperGCN may be augmented with such approaches for even more improved performance. On the hypergraph side, our HyperGCN model currently is designed for undirected hypergraphs. Extending the model for directed hypergraphs (where the direction captures a casual relationship) (Zhang et al. 2017), and partial-order hypergraphs (Feng et al. 2018) can be an interesting avenue for further research. Investigating the recently proposed p-Laplacians for submodular hypergraphs (Li and Milenkovic 2018) is also an interesting direction.(Some possbile future works based on HyperGCN)


Introduction

在传统的基于图的SSL问题中,损失函数被定义为标记数据上的监督损失和图结构的正则化器的加权和。典型的正则化器是拉普拉斯算子,它依赖图中连接的节点可能共享相同的标签这一假设。这种假设可能会限制建模能力,因为图的边不一定编码节点相似性,而可能包含其他信息。

为了避免这种限制,后来的人引入了卷积神经网络,而本文填补了超图上的卷积网络的空白,主要贡献如下:

  • 提出了HyperGCN,第一个基于GCN的超图方法。

  • 与以前的非神经方法相比,HyperGCN能够有效地合并和修改超图节点上的特征。

  • 通过在多个真实世界数据集上进行的广泛实验,我们证明了HyperGCN与其他最先进的基线相比的有效性

HyperGCN的代码是开源的

Background: Graph Convolutional Network

是对应图G的数据矩阵,A是其邻接矩阵,数据矩阵具有图中每个节点的p维实值向量表示。图卷积可作为图拉普拉斯算子的线性函数 。GCN的基本公式来源于卷积定理,真实信号S∈和滤波器F∈的卷积C可以表示为都是可学习的权重参数,是标准图拉普拉斯卷积,其中L是对称归一化图拉普拉斯算子,是其最大特征值,,D是的对角矩阵滤波器F取决于图(图拉普拉斯算子L)的结构,这里的关键点是,两个图信号的卷积是图拉普拉斯L的线性函数。

GCN (Kipf and Welling 2017)

GCN以邻接矩阵A(底层图结构)和数据矩阵X(输入特征)为条件。简单的两层GCN的正向模型采用以下简单形式:

而对于具有q类的半监督多类分类,可以最小化标记示例集上的交叉熵误差图卷积网络的权重,即θ(0)和θ(1),使用梯度下降进行训练。

超图卷积网络

最关键的原理在于: 同一超边中的超节点是相似的,因此可能共享相同的标签。

假设用来表示V中的一些超节点,然后对于任意超边,函数在超边e中的超节点的向量彼此接近时会很小,因此,把这个函数作为正则化器时可能实现"相同超边中的超节点具有相似表示 "这一目标。而拉普拉斯算子也具有相似的功能

超图拉普拉斯

给定一个实值信号S,定义在超节点上,L(S)的计算步骤如下:

  1. 对于每个超边,让随机断开连接
  2. 通过添加带权重w的边来构造顶点集V上的加权图,然后对于每个顶点v,添加足够权重的自循环,使得顶点在中的度数等于。把的加权邻接矩阵记作
  3. 对称归一化的拉普拉斯算子计算公式如下:

HyperGCN

图卷积运算可以使用如下所示的迭代方程在神经消息传递框架中重写:

τ是epoch次数,是节点v的新隐藏层表示, σ是非线性激活函数,Θ是可训练学习的权重参数,N(v)是节点v的邻居集,是超边(v,u)上经过标准化的权重,随着节点被嵌入,关联矩阵也被重新构建。HyperGCN模型可以被视为基于超图总变化进行隐式正则化。

带中介的拉普拉斯算子 是一种HyperGCN的改进,不带介质的超图拉普拉斯算子忽略了给定epoch时,中的超节点。(Chan和Liang 2018已经证明中的超节点充当"中介"的广义超图拉普拉斯算子满足由(Chan等人)给出的拉普拉斯算子的所有性质

相关推荐
shayudiandian3 小时前
用PyTorch训练一个猫狗分类器
人工智能·pytorch·深度学习
这儿有一堆花3 小时前
把 AI 装进终端:Gemini CLI 上手体验与核心功能解析
人工智能·ai·ai编程
子午3 小时前
【蘑菇识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法
人工智能·python·深度学习
模型启动机3 小时前
Langchain正式宣布,Deep Agents全面支持Skills,通用AI代理的新范式?
人工智能·ai·langchain·大模型·agentic ai
Python私教3 小时前
别让 API Key 裸奔:基于 TRAE SOLO 的大模型安全配置最佳实践
人工智能
Python私教3 小时前
Vibe Coding 体验报告:我让 TRAE SOLO 替我重构了 2000 行屎山代码,结果...
人工智能
prog_61033 小时前
【笔记】和各大AI语言模型写项目——手搓SDN后得到的经验
人工智能·笔记·语言模型
zhangfeng11333 小时前
深入剖析Kimi K2 Thinking与其他大规模语言模型(Large Language Models, LLMs)之间的差异
人工智能·语言模型·自然语言处理
paopao_wu4 小时前
人脸检测与识别-InsightFace:特征向量提取与识别
人工智能·目标检测
Aevget4 小时前
MyEclipse全新发布v2025.2——AI + Java 24 +更快的调试
java·ide·人工智能·eclipse·myeclipse