【图神经网络】在节点分类任务中无特征节点的特征表示

无特征节点的特征表示

节点度数degree

pagerank

以pagerank起源的应用场景为例，不是所有的网站都是同等重要的，所以需要根据结构信息对节点进行排序。

直觉上，如果一个网站它有很多链接，它就很重要，举例来说，一个网站有很多射入链接，那么，它比一个只有一个射入链接的网站重要，但是对于射入网站的网站的重要性也是不同的。

一个重要网址的给到的vote分值是很高的，链接的vote值正比于它的来源网站的重要性，如果一个网址i有重要性 r i r_i ri有 d i d_i di个out-links，每一个链接有 r i d i \frac{r_i}{d_i} dirivote值。网址j的重要性 r j r_j rj是所有in-links的vote值的加和。
r j = ∑ i → j r i d i r_j = \sum_{i \rightarrow j} \frac{r_i}{d_i} rj=i→j∑diri

矩阵化

下面将这个过程矩阵化，首先是概率邻接矩阵M
M i j = 1 d j M_{ij} = \frac{1}{d_j} Mij=dj1

每个值就代表节点j传递给节点i的vote值，也就是M的每一列的加和为1
rank向量
r i r_i ri是网址i的重要性，满足 ∑ i r i = 1 \sum_i r_i = 1 ∑iri=1

流程就可以表达为：
r = M ⋅ r r=M\cdot r r=M⋅r

可以看到，r是矩阵M特征值1的特征向量，怎么解决呢？

用方法power iteration

Power Iteration:

Set r j ← 1 / N r_j \leftarrow 1/N rj←1/N

1: r j ′ = ∑ i → j r i d i r'j = \sum{i \rightarrow j} \frac{r_i}{d_i} rj′=∑i→jdiri

2: If ∣ r − r ′ ∣ > ϵ |r-r'|>\epsilon ∣r−r′∣>ϵ
r ← r ′ r \leftarrow r' r←r′

3: goto 1

但是存在两个问题

所以需要修改

有 β \beta β概率，按照链接传递vote值，有 1 − β 1-\beta 1−β的概率随机跳转到一个节点，这样就解决了上面两个问题。
r j = ∑ i → j β r i d i + ( 1 − β ) 1 N r_j = \sum_{i \rightarrow j}\beta \frac{r_i}{d_i} + (1-\beta)\frac{1}{N} rj=i→j∑βdiri+(1−β)N1

用矩阵表示为
P = β M + ( 1 − β ) [ 1 N ] N × N P=\beta M + (1-\beta)\left[\frac{1}{N}\right]_{N\times N} P=βM+(1−β)[N1]N×N