TensorFlow深度学习实战——节点分类

TensorFlow深度学习实战------节点分类

- [0. 前言](#0. 前言)
- [1. 数据分析](#1. 数据分析)
- [2. 构建节点分类模型](#2. 构建节点分类模型)
- [3. 模型训练与评估](#3. 模型训练与评估)
- 相关链接

0. 前言

节点分类是图数据领域的一个常见任务。在这一任务中，模型的训练目标是预测节点的类别。非图分类方法仅使用节点特征向量实现节点分类，早期的图神经网络 (Graph Neural Network, GNN)方法(如 DeepWalk 和 node2vec )仅使用邻接矩阵(连接信息)实现节点分类，而 GNN 能够同时利用节点特征向量和连接信息进行节点分类。

1. 数据分析

本质上，节点分类的思路是对图中的所有节点应用一个或多个图卷积，将节点的特征向量投影到相应的输出类别向量中，以预测节点的类别。本节，将使用 CORA 数据集训练节点分类模型，CORA 数据集是一个包含 2,708 篇科学论文的集合，每篇论文可以分类为七个类别之一。这些论文以及它们之间的引用关系构成了一个包含 5,429 个链接的引文网络，每篇论文由一个大小为 1,433 的词向量描述。

(1) 首先，导入所需库：

python 复制代码

import dgl
import dgl.data
import matplotlib.pyplot as plt
import numpy as np
import os
import tensorflow as tf
from dgl.nn.tensorflow import GraphConv

(2) 加载 CORA 数据集：

python 复制代码

dataset = dgl.data.CoraGraphDataset()

(3) 第一次调用时，它会记录下载和提取到本地文件的过程。完成后，它会输出一些有关 CORA 数据集的统计信息。可以看到，图中有 2,708 个节点和 10,566 条边。每个节点都有一个大小为 1,433 的特征向量，节点被分类为七个类别之一，此外，有 140 个训练样本、500 个验证样本和 1,000 个测试样本：

shell 复制代码

  NumNodes: 2708
  NumEdges: 10556
  NumFeats: 1433
  NumClasses: 7
  NumTrainingSamples: 140
  NumValidationSamples: 500
  NumTestSamples: 1000
Done saving data into cached files.

CORA 数据集是一个单一的引文图，可以通过 len(dataset) 来验证，将返回 1。这意味着模型将处理 dataset[0] 提供的图，节点特征作为键值对包含在字典 dataset[0].ndata 中，边特征则在 dataset[0].edata 中。ndata 包含键 train_mask、val_mask 和 test_mask，这些是布尔掩码，表示哪些节点属于训练、验证和测试集，还有一个 feat 键，包含图中每个节点的特征向量。

2. 构建节点分类模型

构建一个包含两个 GraphConv 层的 NodeClassifier 网络。每一层将通过聚合邻居信息计算新的节点表示。GraphConv 层是 tf.keras.layers.Layer 对象，因此可以进行堆叠。第一个 GraphConv 层将输入特征(大小为 1,433 )投影到大小为 16 的隐藏特征向量上，第二个 GraphConv 层将隐藏特征向量投影到大小为 2 的输出类别向量，从中获取类别：

python 复制代码

"""Defining a Graph Convolutional Network (GCN)"""
class NodeClassifier(tf.keras.Model):
    def __init__(self, g, in_feats, h_feats, num_classes):
        super(NodeClassifier, self).__init__()
        self.g = g
        self.conv1 = GraphConv(in_feats, h_feats, activation=tf.nn.relu)
        self.conv2 = GraphConv(h_feats, num_classes)

    def call(self, in_feat):
        h = self.conv1(self.g, in_feat)
        h = self.conv2(self.g, h)
        return h

g = dataset[0]
model = NodeClassifier(g, g.ndata["feat"].shape[1], 16, dataset.num_classes)

需要注意的是，GraphConv 只是构建 NodeClassifier 模型的一种图神经网络层，DGL 提供了多种图卷积层，可以用来替换 GraphConv。

3. 模型训练与评估

(1) 在 CORA 数据集上训练模型。使用 AdamW 优化器，AdamW 优化器是 Adam 优化器的变体，能够得到更好的模型泛化能力，学习率为 1e-2，权重衰减为 5e-4，训练 200 个 epoch。同时检测是否有可用的 GPU，如果有，将图数据转移到 GPU 上。如果检测到 GPU，TensorFlow 会自动将模型转移到 GPU 上：

python 复制代码

"""Training the GCN"""
device = "/cpu:0"
gpus = tf.config.list_physical_devices("GPU")
if len(gpus) > 0:
    device = gpus[0]
g = g.to(device)

(2) 定义 do_eval() 方法，根据特征计算模型在(由布尔掩码拆分的)测试数据集上的准确率：

python 复制代码

def do_eval(model, features, labels, mask):
    logits = model(features, training=False)
    logits = logits[mask]
    labels = labels[mask]
    preds = tf.math.argmax(logits, axis=1)
    acc = tf.reduce_mean(tf.cast(preds == labels, dtype=tf.float32))
    return acc.numpy().item()

(3) 最后，定义训练循环：

python 复制代码

NUM_HIDDEN = 16
LEARNING_RATE = 1e-2
WEIGHT_DECAY = 5e-4
NUM_EPOCHS = 200

with tf.device(device):
    feats = g.ndata["feat"]
    labels = g.ndata["label"]
    train_mask = g.ndata["train_mask"]
    val_mask = g.ndata["val_mask"]
    test_mask = g.ndata["test_mask"]
    in_feats = feats.shape[1]
    n_classes = dataset.num_classes
    n_edges = dataset[0].number_of_edges()

    model = NodeClassifier(g, in_feats, NUM_HIDDEN, n_classes)
    loss_fcn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
    optimizer = tf.keras.optimizers.AdamW(
        learning_rate=LEARNING_RATE, weight_decay=WEIGHT_DECAY)

    best_val_acc, best_test_acc = 0, 0
    history = []
    for epoch in range(NUM_EPOCHS):
        with tf.GradientTape() as tape:
            logits = model(feats)
            loss = loss_fcn(labels[train_mask], logits[train_mask])
            grads = tape.gradient(loss, model.trainable_weights)
            optimizer.apply_gradients(zip(grads, model.trainable_weights))
        
        val_acc = do_eval(model, feats, labels, val_mask)
        history.append((epoch + 1, loss.numpy().item(), val_acc))

        if epoch % 10 == 0:
            print("Epoch {:3d} | train loss: {:.3f} | val acc: {:.3f}".format(epoch, loss.numpy().item(), val_acc))

epochs = [epoch for epoch, _, _ in history]
losses = [loss for _, loss, _ in history]
val_accs = [val_acc for _, _, val_acc in history]

plt.subplot(2, 1, 1)
plt.plot(epochs, losses)
plt.xlabel("epochs")
plt.ylabel("train loss")

plt.subplot(2, 1, 2)
plt.plot(epochs, val_accs)
plt.xlabel("epochs")
plt.ylabel("val acc")

plt.tight_layout()
plt.show()

运行代码，训练运行过程输出如下，可以看到训练损失从 1.9 降低到 0.02，验证准确率从 0.13 提高到 0.78。

(4) 评估训练好的节点分类器在测试数据集上的表现：

python 复制代码

test_acc = do_eval(model, feats, labels, test_mask)
print("Test acc: {:.3f}".format(test_acc))

打印出模型在测试数据集上的准确率如下：

shell 复制代码

Test acc: 0.779

TensorFlow深度学习实战——节点分类

TensorFlow深度学习实战------节点分类

0. 前言

1. 数据分析

2. 构建节点分类模型

3. 模型训练与评估

相关链接