Rumor Mitigation in Social Media Platforms with Deep Reinforcement Learning

ABSTRACT

社交媒体平台已成为人们传播和获取信息的主要渠道之一，其可靠性受到网络谣言的严重威胁。现有的辟谣手段如暂停用户、播放真实信息等，要么成本高，要么扰乱用户。在本文中，我们引入了一种新颖的谣言缓解范例，其中仅干预社交网络中的极少量链接来减缓谣言的传播，以较低的业务成本和用户意识来反击错误信息。开发了一种体现谣言传播机制的知识知情代理，它通过用于捕获社交媒体平台中的信息流的图神经网络和用于选择链接的策略网络来干预社交网络。在真实社交媒体平台上的实验表明，该方法可以有效减轻谣言的影响，使受影响的人群大幅减少25%以上。本文的代码发布于https://github.com/tsinghua-fib-lab/DRL-Rumor-Mitigation。

1 INTRODUCTION

谣言的迅速传播成为前所未有的挑战，对公共安全、健康和民主造成有害影响。错误信息快速传播的核心是信息级联现象，即社交网络用户受到感知信息的影响，采用或分享该信息，从而导致战略性放置的错误信息触发和操纵的级联效应 [2, 3]。因此，开发一种能够自动合成谣言缓解措施的智能算法来应对社交网络上每天出现的大量谣言至关重要。目前缓解谣言的方法遵循两个主要范式。首先，选择并暂停一部分用户，即从网络中删除节点以阻止谣言的传播[9]。其次，将真实信息引入网络，选择多个种子节点来广播真实信息，以最大化其对网络的影响力[1]。然而，这些方法往往成本高昂并且给用户带来很大的烦恼。因此，在本文中，我们关注一种新的范式，其中谣言以较低的业务成本得到缓解，并且用户几乎不知道缓解措施[14]。我们保留所有节点，仅屏蔽社交网络中的一小部分链接，以减缓谣言的信息级联，从而最大限度地减少用户干扰并保持信息完整性。通过删除链接来缓解谣言面临三个主要挑战。首先，候选干预选项非常大，因为社交网络中的链接比节点多得多，导致解决方案空间巨大。其次，由于谣言传播的复杂性和随机性，很难捕捉到谣言传播的潜在机制。因此，现有文献在很大程度上尚未探索如何有效利用社交网络的领域知识。第三，现实世界的社交网络往往表现出不同的拓扑和动态[12]。因此，有必要开发一种具有足够泛化能力的算法，使其适用于真正的谣言消除任务。

为了应对这些挑战，我们开发了一个用于缓解谣言的深度强化学习（DRL）框架。为了利用丰富的领域知识，我们首先根据社交网络理论提取关键特征，捕获每个节点和边缘在谣言传播中的贡献。然后我们设计一个图神经网络网络（GNN），具有链路路由感知消息传递，分别捕获链路的本地和全局角色。进一步开发了面向谣言的策略网络来选择删除链接，同时考虑谣言来源和社区结构。我们的知识型代理体现了谣言传播机制，有效提高了生成的谣言缓解解决方案的准确性和可解释性。最后，我们设计了一个随机训练环境，模拟具有不同拓扑和谣言传播模式的社交网络，这保证了我们方法的泛化能力。

总而言之，本文的贡献如下：

• 我们以低成本和用户干扰的新范式解决谣言缓解问题，该范式仅干预社交网络的极小部分链接。 • 我们开发了知识型智能体和随机训练算法，以实现普遍化的谣言缓解。

• 在现实社交网络上的实验证明，我们的方法可以将谣言的影响大幅降低 25% 以上。

2 PROBLEM STATEMENT

考虑一个有向社交网络 G = (N, E)，其中 N 和 E 代表用户并影响他们之间的关系（即关注者和被关注者）。假设谣言从源 s ∈ N 发起，通过扩散模型 μ 传播，导致社交网络中的 k 个节点接收谣言。谣言的影响可以定义为受影响人口的百分比，

其中 E[x] 表示随机变量 x 的期望，|N |表示集合 N 中的元素数量。谣言缓解可以定义为选择图中的边子集进行删除，以最大程度地减少谣言的传播。删除的最佳边集可以表示为：

其中 ED 表示删除的边集

3 METHOD

图 1：（上）环境提供对社交网络的观察，根据代理选择的操作控制网络，并通过谣言传播模拟返回奖励。（下）知识驱动的边缘选择，通过使用 GNN 在原始图和线图上传递链路路由感知消息来聚合邻居信息，最后使用面向谣言的策略网络选择边缘。

图 1 展示了所提出的框架的概述，其中代理依次删除社交网络上的边缘以防止谣言传播。知识知情模型旨在实现良好的边缘选择，它使用链接路由感知的 GNN 模型编码丰富的传播相关特征，同时考虑谣言源和传播动态。面向谣言的策略网络旨在进行边缘排序，感知分层结构以及与谣言源的关联，从而实现高质量的边缘阻止以减轻谣言。此外，我们开发了一种随机强化学习训练方法来增强模型的泛化能力，解决拓扑结构多样化和谣言来源不确定的挑战。

3.1 Knowledge-informed Edge Selection

拓扑和传播的特征。谣言传播涉及谣言来源、网络结构、传播机制等多个方面。我们设计了丰富的拓扑和社交网络中节点（FN）和边（FE）的谣言传播相关特征，包含谣言传播的先验知识，可以分为两类。

• 拓扑特征包括度（FN1、FE6）、中心性（FN2）和扩散重要性（FE7）[8]，描述了社交网络的拓扑结构，并为分析谣言的传播提供了有价值的见解。例如，扩散重要性表示信息通过边缘传播的效率，因此封锁具有较高扩散重要性的边缘可以有效防止谣言到达更多用户。

• 谣言传播特征包括到谣言源的最短路径长度（FN4）、是否有谣言源（FN5）、中介中心性（FN3、FE8）等，这些特征与谣言传播的特征密切相关。显然，接近消息来源的用户往往更早受到谣言的影响。因此，为了缓解谣言，靠近源的边缘预计具有更高的删除优先级。

值得注意的是，边缘去除改变了社交网络的拓扑结构，因此这些特征在每一步都是动态变化的。链路路由感知消息传递。由于边代表影响关系，是谣言传播的关键组成部分，因此有必要考虑它们作为本地用户链接和全球传播路线的多重角色。因此，我们提出了一种链接路由感知 GNN 来学习综合边缘嵌入，同时考虑到这两个方面，如图 1 所示。我们计算原始图和双线图中节点和边的表示，如下所示：

其中 Ani 和 Aeij 是节点和边的输入属性，Wk n 和 Wk e 是线性层。节点和边嵌入分别从原始图和导出双线图中获得，其中原始图上的边对应于折线图上的节点，星号表示折线图中的元素。最后一个传播层的输出 nL i 和 eL i j 是节点和边的嵌入，其中 L 是超参数，∥ 表示串联。

通过组合每条边的关联两个节点嵌入 n Li 和 nL j ，我们可以捕获本地用户链接的影响关系。同时，线图上的边嵌入 eL ij 捕获了每条边的全局传播路径作用。因此，链路路由感知消息传递有效地编码了边缘在连接用户和传播谣言中的作用，为后续边缘选择提供了有价值的见解。谣言导向的政策网络。我们开发了一个面向谣言的策略网络，考虑了 GNN 的边缘嵌入、谣言源和社交网络社区。如图 1 所示，策略网络通过多层感知器 (MLP) 计算边的分数，如下所示：

其中Ci捐赠节点i所属的社区，ns捐赠GNN计算的谣言源的嵌入。然后，代理根据对策略网络的边缘分数进行归一化而获得的概率对边缘进行采样。

3.2 Generalized Model Training

由于现实世界的社交媒体平台在网络拓扑和传播动态方面表现出不同的特征，因此预计谣言缓解算法可以在不同的场景中推广。为了实现这一目标，我们引入了一个随机强化学习框架，允许代理从大量不同的谣言传播任务中学习有效的谣言缓解策略。具体来说，我们使用随机网络拓扑来训练代理，其中在每个情节中环境都会生成不同的社交网络。同时，对于同一个社交网络，我们通过在每次训练时随机选择不同的节点作为谣言源来模拟谣言在各种拓扑结构中的传播，这大大增加了训练社交网络的数量。

4 EXPERIMENTS

4.1 Experiment Settings

社交网络数据。我们基于现实世界的在线社交网络进行实验，包括来自斯坦福大学大型网络数据集的 Twitter 和 Facebook [6]。表 1 总结所采用数据集的基本属性。对于每个网络，我们应用易感-感染-恢复（SIR）模型[4]来模拟谣言传播，其中γ = 0.20和β = 0.08[15]。基线和评估。我们包括传统方法，例如 Pagerank (PR) [10]、K-EDGEDELETION (KED) [13] 和 Greedy with Bond Percolation (GBP) [5]。我们还将我们的模型与基于度（HSD）和介数（HSB）的启发式搜索方法以及包括遗传算法（GA）[11]和模拟退火（SA）[7]的进化算法进行比较。此外，我们还包括一个最近的 DRL 基线 [9]，它根据 GNN 计算的嵌入来选择节点（DRLN）。

4.2 Overall Performance

我们删除了社交网络中 10% 的影响关系，同时为每个用户保留至少 60% 的影响关系。表 2 说明了我们的模型和基线的结果，我们有以下观察结果：

• 与其他基线相比，基于 DRL 的方法具有显着优势。基于 DRL 的方法在不同的社交网络上优于 HSC、KED 和贪婪方法。具体来说，它们在小型、中型和大型社交网络中分别平均提高了 10.9%、9.5% 和 19.5%，超过了贪婪方法。此外，基于 DRL 的方法可以轻松应用于复杂的社交网络，具有稳定的结果和合理的计算成本。

• 我们提出的模型实现了最佳性能。我们的方法最大限度地减少各种社交网络上的谣言。具体来说，我们观察到比次优解决方案至少提高了 19.1%。值得注意的是，随着社交网络规模的增加，我们的方法在谣言缓解方面的性能进一步提高，仅通过阻止 10% 的边缘就实现了超过 37% 的谣言传播减少，并且与其他基线相比的改进从 19 % 至 25%。

图 2：(a) 每个传播步骤受影响用户的累积百分比。 (b) 在每个传播步骤中散布谣言的用户比例。

我们将图 2 中每一步的谣言传播可视化。在原始网络中，谣言一出现就迅速传播，仅 10 步就达到峰值，影响了总共 60% 以上的用户。实施拟议的谣言缓解策略后，谣言得到了实质性压制。具体来说，在传播的前10步中受到影响的用户不超过20%，谣言的峰值影响也从35.6%大幅下降至10.1%。从全球角度来看，我们的方法减少了受谣言影响的总用户比例从 83.6% 到 23.7%，而基线只是暂时阻止谣言，导致至少 58.8% 的用户最终受到影响。

4.3 Ablation Study

我们进行了消融实验，以展示知识知情模型的几个关键设计的有效性。拓扑和传播的特征图 3 通过从训练有素的模型中单独删除每个特征来显示每个特征的重要性。删除与传播相关的边缘中心性（FE8）会导致最显着的性能下降（-39.6％），并且传播相关的节点中心性（FN3）的下降也很显着（-20.5％），这与传播相关的中心性一样是合理的识别谣言传播的关键边缘。精心设计的拓扑结构和传播特征可以捕捉谣言传播的关键因素，这对于谣言缓解至关重要。

链接路由感知消息传递所提出的 GNN 模型结合了边缘的功能，作为谣言传播中的链接和路由。为了评估传播消息的影响，我们通过消除节点和边之间的消息传递进行实验，如图3所示。我们可以发现，消除节点和边传播导致缓解率分别降低了7.4%和12.3% ，分别。这一结果证实了我们的链路路由感知消息传递在聚合本地和全局信息方面的优势。

图 3：消融实验的结果，分别删除了节点 (FN) 和边 (FE)、GNN（链路和路由）以及策略网络中面向谣言的设计（社区和源）的特征。最好以彩色形式观看。

面向谣言的策略网络如图 3 所示，消融实验证明了社区和谣言源身份在实现高质量边缘选择方面的重要性。具体来说，当我们忽略与谣言来源的相关性时，缓解效果下降了16.9%。而且，当我们忽略社区信息时，下降更加明显，达到25.11%。

5 CONCLUSION

在本文中，我们提出了一种 RL 框架，以消除社交媒体平台上错误信息的影响，同时降低用户意识和商业成本。我们提出了一种使用随机算法训练的知识型代理，该代理可以阻止最小的一组链接以减少谣言。通过在现实世界的社交媒体平台上进行的广泛实验，我们的方法证明了在遏制错误信息传播方面具有显着的有效性，与基线方法相比，性能提高了 21.1% 以上。未来，我们的目标是扩展我们的框架，以解决更复杂的错误信息挑战，例如在动态变化的社交网络中打击多个谣言来源。