A survey on influence maximization models

ABSTRACT

影响力最大化是社交网络分析中的一个重要研究领域,研究人员关注的是检测有影响力的节点。有影响力节点的检测在计算机科学、舆论传播、政治运动或经济学等多个学科中引起了极大的兴趣,在这些学科中,系统通常被建模为图形。影响力最大化问题被证明是 NP 困难的。这种计算复杂性由两个主要因素证明是合理的。第一个因素是社交网络的重要规模。 TikTok 和 Facebook 等现代社交网络的用户数量达到了前所未有的水平。动态社交网络,其拓扑结构或/和信息内容能够发展,代表第二个因素。最大限度地提高在此类网络中的影响力仍然是一项重要任务。鉴于此,已经提出了几种方法。受这一事实的启发,我们在本文中提供了影响力最大化方法的详细调查。我们主要关心的是提供静态和动态网络中现有模型的分类。此外,我们根据明确的分类提供了最先进方法的比较。还讨论了检测有影响力节点的新趋势。然后我们提出一些挑战以及未来的方向。

1. Introduction

由于智能手机的爆炸性使用,社交网络已成为我们生活中最重要的沟通工具。此类网络中信息的可用性涉及用户之间的关系以及表征用户的数据,这引起了人们对其分析的极大兴趣。社交网络分析可能会影响扩散安排、影响者的出现或社会参与者的特征。 Twitter、Facebook、TikTok等现代社交网络已成为人们传播新思想或交流新产品信息的主流网络平台。近年来,此类应用的爆炸性使用已经形成了包括营销机构和影响者在内的完整的社交媒体营销产业链(Wang et al., 2023)。例如,TikTok 上的影响者已经拥有数千万粉丝(Wang et al., 2023)。这种现象在社交网络中被称为影响力最大化问题(IM)。 IM问题出现在政治竞选、疫情分析等一系列实际应用中。在政治上,美国总统特朗普利用 Twitter 社交网络传播有关总统选举的推文,从而影响人们投票给他(Azaouzi et al., 2021)。在病毒式营销中,IM被广泛用于推广新产品。例如,一家创建新产品并希望将其出售给大量客户的公司首先选择初始用户子集以免费使用产品样品在口碑效应下推荐给家人和朋友。从这个想法出发,社交网络中出现了影响力最大化问题。

上述 IM 问题旨在选择一个最小的个体集合,称为种子集,它们在信息扩散过程中容易最大化影响力的传播。 Kempe 等人提出了两种主要的扩散模型。 (2003) 是 IC(独立级联)和 LT(线性阈值)模型。艾哈迈德等人证明 IM 问题是 NP 困难的。 (2011) 在这种扩散模型下 (Jaouadi & Ben Romdhane, 2022)。

近年来,人们在 IM 问题上做出了很多努力。根据现有模型中使用的社交网络的性质,我们在本文中建议将其分为两类:静态网络和动态网络。对于静态网络,讨论了全网络模型和基于简化网络的模型。整个基于静态网络的检测模型主要利用节点的拓扑特征,例如中心性度量或社区结构。基于动态网络的模型通常依赖于网络元素之间交互的变化。当我们谈论大量数据的动态时,问题变得更加复杂,原因很简单,网络的结构和信息都会随着时间的推移而变化。

1.1. Discussion of existing survey works

关于 IM 问题的调查论文试图将现有模型分为广泛的类别(Taha,2022)。李,范等人。 (2018) 在他们的论文中提出了现有 IM 模型的理论分析。他们的调查是第一个解决上下文感知 IM 问题的工作。然而,他们只考虑了贪婪算法来对现有模型进行分类,这非常耗时。为了解决这种低效率问题,采用了中心性措施。阿尔-加拉迪等人。 (2018)研究了此类识别有影响力节点的措施。他们将现有模型分为局部测量、最短路径测量和基于迭代计算的测量。这项工作的一个关键优势是考虑机器学习方法。然而,该调查忽略了动态网络,它仅基于静态网络。在同一方向,Jaouadi 和 Ben Romdhane(2019)对 IM 模型进行了详细的调查。上述工作为解决 IM 问题提供了清晰的分类,同时提到了最先进方法的优点和缺点。然而,作者只考虑了静态网络。 Aghaee 等人的评论也有同样的缺点。 (2021)仅考虑社交网络的拓扑特征来概述元启发式作品。本文的主要思想是解决基于启发式算法的模型,例如蜂群算法、遗传算法(Jabari 等人,2022)和粒子群。 IM问题被认为是一个优化问题。卞等人。 (2020) 在考虑动态网络、网络内容和主题的同时回顾了 IM 方法。在本文中,现有的 IM 问题模型根据网络结构、网络内容以及中心性度量进行了分类。然而,对于动态网络,作者只考虑了拓扑变化。在同一背景下,Hafiane 等人。 (2020) 对动态网络中的 IM 模型进行了详细的调查。本文讨论了动力学的几个方面,例如增量方法、间隔方法和接触序列方法。论文中进行了清晰的比较。然而,基于信息的动态模型被忽略了。 Razis 等人的调查。 (2021) 提出了基于社交语义识别有影响力用户的最新方法。此外,他们将社区结构和社会匹配视为社会语义角色。阿扎乌兹等人。 (2021) 为 IM 问题引​​入了一个新概念,即基于群体的影响力。他们为现有模型提供了两个类:基于节点的模型和基于组的模型。此外,本文还解决了隐私保护下的影响力最大化问题。此类调查的主要关注点是对现有模型进行清晰的分类,并描述 IM 问题的新趋势。然而,仅考虑基于静态网络的模型。最近的另一篇论文讨论了上下文感知影响力最大化(Ye et al., 2022),并提到了具有明确分类的经典 IM 算法。在这项工作中,作者提出了 IM 问题,同时考虑了经典扩散模型和基于深度学习方法的扩散模型的新表述。此类论文的主要优点是考虑解决 IM 问题的新方法,例如上下文感知 IM。然而,他们的调查仅限于静态网络的研究。关于 IM 主题的现有调查论文将模型分为广泛的类别。不幸的是,他们没有在现有作品所采用的具体技术之间划定明确的界限。有些作品只考虑静态网络而忽略动态网络。此外,如果考虑动态网络,则仅考虑基于结构的模型。对于庞大的现代社交网络来说,大多数模型都难以处理如此大规模的网络,因为它们是基于整个网络的。然而,可以使用缩减阶段来解决采样版本中的 IM 问题。所有调查论文都忽略了这种分类。

图 1. 社交网络影响力最大化模型的分类。

在这项工作中,现有模型根据网络的性质分为两大类,如图1所示,静态网络和动态网络。对于静态网络,讨论了整个网络和基于简化网络的模型。基于全静态网络的检测模型主要使用拓扑节点的特征,例如中心性度量或社区结构。对于基于动态网络的模型,我们提供的工作不仅依赖于网络结构的变化,而且依赖于社交内容的变化。

1.2. Goals and contributions of the survey

本次调查的主要目的是展示、分类和分析针对社交网络中影响最大化问题提出的现有模型。本文的主要目标如下:

• 对最先进的 IM 模型进行分类和比较。

• 提供用于描述、识别和从静态网络中提取有影响力用户的测量方法,同时考虑整个网络和缩减网络。

• 根据社交网络的动态方面提出价值IM问题:基于结构的动态模型或基于信息的动态模型。

• 提出检测有影响力节点的新趋势。

为了实现上述目标,本文对传统工作进行了概述,以给出解决 IM 问题的经典方法的想法。在进行调查之前,已经考虑了许多研究问题。例如,对于所选的论文,所提出的模型是否能够在大型网络上扩展?所提出的模型能否检测到影响力最大化的最小种子集?模型是否无参数?所提出的模型可以处理静态和动态网络吗?该模型是否能够考虑多个扩散模型?

考虑到这些问题,我们开始根据表1中提到的关键词来选择论文。然后,许多被引用最多的论文都包含了大规模网络的缩减步骤来解决IM问题。由此,考虑在整个社交网络和简化版本的网络中都起作用的想法诞生了。我们试图概述如何创建简化图,以及简化版本能否保持原始网络的扩散和关键属性。该评论为社交网络中影响力最大化的研究提供了一个新的方向,而这是大多数评论中所缺失的。据我们所知,还没有对采样和粗化网络(称为缩减网络)中的 IM 模型进行过调查。本文的主要目的是说明此类模型。因此,对在简化网络中保留扩散特性的能力进行了理论研究(Jaouadi & Ben Romdhane,2022)。对于此类分析,需要考虑真实数据集(Leskovec & Krevl,2014)。此外,我们尝试根据社交网络规模的缩小来比较几项相关作品。另一方面,对于动态网络,我们尝试研究网络的结构和语义方面。现有的关于动态网络的调查只考虑了一方面,结构或语义,而不是两者。此外,许多工作都是在小型网络上进行的。为此,论文涉及由于现代社交网络已经达到了相当大的规模,因此本次审查不考虑此类网络。我们选择了几篇可以处理大规模网络的作品,并在本文中介绍了被引用最多的作品。总之,表 1 简要概述了所考虑的影响力最大化工作。

对论文中讨论的IM相关工作进行总结

1.3. Structure of the survey

本文分为两个主要部分。文献中可用的 IM 问题模型分类在静态和动态网络中均提供,如图 1 所示。最后一部分将讨论有影响力的节点检测的新趋势,以给出有关 IM 最新公式的想法。问题。整篇论文的结构如下。第 2 部分致力于介绍社交网络中影响力最大化问题以及扩散模型的初步材料。第 3 节讨论静态社交网络中 IM 问题所提出的模型的分类。本节致力于概述用于从整个社交网络以及简化版本中选择种子集的结构技术。第 4 节讨论了动态社交网络中有影响力的节点检测的拟议模型。本节考虑动态的本质:结构/信息。第 5 节介绍了 IM 问题的新应用,以强调该领域的新趋势。第 6 节讨论了比较分析。第 7 节致力于提及 IM 问题的一些挑战和未来方向。最后第 8 节通过提供未解决的问题来结束审查。

2. Preliminary knowledge for influence maximization in social networks

社交网络在我们的日常生活中无处不在。此类网络是生物学家、经济学家、社会学家等研究的主题。图是社交网络建模最明显的方式,其中顶点是社交用户,边是他们之间的交互(Jaouadi & Ben Romdhane,2022)。独立于社交网络的内容,它们具有共同的特征。例如,节点的邻居通常按照异构规律分布,这种属性称为节点度分布(Jaouadi & Ben Romdhane,2021),通常用低幂分布来近似。另一个结构属性是社区结构,它建议检测节点组,以便同一组(社区)中的节点在社区内部有更多的交互,而与外部的交互更少(Rhouma 和 Ben Romdhane)

2.1. Problem formulation

社交网络可以通过无向图 G = (V , E) 来建模,其中 V 是代表网络用户的节点集,E 是建模它们之间交互的边集。影响力最大化问题可以定义如下:给定一个对社交网络进行建模的图 G = (V , E)、控制影响力在用户之间传播的扩散模型 M 以及预算 k < |V |作为种子集大小,IM 旨在检测使 G 中的影响力传播最大化的种子集 e。以下方程可以更正式地描述 IM 问题:

其中 σ(e, G) 是 e 的影响范围。它说明了扩散停止时的活动节点。在社交图G中要区分节点的两种状态:活动节点和非活动节点。活跃节点 u 接受新想法并将其传播到其不活跃邻居 v 以激活它。如果 v 受到扩散内容的影响,它会再次重新扩散它,并且被称为激活的。否则,它仍然处于非活动状态,因此节点 u 永远不会倾向于再次激活它。节点之间交互的过程表达了信息的扩散(李青等,2020)。这里使用扩散模型来描述节点的交互过程和行为模式。种子集 e 的影响力扩散表示影响力扩散过程结束后 G 中活跃节点的数量。

2.2. Diffusion models

扩散模型用于控制社交网络中的影响力传播。在此过程结束时,将识别活动节点。事实上,当用户收到新的社交内容(信息、想法)并倾向于将其传播给他/她的朋友时,后者倾向于在他们的朋友之间重新传播它,信息在网络中流通。这种现象称为影响力传播,用于区分社交网络中的活跃节点。回想一下,如果一个节点收到一个想法并再次重新传播它,则该节点被称为活动节点。然而,如果节点尚未达到影响力或者拒绝从他/她的朋友传播的新内容,他仍然不活跃。节点状态从不活动变为活动取决于所使用的扩散模型。因此,活跃节点不会变得不活跃,在扩散过程中它仍然是活跃的。最初,节点处于非活动状态,并且在每次迭代时,活动节点尝试根据指定的扩散模型激活其邻居。 Kempe 等人提出了两种主要的扩散模型。 (2003)是IC(独立级联)和 LT(线性阈值)模型。在这两种模型中,信息根据某种概率规则从一个节点传递到另一个节点(Zhu et al., 2014)。因此,在此类模型中,每个节点都会尝试以影响概率激活其邻居。因此,要应用扩散模型,应使用影响概率对社交图进行加权,如下所示。给边(u,v)(连接节点u和v)分配一个概率值pu,v ∈ [0, 1]来表示u激活其邻居节点v的概率。图 3 和图 2 显示了两个常用模型的一般原理,其中每条边均按影响概率进行加权。最初,所有节点都是不活动的,然后一些节点表示种子被选择被激活,并从它们开始传播。在传播过程中,如果非活动节点采用新信息并将其传播到其邻居,则它可以转变为活动节点。但是,活动节点不能进入非活动状态。下面我们将正式描述这两种模型的原理。

• 独立级联模型IC:IC 模型下的影响原理是:活动节点u 有一次机会以影响概率ωu,v 激活其不活动邻居v(Jaouadi & Ben Romdhane,2018)。对于影响概率,大多数工作依赖于启发式概率的分配(Li,Fan et al.,2018)。例如,概率 ωuv = 1 din v (其中 din v 是节点 v 的入度)(Li, Fan et al., 2018; Wang et al., 2016)被分配给链路 (u, v) 。因此,v 的所有活跃邻居都有相同的机会影响它(相等的概率)。 u影响v的概率取决于v的邻域。影响低度节点比影响高度节点更容易。最近,已经有一些工作可以根据网络数据确定影响概率,例如社会行动传播(Li,Fan et al.,2018)。

例如,如图 2 所示,最初在 T = 0 时,输入图由影响概率标记,并且节点 v 被选择为活动节点以启动扩散过程。在 T = 1 时,v 尝试以指定的影响概率(分别为 0.2 和 0.5)激活其每个不活动的邻居(u 和 w)。结果,节点v激活w成功,而节点u激活失败。在本次迭代结束时,出现一个新的活动节点(即 w),并且节点 v 应该被添加到种子集中,因为它被设法激活它。对于下一次迭代,新的活动节点 w 可以激活其不活动的邻居,并且扩散过程继续,直到没有不活动的节点可以被激活。对于图中的示例,经过三次迭代后,扩散过程停止。

IC模型的主要优点是节点的激活过程独立于其邻居的影响。然而,节点激活其不活动邻居的机会是唯一的,如果不成功,它将不再能够激活它(Chen et al., 2014)。

• 线性阈值模型LT:

对于阈值模型,当且仅当节点v 已激活的邻居NBv 的数量或比例超过其阈值θv 时,节点v 才被激活(Zhu et al., 2014)。对于LT模型,社会压力表示激活。该模型下的激活条件可以描述为:

其中 θv ∈ [0, 1] 是随机阈值,wu,v 是边 (u, v) 的权重。

θv 控制节点 v 的信息扩散。事实上,阈值低的节点比阈值高的节点更容易受到影响。在该模型中,如果非活动节点接纳足够数量的活动邻居,则它可以转变为活动状态。对于影响概率(链接权重),大多数算法使用启发式方法,例如随机为集合 {0.1, 0.01, 0.001} 中的边 (u, v) 分配概率(Li, Fan et al., 2018)。

例如,如图 3 所示,最初在 T = 0 时,输入图由影响概率和节点阈值标记。在第一次迭代时,节点 v 被选择为活动节点以启动扩散过程。节点 u 和 w 是 v 的不活跃邻居。从只有一个活跃邻居 u 的节点 w 开始,可以看出 u 对 w 的影响概率超过其阈值,因此节点 w 进入活跃状态并可以参与激活其在下一次迭代中不活动的邻居。经过三次迭代后,没有可以激活的不活动节点,并且扩散过程停止。对于 LT 模型,不活动节点变为活动节点的机会随着其活动邻居数量的增加而增加。然而,阈值的随机选择会影响扩散过程。

其他几个模型是从 LT 和 IC 模型衍生而来的(Jaouadi & Ben Romdhane,2019)。 Ahmadi Beni 等人提出了 IC 模型的最新改进版本。 (2023)。经典的IC模型仅定义激活节点的数量。然而,根据艾哈迈迪·贝尼等人的说法。 (2023),我们不能仅仅依靠这个数字,假设在社交网络中,两个节点可以激活相同数量的节点,即它们具有相同数量的激活节点,但它们的影响力扩展不同。因此,作者建议使用网络层来进行影响力传播过程。他们在K-shell算法的基础上,提出了一种将激活节点数与壳数相结合的新衡量标准。壳数是在以下假设下计算的:有影响力的节点通常位于最内层,例如核心层。 W C(加权级联模型)(Wang et al., 2016)是 IC 模型的加权版本。因此,每个节点都承认一个非负权重,该权重是根据其属性计算出来的,与网络结构无关,并且使用该权重来计算影响概率。 Tong 等人提出了 IC 的另一个版本。 (2017)考虑了动态社交网络。该模型遵循与 IC 模型相同的原理,不同之处在于假设影响概率呈离散分布而不是分配固定值。 LT-C(带颜色的线性阈值)(Bhagat 等人,2012)是一个在扩散过程中包含采用传播的模型。事实上,它认为尚未接受某个想法的用户可能会分散他的决定。此外,如果一个人采纳了一个想法或信息,它还包括该个人对所采纳的内容的坚持程度。因此,该模型下的影响概率取决于两个参数:采用社交内容和喜欢采用的内容。 PSI(概率社会影响力模型)(Myungcheol & Ling,2014)结合了两个标准模型 IC 和 LT 的最佳方面,同时忽略了某些缺点,提出了社会影响力的概率分布。

3. Influence maximization in static networks

文献中已经开发了几种方法来检测有影响力的节点(通常称为种子)。然而,解决这个问题仍然是一项具有挑战性且不平凡的任务。大多数现有算法都是参数化的,用预算 k 来精确选择 k 个种子。此外,大多数方法都应用于静态网络。然而,真正的社交网络的数据是动态的:网络不断发展。例如,每天都有新用户在 Facebook 上注册,同时许多用户正在删除或停用他们的帐户。此外,用户找到新朋友,也有可能删除一些朋友列表。同样,这种现实世界的网络因其规模而呈分布式,这导致了巨大网络甚至大数据图概念的诞生。在这项工作中,社交网络的状态被认为是静态的或动态的、整体的或缩减的。因此,现有的工作都是基于网络模型提出的。

为了解决静态网络中的 IM 问题,已经开发了几种模型。这些模型可以分为两类。第一类是基于社交网络的整体来检测影响者,第二类是基于社交网络的简化版本,以便能够在超大规模网络中最大化影响力。下图说明了社交图的示例,Email-EuAll1(具有 n = 1005 个节点和 m = 25 571 条边)。图(a)代表了整个网络,可以看出,即使这个网络规模很小,也很难区分关系并对图进行全面的研究。图(b)描述了同一网络的社区结构。如图所示,区分网络节点及其关系变得更加容易。对于最后一张图,创建了同一网络的简化版本,其中原始网络的一些节点和边保留在新版本中。这种简化的网络更容易研究和区分有影响力的元素。此外,现代社交网络规模庞大,因此保留原始网络关键属性的简化版网络可以帮助处理此类网络数据。

3.1. Whole network-based models

许多相关研究都考虑了整个网络上的 IM 问题。基于整个网络的解决方案可以分为四类:

(1)基于贪婪算法的模型; (2) 基于中心性测度的模型; (3) 基于社区结构的模型; (4) 基于机器学习的模型和 (5) 混合模型。本节致力于通过比较不同方法来研究此类模型的趋势和进展。

3.1.1. Greedy algorithm-based models

贪心算法迭代 k 次,在每次迭代中选择一个局部最优值,以便在将 k 个种子选择为全局种子时收敛。换句话说,基于影响力的目标函数,贪心算法首先选择第一个增加影响力增益的种子节点,并将该节点添加到种子集 S 中。然后,它解析其余节点以选择第二个节点。种子添加到 S 中时影响最大化,依此类推,算法迭代直到选择 k 个节点。贪婪算法基于蒙特卡罗模拟,以便解析网络并在每次迭代时选择最佳节点(Shang 等人,2018)。事实证明,此类模拟非常耗时(Taha,2022)。鉴于此,已经提出了几种方法。它们的主要目的是降低蒙特卡罗模拟成本。莱斯科维奇等人。 (2007)利用影响传播函数的子模性质来改善贪心算法的时间成本差距,提出了CELF(Cost-Effective Lazy Forward)算法。贪心算法的主要低效之处在于评估的节点数量是蒙特卡罗模拟的二次方。 CELF 通过利用子模块性的特性解决了这个问题。这种利用确保节点的边际增益随着种子集的增加而减少。 CELF++(Goyal et al., 2011)是 CELF 的改进版本。它遵循相同的原则,并通过避免不必要的边际收益重新计算,给出比 CELF 更合适、更快速的估计。当计算节点 v(如果添加到种子集 S)的边际增益时,CELF++ 同时应用 v 的计算,同时考虑 S ∪ {u},其中 u 是具有最大边际增益的节点。两个增益值可以通过蒙特卡罗模拟同时计算。实验表明,CELF++ 比 CELF 快 30% 甚至 50% 左右。虽然这种方法避免了不必要的计算并降低了贪心算法的时间复杂度,但它消耗了大量的内存(Goyal et al., 2011)。为了解决大规模社交网络的内存消耗问题,Rostamnia 和 Kianian(2019)提出在应用贪婪算法之前执行网络预处理步骤。他们的目标是利用节点覆盖原理从原始网络中消除低效节点。事实上,覆盖 D 是给定图 G 的节点子集,其中每条边的两个端节点中至少有一个是 D 的一部分。在删除低效节点后,作者应用 IC 扩散模型下的贪心算法来检测有影响力的节点。同样,为了解决内存消耗问题,Li 和 Liu (2019) 提出了另一个框架。这项工作旨在最大化基于派系的影响力。知道一个派系对应一个完整的子图(即每个节点都链接到所有其余节点的子图),我们的想法是提出一种基于派系识别的有效算法来识别前 k 个有影响力的节点。所提出的算法基于三个步骤,从派系的提取开始,然后选择候选者,最后生成有影响力的节点。第一步是基于搜索最大尺寸派系的想法。至于第二阶段,候选生成,它是基于属于同一派系的节点可以轻松交互的事实。因此,选择派系中度数最高的节点作为代表,删除其他节点。最后,从增益最好的节点开始选择前 k 个有影响力的节点。 Li 和 Liu(2019)引入了一个新概念,即签名网络中的影响力最大化,我们区分了负面影响和正面影响。这作者定义了一种新的扩散模型 P LID(极性相关线性影响扩散),旨在无需模拟即可计算用户的影响力。这种方法的主要思想是,与其他模型不同,每个节点都有两个概率,一个是受到正面影响的概率,另一个是受到负面影响的概率,而不是具有单一的影响概率。给定输入图 G 和初始种子集 S,负面影响和正面影响的计算取决于节点是否属于 S。

3.1.2. Centrality measures-based models

中心性度量通常用于社交网络分析任务。事实上,对于影响力最大化问题,中心性得分高的成员更有可能成为网络中流通内容的采用者(Ahsan et al., 2015)。已经提出了多种措施。例如,CC 度量(Closeness Centrality)(Azaouzi et al., 2021)指定了网络中个体与其他人的接近程度。 BC 度量(Betweenness Centrality)(Ahsan 等人,2015)确定两个网络用户之间的最短路径数。 DC 度量(Jaouadi & Ben Romdhane,2021)(度中心性)被广泛用于检测前 k 个最高度节点作为影响因素。 k 壳分解度量(Zareie & Sheikhahmadi,2018)是用于根据拓扑位置选择节点的另一个特征。 k-shell方法被广泛使用。另一个被证明可以有效计算影响力的指标是 PageRank 指标。就网络而言,文档是通过超链接链接的。因此,集合的结构是有向图的结构。 pi 页面的 PageRank 指标 (PR) 是用户通过链接随机到达 pi 的概率(Brin & Page, 1998)。 Adineh 和 NouriBaygi (2018) 提出了两种启发式方法来降低解决 IM 问题时的时间复杂度。这些启发式方法在考虑网络的某些特征的同时提高了度中心性所达到的影响力。作者试图证明,当承认程度最高的节点被选择为有影响力时,将影响力传播到其邻居的概率会很高。 IgnoringNeighbors 是第一个启发式方法,首先选择高度节点。假设最初选择的节点到达的任何邻居节点都会受到影响,其想法是删除所有到达的邻居,然后从剩余节点中选择下一个有影响的节点,直到达到预算 k。第二个启发式 DescendingDegreeDecrease 的思想是减少高度节点所到达的邻居的度。因此,下一个有影响力的元素将从已更新其度数的邻居中选择。杨等人。 (2018)以两种不同的方式定义了影响力传播,要么通过识别初始影响者集来最大化影响力,要么通过在特定扩散模型下的链接阻塞来最小化影响力。事实上,他们提出了一个考虑独立级联模型(IC)下链接激活的模型。所提出的解决方案本质上是基于与每个链路相关的成本的计算。因此,根据预算,仅激活一组特定的链接。参考邻域的概念,提出了一种称为 LAIM(Wu et al., 2018)的两步框架。第一步致力于估算影响力第二步是种子集的选择。该算法首先选择局部影响力最高的节点作为第一种子,然后从图中消除该节点,并重新计算新图节点的局部影响力。一旦识别出 k 个节点,算法就会停止。基于当地的影响力,Qiu 等人。 (2020)提出了一个三步走的方法。最初,节点根据其局部影响力降序排列,并选择其中一些节点作为源。第二步,提出了 LGIM(基于局部影响力的全局选择)算法,从源节点的前因中选择候选者。基于新的目标函数,在两跳区域确定全局影响力。最后,最后一步致力于从候选节点中选择有影响力的节点,同时选择边际增益最高的节点作为种子。 Bet-clus(Saxena et al., 2023)是一种最新的方法,它结合了介数中心性度量和聚类系数来识别有影响力的节点。 Bet-clus 的基本思想是根据节点的中心度值对节点进行排名。因此,选择前 k 个节点作为种子。所提出的方法证明了图度量对于社交网络分析的重要性。上述中心性措施将重要节点识别为传播者,并且通常种子可能位于同一区域。为了克服这个问题,提出了 VoteRank 模型,以便使用投票机制来帮助检测来自网络不同区域的种子(Liu et al., 2021)。对于投票机制,VoteRank 仅考虑直接邻居(单跳邻居)并解决了未加权网络中的 IM 问题。提出了 voteRank 模型的加权版本,称为 WVoteRank(Sun 等人,2019),以解决加权网络中的 IM 问题。人们提出了这种模型的许多扩展来考虑两跳邻居(Kumar 等人,2022),并被证明是高效和快速的。

3.1.3. Community structure-based models

社区是指在社区内彼此互动比与外部其他个体更频繁互动的个体子集(Jaouadi & Ben Romdhane,2021),

如图 4 所示。图的社区结构的检测有助于搜索对于有影响力的节点,它提供了一种减少搜索空间的方法。 Li、Gan 等人提出的框架。 (2018)在影响力最大化期间合并了用户配置文件,以定义网络中个体之间不同类型的合规性。该框架的第一阶段致力于选择节点组,同时生成新图,其中每个节点对应于一个用户,并且一次可以参与一个或多个组。至于第二阶段,它包括从每个组中选择有影响力的节点,从最大的开始,并假设从每个组中选择单个节点。该模型的独创性在于融合了用户之间的两种类型的整合:友谊整合和群体整合。考虑具有相似兴趣且位于同一组的节点对之间的友谊一致性。至于群体一致性,群体配置文件收集有关群体可能关注的主题的信息。因此,用户受到影响的概率取决于友谊一致性和群体一致性。叶等人。 (2018)提出了两种有效的模型来最大化影响力,同时考虑到网络的社区结构。首先,作者试图保留网络的邻域关系,并用向量表示图。然后,通过应用k-means算法来检测预定数量的社区。最后,基于以下思想,将两个影响力最大化模型应用于检测到的社区:如果节点与其邻居属于同一社区,则其影响力将被限制在其社区内,否则,该节点被视为中心节点。最近的一项工作引入了社区多样性的概念(Li et al., 2020)。该提案的目的是在选择种子集的同时最大化活跃节点社区的数量。因此,为了计算影响概率,需要确定最短路径。然后,采用贪心算法来选择种子集。 Umrawal 等人最近提出了一项工作。 (2023)基于社区结构。所提出的框架首先使用众所周知的方法 Louvain 和 Girvan-Newman 将网络划分为不相交的社区。第二步致力于分别为每个社区生成候选人。最后,使用渐进预算流程删除冗余元素以选择最终种子集。基于用户对影响力的敏感度,提出了CIP(Murugappan et al., 2023)模型。作者提出了一个四步框架,以利用网络的社区结构来最大化影响力。首先,根据用户的相似性来识别社区,并通过同质性和其他图形度量来翻译。然后,使用 K 均值算法在每个社区中识别候选者。至于第三步,作者设计了一个预测模型来估计影响的敏感性。最后一步致力于学习敏感性并预测最终影响。拟议框架的主要思想是跟踪少数社区的影响力,而不是跟踪所有社区的影响力。 FIP(Bouyer 等人,2023)是一种最新模型,旨在最大化影响力,同时降低 IM 问题的计算成本。该模型的基本思想是通过发现网络的社区结构来减少种子的研究空间。作者首先使用 LPANNI 算法来检测重叠社区。他们强调了重叠节点向其所属的不同社区传播信息的重要性。然后,通过组合最佳重叠节点和最佳非重叠节点来识别候选节点。换句话说,根据社区中全局扩散的概率系数选择一些重叠节点作为候选节点。因此,节点被分为两个子集来定义这种概率,一个是具有社区外部连接的节点子集,另一个是没有社区外部连接的节点子集。因此,最好的重叠节点是根据它们与不同社区的连接来选择的。对于非重叠节点,作者结合节点的邻居数量、度数以及所属社区的数量,提出了一种新的衡量最佳节点的方法。因此,候选节点是先前描述的最佳节点的并集。候选生成是 FIP 模型的第二步。最后一步,选择top-k最佳候选节点作为种子。

3.1.4. Machine learning-based models

如今,机器学习非常重要。研究人员将这种技术应用于许多学科,包括社交网络分析,其中系统通常表示为图表。图神经网络(GNN)代表了最近解决 IM 问题的强大工具,特别是当问题是基于机器学习技术解决时。大多数基于机器学习的模型都专注于 GNN 来估计多层网络中节点及其邻居之间的影响。最近提出了一项名为 GLIE(基于图学习的影响力估计)(Panagopoulos et al., 2023)的工作来解决 IC 模型下的影响力最大化问题。 GLIE 先接受小规模数据的训练,然后接受更大网络的训练。该模型的第一步致力于使用 GNN 并提出 CELF 版本来估计影响力。对于第二步,作者提出改进影响力扩散的贪心算法,并提出了一种新的算法。这项工作的主要优点是可以在大型网络上扩展。库马尔等人。 (2022)采用struc2vec节点嵌入算法来提取节点特征。然后,使用提取的特征,使用多层网络 (GNN) 来估计 IC 和 LT 模型下的影响。预测阶段的主要思想是利用结构特征来提取节点的特征向量。选择具有最高预测影响力值的前 k 个节点作为种子。同一方向,基于GNN,提出了DeepIM模型(Ling et al., 2023)。 DeepIM 是一个两步框架,一个学习步骤和一个选择步骤。第一步致力于控制设计的 GNN 下的传播分布。然后,在优化建议的目标函数时选择种子。该模型的主要优点是能够在多种扩散模型下进行测试,包括 IC、LT 和 SIR 模型。 Fastcover (Ni et al., 2023) 将 IM 问题简化为 dhop 支配集问题。换句话说,扩散步骤被标记为一跳,其影响可以通过多层网络中的 k 跳邻居数来估计。 Fastcover 被提出来解决 k 预算受限的 d-hop 支配集问题,并且作者提出了经典 IM 问题的新表述。 Kumar 等人使用了一种广泛使用且众所周知的深度学习应用。 (2023) 解决 IM 问题。这种技术被称为迁移学习,它包括在不同的数据集上迁移和使用先前预训练算法的边际增益。因此,作者提出了一种基于迁移学习的最新模型,以最大限度地提高对大规模网络的影响力。他们使用LSTM模型用在最小网络上获得的影响值来标记新网络中的节点,这一步被用作预测步骤。根据这种预训练模型可以帮助预测影响力的想法,最大网络中的节点已根据预测的影响力值进行了排名。为了估计这些值,作者建议创建一个巨大的 Barabasi Albert 网络,并在其中应用 SIR 作为扩散模型。最后,获得的影响力传播结果已用于更大的网络。 Ahmad 等人使用机器学习方法。 (2023)试图识别有影响力的节点,他们称之为重要节点。作者使用小样本训练了网络节点。然后,在 SIR 扩散模型下使用训练数据来预测重要节点。对于节点特征,所提出的模型结合了核心中心性、节点度和网络连接性等结构属性。至于训练步骤,作者采用 RBF 核作为支持向量回归机,并在几个实际网络中取得了良好的结果。上述基于机器学习的模型仅考虑静态网络。 Yanchenko 等人考虑了时间网络。 (2023),作者声称可以根据 GNN 预测阶段获得网络的未来变化。该模型的目的是在观察网络未来的演化之前选择种子节点。所提出的框架首先基于 GNN 进行链接预测来预测网络的未来变化,从而生成一组时间预测网络。之后,在预测网络中应用贪婪 IM 算法,并允许初始网络继续演化以在聚合快照时估计影响。

3.1.5. Hybrid models

一些方法建议对上述类别进行混合。 ComPath(Rahimnkhani 等人,2014)首先确定社区结构。将每个社区视为一个节点,利用介数中心性选择最有影响力的社区。开发了修剪步骤以从每个社区中选择最高度节点作为候选节点。最后,根据最短路径原则检测有影响力的节点。 INCIM(Borzogi et al., 2016)将紧密度中心性与社区结构相结合,以便分别计算给定用户在其社区内部和外部的本地和全球影响力。 DIN(Jaouadi & Ben Romdhane,2016)使用重叠社区检测来利用社交网络的结构。然后,根据 PageRank 中心性度量,通过修剪一些具有低值的元素来选择候选节点。 T SIM (Liqing et al., 2020) 是一个结合了 DegreeDiscount (DD) (Chen et al., 2009) 和 CELF (Leskovec et al., 2007) 两种现有方法来解决 IM 问题的模型。 TSIM 模型使用 DD 方法,首先选择候选者。然后,为了提高CELF模型的效率并计算候选人的边际收益,提出了一种新的衡量方法。

3.2. Reduced network-based models

为了处理大规模网络,许多作品建议缩小网络的规模。根据创建简化版本的方式,考虑了两类方法:基于图采样的模型和基于图粗化的模型。

3.2.1. Graph sampling-based models

图采样是一种广泛使用的减小社交网络规模的技术。对网络进行采样的主要目的是从原始模式创建一种代表性模式,同时保留其关键属性。最简单的采样技术是从初始网络中随机选择顶点或/和边的子集并形成采样版本(Hu & Lau,2013)。图采样影响了社区检测、影响力节点检测等各个领域。它被认为是帮助分析超大规模社交网络的强大工具(Jaouadi & Ben Romdhane,2021),特别是在 IM 问题领域,一些研究人员已经证明,使用采样技术不会损害标准 IM 问题的效率。 RIS (Borgs et al., 2014) 采用节点采样方法(反向影响采样)来解决大规模社交网络中的 IM 问题。首先选择一个随机初始节点,采样网络由到达该选定节点的节点创建。事实上,所提出的模型基于两个步骤:选择起始节点和构建实现最佳影响的样本。为了最大化影响力,RIS 首先选择 R 样本。然后,在考虑与R的重叠大小的同时选择起始节点。该方法实现了重要的影响扩散。然而,由于采样网络的大小,计算时间仍然很重要。人们开发了许多RIS的改进版本来解决其缺点(Li,Fan等,2018;Tang等,2015,2014;Wang,Zhang等,2017)。 CRIS(竞争性反向影响抽样)(Hong et al., 2020)是作为 RIS 模型的改进而开发的。该模型的主要思想是避免贪心算法造成的不必要的模拟。首先,使用 RIS 方法构建草图。然后,在根据种子竞争情况构建草图时估计影响力。最后利用贪心算法选择影响因素。为了验证采样技术不会损害扩散特性和原始网络的影响传播,已经开发了几种方法。 Salamanos 等人基于 RankDegree 模型。 (2017)首先创建一个样本网络,该网络可以实现覆盖 80% 网络用户的重要影响力传播。实验表明,采样网络保留了原始网络的关键属性,而且还保留了扩散属性。另一部作品(津川&Kimura,2018)证明网络的简化版本能够最大限度地发挥影响力。在这项工作中,研究了 IM 问题的采样效果。基于一些采样策略,已经创建了小规模采样网络。事实上,作者试图选择具有与原始网络中所达到的影响力相当的节点。作者成功证明了采样策略的使用不会损害扩散特性。鉴于此,最近提出了 MR-DSIN(基于 MapReduce 的影响节点动态选择)(Jaouadi & Ben Romdhane,2022),具有处理大规模社交网络的优势。所提出的模型基于两个阶段:采样阶段和选择阶段。此类工作的特殊性是考虑基于社会行为的信息动态。在不超过原网络30%的样本的情况下,MR-DSIN可以达到覆盖80%网络用户的影响力传播。 PIANO (Li, Xu et al., 2023) 最近被提出来利用深度学习技术来解决 IM 问题。 PIANO 结合了机器学习技术来对网络进行采样。然后,提出了一个学习阶段来嵌入网络并近似影响力传播。因此,根据学习到的参数选择有影响力的节点。对于网络嵌入,作者使用了 Structure2Vec 方法。

3.2.2. Graph coarsening-based models

减少给定网络大小的另一个研究方向是多级方法或图粗化。粗化的目的是通过将初始网络逐级转换为更小的网络来创建更小的图。换句话说,对于给定的图 G,创建了一系列尺寸递减的图(Jaouadi & Ben Romdhane,2022)。在第 i + 1 层,子图 Gi+1 是基于前一层 i 获得的粗化图 Gi 构建的。

在影响力最大化的背景下,Purohit 等人。 (2014)设计了一种收缩方法,其中每对节点被合并,同时最小化第一个特征值的变化。事实证明,这种方法可以创建一个简化的网络,并保持原始网络的扩散特性。 MaxInf(Ohsaka et al., 2017)也有相同的合约节点想法。基于社区检测步骤,出现在同一社区中的节点被认为是相互可达的。第二步,将每个社区视为单个节点来对图进行加权。 Group-IM(基于组的影响力最大化)(Li & Liu,2019)是一项建议选择折叠节点组的工作。基于节点邻近度,作者提出了一种新的扩散模型。然后,创建节点组。具有大扩散邻近度的顶点被折叠。然后使用创建的组的大小和边界节点来计算影响力传播。最后,基于贪婪算法识别种子集(Goyal et al., 2011)。

4. Influence maximization in dynamic networks

一些工作试图解决静态网络中的 IM 问题。然而,社交网络是动态的,它们的拓扑和/或信息内容可能随着时间而改变。动态网络存在两种形式。网络中的顶点和链接可以随着时间的推移而演变,在这里我们讨论结构动力学。在网络中,用户的兴趣或社交互动等信息可能会发生变化,这种形式与信息动态有关(Jaouadi & Ben Romdhane,2022)。本节专门讨论动态网络中影响力最大化的现有模型。考虑了动态、结构/信息的本质。

4.1. Structure dynamics

动态结构网络被设计为其中节点和/或边可以随时间添加或删除的网络。正如所见图5,

图5.动态网络中探测扩散影响的原理。

网络随时间的演变从技术上设计了一种有效的探测策略。然而,它可以提供影响扩散的误差界限,因为两个种子节点(n3 和 n6)之间的链接可能会随着时间的推移而改变。 UBI(Upper Bound Interchange Greety)(Song et al., 2017)旨在应对结构变化。基于InterchangeHeuristic措施,UBI提出实施节点替换以提高影响力。换句话说,在时间戳 t 处选择种子集是基于在前一时间戳 t − 1 处选择的种子并进行节点替换。此类工作的优点是随着时间的推移跟踪有影响力的节点,以便选择即使在网络发展时也能保持最大影响力的种子。 Tong 等人开发了独立级联模型 (DIC) 的动态版本。 (2017)捕捉现实世界社交网络的动态。在这项工作中,作者定义了一种用于检测有影响力节点的自适应策略。他们提出了一种称为 H-Greedy 的措施,可以减少贪婪算法产生的蒙特卡罗模拟。在每次迭代中,自适应策略尝试在进入扩散过程之前检查候选节点。然后,基于动态扩散模型,对爬山模型进行改进,选择有影响力的节点。提出了一种增量方法 IncInf(Liu et al., 2017)来在考虑过去数据的同时检测有影响力的节点。结构的变化是基于群落结构拓扑的演化。此外,选择高度节点来分析影响力传播演化。基于节点定位,设计了一种有效的方法来分析高度节点之间的影响传播变化。 Wang、Cuomo 等人开发了一个有效的模型。 (2019)利用动态网络中影响节点的本地检测。该模型的主要思想是在本地更新节点的影响力指标,而不是量化全局所有节点的影响力。通过添加和删除顶点和/或链接创建了一系列动态网络演化。然后,作者结合了度中心性和杰卡德相似度这两个指标来计算动态网络中的影响力。可以基于本地信息为每个节点计算两个选择的度量。 Smani 和 Megalooikonomou (2022) 提出了三种在动态社交网络中最大化影响力的算法。包括图的拓扑特征,设计了 MATI 现有模型的开发版本,其中作者利用了结构动力学。然后,使用 k 核分解技术开发了同一模型的第二个变体。最后一个算法使用 k-truss 分解解决了 IM 问题。洛特夫等人。 (2022)开发了一种基于遗传算法的影响力最大化模型。在他们的工作中,在考虑社交网络结构变化的同时选择战略节点和边缘。采用遗传算法控制IC模型的扩散过程并选择影响因素。同样,Li、Hu 等人将遗传算法与 ABM 模型混合使用,称为基于个体的建模。 (2023)提出了一种分布式模型,该模型具有跟踪基于代理的社交网络演化的优势。后者将动态网络建模为快照,其中以分布式方式估计影响力。在杨等人。 (2023),作者通过边缘添加策略说明了动态网络,并提出了一种称为动态边缘添加的 IM 模型。为了最大化影响力,所提出的模型首先生成一个新的采样图。然后,使用 IMM 模型在新图中估计影响力。最后,为了捕捉动态,最后一步被设计为添加边,以基于网络中种子节点和其他节点之间的最短路径来捕捉网络结构演化。

4.2. Information dynamics

上一节专门讨论结构动力学模型。然而,动态网络包含结构和信息变化(Jaouadi & Ben Romdhane,2018)。为了考虑信息内容,Min 等人。 (2020)结合三个因素,提出了时间敏感影响最大化模型T SIM。、

个人离线或在线的状态被视为第一因素。为了区分这种状态,作者基于特定时间的推文历史记录,并且只有在线用户可以参与影响力传播过程。第二个因素是基于用户最喜欢的主题的想法。事实上,考虑单一主题来衡量影响力是不够的。最后一个因素是用户交互对扩散信息的延迟。实际上,用户的反应和信息的传播之间可能存在延迟。基于以上三个因素,提出了一种动态版本的IC扩散模型,称为TTDP(基于主题的时间敏感动态传播)。最后,开发了两种算法来利用局部和全局影响。 Wang、Fan 等人使用了另一个信息概念。 (2017)定义影响概率,即社会行为(例如"评论"、"转发"等)。最近的社交行为用于基于考虑最近行为的滑动窗口模型来计算局部影响力。 Sivaganesan (2021) 提出了一个并行框架,在解决 IM 问题时考虑社会行为。提出了一种结合用户兴趣和交互行为的新措施来最大化影响力。 CPU 架构用于对并行方面进行建模。事实上,所提出的框架考虑了网络的结构和信息内容。

动态网络中影响最大化问题的研究非常有趣,也是一项具有挑战性的任务。在 Hafiane 等人的评论中。 (2020),作者对时间网络中 IM 的计算成本进行了分析。因此,随着可用时间信息粒度的增加,从静态模型切换到动态模型会增加模型的复杂性。

上面已经讨论了解决传统 IM 问题的现有模型。所有提到的模型都集中于单个节点影响传播。然而,基于组的影响力最大化是最近的一个方向,其中在扩散模型的每次迭代中指定一组激活的节点。与经典 IM 问题不同,在扩散模型下,我们尝试指定单个节点来传播影响,GIM(群组 IM)问题的目的是最大化激活群组的预期数量。因此,一个人的决定很容易受到多数人意见的影响,大多数工作或决定都是由群体完成的(Azaouzi et al., 2021)。例如,这可以在政治运动中清楚地看到。当大多数人支持某个政客时,可以最大限度地影响其他人支持该政客,从而比单个人更有效。阿扎乌兹等人。 (2021) 提出了 GIM 问题的表述。他们试图应对这一新趋势,并在这个方向上展示了一些作品。 GIN(有影响力的节点组)(Aghaee & Kianian,2020)模型指定了具有更多连接的不同节点组,为了减少搜索空间,从每个组中选择一些特定节点。在最近的一项工作中(Huang et al., 2022)开发了 RIS 模型的改进版本来解决 GIM 问题。

本节要讨论的第二个趋势是多重社交网络中的 IM 问题。传统的 IM 问题是在单个社交网络上研究的。然而,一个有影响力的节点必然拥有许多社交网络。例如,一个人在 Twitter 上读了一本书并认为它很重要,可以在 Facebook 社交网络上分享他的观点。一些作品(Hosni et al., 2019;Meng et al., 2022;Wang, Liu et al., 2019)研究了在多重社交网络中检测有影响力用户的问题。

6. Comparison

在这篇调查论文中,概述了社交网络中影响力最大化的现有模型的详细回顾。表 2 突出显示了不同模型的技术比较。这些模型在效率以及处理当前真实社交网络时存在一些缺点。例如在脸书上社交网络,分布式网络设计的结构信息无法完成。而且,这样的结构能够定期改变。另一个缺点是大多数模型都是参数化的并且忽略了社交网络的动态方面。

7. Challenges and future directions

影响力最大化问题已被广泛分析,并开发了多种模型来从多个角度解决 IM 问题。在研究这个课题时,我们面临着许多挑战。事实上,尽管在社交网络分析这一领域已经做了很多研究,但许多方面都被忽视了。在本文中,必须考虑 IM 问题的一些挑战和未来方向。

7.1. Challenges

在研究影响力最大化问题时,我们证明了一些问题尚未被研究者涵盖。

多重社交网络:一个人可能拥有许多社交网络。它属于许多社交媒体。例如,TikTok 上的活跃人士可以在 Facebook 或 Instagram 社交网络上传播她/他的视频。然而,现有模型适用于特定的社交网络。

• 分布式社交网络:社交网络是分布式的,因此该网络可以连续流的形式提供,而不是一次性以完整的形式提供。因此,只有有关网络的"部分"信息可用。因此,IM问题应该自适应地解决。

• 有影响力的节点跟踪:社交网络发展迅速。社交网络拓扑的快速变化;例如,"朋友"/"不朋友"动作立即发生,从而动态改变节点的"权限",例如重要的连接变化可能会影响节点的"权限";或者一些有影响力的人可能会离开社交网络,将"权威"留给其他人。这一挑战被称为有影响力的节点跟踪,因此预测节点在短期或长期范围内的影响力的变化是一项具有挑战性的任务。不幸的是,大多数现有方法无法处理这些特征,并且假设静态网络或中等大小的网络作为一个整体可用于所考虑的算法。

• 隐私保护:在影响力最大化的同时保护用户的个人信息非常重要(Zhang et al., 2022)。事实上,用户不再轻易对传播的内容产生信心,即使他们受到该内容的影响。

7.2. Future directions

我们在本节中提出了未来工作中应考虑的一些研究方向。

• 并行模型:在某些情况下,由于网络的分布、规模巨大或分散控制,无法访问整个网络。为了解决这个问题,使用并行模型。根据所使用的分布范式,分布有两种形式:数据分布和控制分布。数据分布允许访问多个数据段进行计算。至于控制权的分配,它允许算法在多个节点上并行执行(例如多线程的情况),我们可以谈论并行模型。大多数现有方法试图以迭代方式检测有影响力的节点。可扩展性问题可以通过开发并行和分布式模型来解决。

• 基于组的影响力最大化:GIM(组IM)问题的目的是最大化激活节点组的预期数量,这与经典IM 问题不同,在经典IM 问题中,在扩散模型下选择单个节点来传播影响力。因此,一个人的决定很容易受到大多数人意见的影响,并且大多数工作或决定都是由群体完成的(Azaouzi et al.,2021)。例如,这可以在政治运动中清楚地看到。当大多数人支持某个政客时,可以最大限度地影响其他人支持该政客,从而比单个人更有效。

• 基于语义和结构的模型:现有模型考虑社交网络的拓扑或语义。然而,实际上,在现代社交网络中,描述用户之间关系的结构和链接语义都可以随着时间的推移而改变。在未来的工作中应该考虑这种混合方法。

• 基于机器学习的模型:现有的调查工作提到了用于解决 IM 问题的传统技术。然而,机器学习技术在包括社交网络分析在内的多个领域获得了极大的关注。例如,图神经网络是大多数机器学习工作中用来处理图和解决 IM 问题的强大工具(Li,Gao 等,2023)。事实上,在未来的工作中应该考虑机器学习和基于深度强化学习的模型的变体,并进行更详尽的分析。

8. Conclusion

在本文中,我们概述了影响力最大化问题模型。根据社交网络的状态对现有模型进行了回顾和分类:静态网络和动态网络。提出了这两种情况的详细分类。对于静态网络,区分了五种类型的模型:基于贪婪算法的模型、基于中心性度量的模型、基于社区结构的模型、基于机器学习的模型和混合模型。对于动态网络,结构和信息动态模型都进行了审查。本文证明了一些研究工作已经研究了 IM 问题。本文概述了此类现有模型的优点和缺点。最后,解决了一些挑战和未来的方向。

相关推荐
西岸行者6 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意6 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码6 天前
嵌入式学习路线
学习
毛小茛6 天前
计算机系统概论——校验码
学习
babe小鑫6 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms6 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下6 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。6 天前
2026.2.25监控学习
学习
im_AMBER6 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode
CodeJourney_J6 天前
从“Hello World“ 开始 C++
c语言·c++·学习