网络效应与大型语言模型辩论中的协议漂移

摘要

大语言模型展现出前所未有的模拟类人社会行为的能力，使其成为模拟复杂社会系统的有效工具。然而，这些模拟在多大程度上能够可靠地捕捉关键的社会机制，尤其是在涉及少数群体的高度不平衡情境下，目前尚不明确。

本文采用具有可控同质性和类别规模的网络生成模型，研究大语言模型智能体在多轮辩论中的集体行为。我们发现，大语言模型智能体表现出的收敛与极化模式对网络结构和相对群体规模高度敏感。此外，我们的发现揭示了一种特定的方向性倾向，我们称之为"共识漂移"，即智能体更倾向于向意见尺度上的特定位置移动。总体而言，我们的发现强调，在将大语言模型群体视为人类群体的行为代理之前，有必要将结构效应与模型固有偏见区分开来。

关键词：大语言模型意见动力学同质性社会模拟

引言

大语言模型的引入彻底改变了自然语言处理领域，提升了语言模型解决文本相关任务和生成高度类人文本的能力。这些模型在广泛的自然语言处理任务中展现出卓越的能力，标志着通用人工智能模型开发的转型以及向通用人工智能迈进的进展。除了技术能力之外，大语言模型还展现出前所未有的模拟人类社会行为的能力。在正确提示下，大语言模型能够模仿具有特定人口统计学和心理特征的用户角色、职业、政治立场以及一般的人类行为，使其成为研究其在复杂模拟社会中潜在行为的有力工具。随着这些模型在各种应用中的日益普及，理解它们的集体行为变得至关重要。

一个关键问题是，大语言模型是否能够自发地展现出作为其训练过程中涌现特性的类人社会行为，而非通过显式的行为编程实现。例如，大语言模型已经展现出模拟心理理论的能力，这可能使主观行为建模和对模糊自然语言指令的理解成为可能。对此存在大量争论，研究提供了相互矛盾的证据。然而，即使是模拟的心理理论也可能帮助大语言模型与其他智能体进行更自然的互动。

这些集体行为虽然有助于更好地理解大语言模型和人类行为，但可能会将先前未知的偏见引入决策过程，或加剧训练数据中嵌入的社会偏见，对人类与大语言模型的互动产生潜在未知的影响。尽管大量文献聚焦于定义非结构化的智能体互动，例如关于气候变化或转基因食品等争议性话题的讨论，但对更结构化的智能体群体的研究关注较少。当我们与他人互动时，会形成社会联系，这些联系可以建模为图中的边，个体作为节点。人类社会建立在不成文的社会规则之上，例如同质性，即"物以类聚，人以群分"。人们倾向于被那些被认为与自己相似的人所吸引，从而加强彼此之间的联系，同时回避那些被认为差异过大的人。这种行为会产生各种后果：它可能放大社会分裂，强化群体之间的界限，并最终导致人口分化为同质化的集群。

为什么这些问题如此重要？至少有两个原因使得这些问题需要被解决。通过观察大语言模型智能体如何响应同质性和类别不平衡等拓扑因素，可以刻画其集体行为中涌现的潜在倾向。理解这些动态对于在高风险或决策关键的情境中可靠地解释其输出至关重要。其次，由于大语言模型越来越多地被用于基于智能体的人类社会系统模拟，评估其互动在多大程度上能够准确反映真实的人类行为至关重要。许多近期的研究将大语言模型定位为人类行为的代理，尤其是在心理学等语言至关重要的领域。然而，这种使用方式假设了一定程度的行为真实性，而这种真实性在更严格的审视下可能并不成立。如果大语言模型群体系统性地偏离已知的人类意见形成模式------例如收敛过快、压制分歧、或对群体规模表现出过度的敏感性------这就对其作为模拟人类集体行为工具的有效性提出了质疑。因此，理解大语言模型在何时以及如何接近或偏离类人动态，对于方法论的有效性和伦理使用都至关重要。