Molecular Psychiatry｜将言语模式与情感性及精神病性障碍中的脑结构联系起来：一种整合性的自然语言处理方法

本研究将自发言语的自然语言处理（NLP）指标与结构像与弥散成像结合，在跨诊断样本中揭示语言紊乱与脑结构之间稳定的对应关系。研究识别出句法复杂性、词汇多样性与流利性、狭窄主题聚焦三类语言维度，并显示它们分别关联形式思维障碍的关键维度以及右后岛叶灰质体积与额颞白质通路的微结构差异。与传统临床量表评分相比，这些计算语言学维度对"语言-脑耦合"异常呈现出更强、更广的结构关联，提示自动化言语分析可作为更敏感、可扩展的语言表型工具。该结果支持以维度化、跨诊断方式刻画严重精神障碍的语言功能障碍，并为可规模化的机制研究与风险评估提供了新的测量路径。

摘要

语言紊乱是严重精神疾病的核心特征，但传统临床评估往往依赖主观判断，可能忽略细微的言语异常。本研究采用自然语言处理（natural language processing, NLP）对跨诊断样本的自发言语进行客观分析，样本包括情感性障碍个体（n = 119 重度抑郁障碍（Major Depressive Disorder, MDD），n = 27 双相障碍（Bipolar Disorder, BD））和精神病性障碍个体（n = 37 分裂情感性障碍（Schizoaffective Disorder, SZA），n = 11 精神分裂症（Schizophrenia, SZ）），以及健康对照（n = 178）。参与者在主题统觉测验（Thematic Apperception Test, TAT）的四幅图片诱发下提供了约 12 分钟的言语材料，这些材料被转录后用于语义与句法特征分析。探索性因子分析识别出三个潜在语言维度：（1）句法复杂性，（2）词汇多样性与流利性，以及（3）狭窄主题聚焦。这些维度与形式思维障碍（formal thought disorder, FTD）的临床评分以及通过结构性磁共振成像（magnetic resonance imaging, MRI）与弥散加权 MRI 获得的神经解剖学指标呈现差异性关联。值得注意的是，句法复杂性与词汇多样性与额颞白质束中分数各向异性（fractional anisotropy, FA）降低相关，而狭窄主题聚焦与右侧后部岛叶灰质体积减少相关。重要的是，在控制诊断、用药状态与言语智商后，这些关联仍然存在。上述发现表明，基于 NLP 的言语指标可作为精神科疾病中语言功能障碍的敏感指示器，为阐明脑-行为关系并推进精神病理学模型提供一种可扩展的方法。

引言

精神障碍中的语言紊乱跨越不同诊断类别而出现，包括重度抑郁障碍（Major Depressive Disorder, MDD）和双相障碍（Bipolar Disorder, BD）等情感性障碍，以及精神分裂症（Schizophrenia, SZ）和分裂情感性障碍（Schizoaffective Disorder, SZA）等精神病性障碍。这些紊乱表现为思维过程紊乱、言语不连贯，以及语言产生与理解困难，显著损害交流与社会功能。除临床表现之外，语言紊乱还会导致社会隔离、生活质量下降以及功能结局受损。例如，SZ 中的形式思维障碍（formal thought disorder, FTD）与心理生活质量降低相关，这凸显了为提升患者福祉而处理认知-语言缺陷的重要性。同样，即使在临床缓解后，精神分裂谱系障碍（schizophrenia-spectrum disorders, SSD）或 BD 个体仍常出现社会功能受损，这提示需要识别阻碍心理社会复原的机制。此外，FTD 以及言语与语言异常的重要性还体现在其对 SSD 发病的预测作用，以及其与 BD 和 MDD 更严重的临床病程和更高复发风险相关，提示其具有预后意义与跨诊断相关性。

多项研究强调了总体而言 FTD、以及更具体的言语与语言异常的跨诊断特性。值得注意的是，Stein 等人与 Tang 等人提出了 FTD 的三个核心跨诊断维度（即紊乱、空洞、不连贯），并在 MDD、BD 与 SSD 中得到验证。此外，Stein 等人显示，这些跨诊断 FTD 维度与灰质体积（gray matter volume, GMV）与白质分数各向异性（fractional anisotropy, FA）的改变相关，并与全脑结构连接性降低相关。除此之外，通过模型驱动的聚类分析方法，还识别出跨情感性与精神病性障碍的四种不同 FTD 亚型。最小 FTD、贫乏、抑制与重度 FTD 亚型在总体精神病理、神经认知领域测验表现以及 GMV 与脑沟深度模式方面存在差异。有意思的是，临床诊断在这些亚型之间呈分布状态，且阳性与阴性 FTD 可同时出现。

尽管诸如思维与语言障碍量表（Thought and Language Disorder scale, TALD）与思维、语言与交流评定量表（Scale for the Assessment of Thought, Language, and Communication, TLC），以及诸如阳性症状评定量表（Scale for the Assessment of Positive Symptoms, SAPS）与阴性症状评定量表（Scale for the Assessment of Negative Symptoms, SANS）等一般评定量表，对于精神病理学的 FTD 评估具有效用，但这些工具依赖临床判断，可能对细微的语言异常缺乏敏感性。其主观性与可扩展性受限凸显了对更客观方法的需求。近年来，自然语言处理（Natural Language Processing, NLP）的进展提供了可扩展、数据驱动的工具，用于在词汇、句法与语义维度上量化语言紊乱。借助这些方法，研究者已识别出诸如语义连贯性降低、句法复杂性下降以及语篇衔接受损等模式，这些模式在精神病性障碍中尤为突出，但也存在于情感性障碍之中。例如，句子复杂性降低与嵌套从句更少与 SSD 的症状严重程度相关。此外，Schneider 等人表明，SZ 与 MDD 均存在句法缺陷的重叠模式。进一步地，语篇衔接受损与不恰当的会话交换已在多种精神障碍中被记录。例如，SSD 个体往往使用更少的因果连接词（如"因为"），反映出碎片化且意义较弱的交流。同样，在 MDD 与 BD 中，诸如词汇多样性、情感性语言使用以及负性情绪语调等语言特征与症状严重程度相关。通过揭示语言紊乱的共享特征与障碍特异性特征，计算方法为理解语言谱系与精神病理之间的相互作用提供了新的见解。

神经生物学层面对语言紊乱的研究为理解其机制基础提供了关键信息。尤其是，形式思维障碍（formal thought disorder, FTD）已被证实与脑结构和脑功能的改变相关。SSD 的关键脑区包括额叶皮层与颞叶皮层，这些区域对语言加工至关重要。连接这些区域的白质束发生紊乱也常被认为与 SSD 相关的语言功能障碍有关，这些障碍通常通过临床评定量表进行评估，包括钩状束（uncinate fasciculus, UF）、丘脑前放射（anterior thalamic radiation, ATR）以及上纵束（superior longitudinal fasciculus, SLF）。此外，额下枕束（inferior fronto-occipital fasciculus, IFOF）也被认为与精神病性障碍中的语言相关异常有关。Surbeck 等人报告左侧 IFOF 的微结构改变与 SSD 的语义加工缺陷相关，而 Maderthaner 等人发现其完整性与精神病性障碍中 FTD 的维度化测量显著相关。相较之下，关于基于 NLP 得到的指标与脑结构及脑功能之间关系的研究仍然较少，且现有证据几乎全部来自 SZ。例如，AlonsoSánchez 等人发现，首发 SZ 患者言语中的更高语义相似性与额下回及腹侧前颞叶更强的抑制性连接相关。De Boer 等人表明，词汇多样性与句法复杂性的降低与 SLF 和 IFOF 完整性下降相关。此外，Palaniyappan 等人使用自动化的言语图指标，将言语紊乱与功能连接改变及皮层脑回化模式联系起来。

除 SZ 之外，近期的跨诊断研究提示，FTD 相关的神经改变跨越诊断边界，在情感性与精神病性障碍之间存在共享的紊乱。例如，Stein 等人在包含 MDD、BD 与 SSD 的大型样本中发现，FTD 的"紊乱"维度与左侧枕中回和角回的灰质体积（gray matter volume, GMV）呈负相关，并与右侧后部扣带束以及下纵束（inferior longitudinal fascicle, ILF）的分数各向异性（fractional anisotropy, FA）呈正相关。相较之下，"空洞"维度与左侧海马和丘脑的 GMV 降低相关，而"不连贯"与双侧 ATR 的白质完整性下降相关，且相反地，与右侧扣带束海马段 FA 增加相关。在这些发现基础上，Stein 等人进一步采用先进的基于网络的统计分析，以阐明支撑 FTD 的白质连接模式。他们发现，"紊乱"与"空洞"两个维度均与广泛的白质连接失调相关。重要的是，这些关联在 MDD、BD 与 SSD 中均表现稳健，从而强调了 FTD 的跨诊断特性。与之相呼应，Schneider 等人显示，句法加工缺陷在 SZ 与 MDD 患者中与重叠的、语言相关白质束的结构异常有关，其中尤以上纵束（SLF）最为突出。总体而言，这些相互收敛的证据支持以维度框架理解 FTD，提示精神障碍中的语言紊乱可能反映灰质体积与白质网络连接性的广泛改变，而非仅可归因于孤立的区域性缺陷。

尽管取得了这些进展，但覆盖多个诊断类别的研究仍然稀缺，尤其缺少在跨诊断层面将先进 NLP 技术与多模态影像手段整合的研究。这种整合不足限制了识别跨诊断语言功能障碍共享神经机制的进展。为弥补这一缺口，本研究在一个大型跨诊断样本中，将基于 NLP 得到的语言维度与结构像及弥散加权影像相结合。通过将计算得到的言语特征映射到脑结构上，这一多模态设计旨在加深我们对语言、精神病理与脑结构之间复杂相互作用的理解。据我们所知，这是迄今为止规模最大的跨诊断研究，将基于 NLP 的言语特征与脑结构联系起来。

材料与方法

参与者

数据纳入了 372 名个体，其中包括被诊断为 MDD（n = 119）、BD（n = 27）或 SSD（n = 48）的受试者，以及健康个体对照组（healthy controls, HC，n = 178）。参与者来自 FOR2107 队列的一个子样本，诊断通过《精神障碍诊断与统计手册》第四版修订本（DSM-IV-TR）第一轴障碍结构化临床访谈（Structured Clinical Interview for DSM-IV-TR Axis I Disorders, SCID-I）进行确认。患者的纳入标准为：MDD、BD、SZA 或 SZ 的主要诊断；年龄 18 至 69 岁；德语流利。HC 无精神障碍病史或相关治疗史。所有参与者的排除标准包括：严重躯体疾病（如神经系统疾病、头部外伤史或意识丧失史）、言语智商 < 80、急性物质依赖，以及当前服用苯二氮䓬类药物。

临床评估

精神病理评估作为半结构化访谈的一部分，包含一套全面的标准化临床评定量表。访谈由受过训练的心理学家或研究人员实施。评定者间一致性通过组内相关系数（intraclass correlation coefficients, ICC）评估，结果显示各量表具有良好一致性（ICC = 0.86）。抑郁与焦虑症状分别采用汉密尔顿抑郁量表（Hamilton Depression Rating Scale, HAM-D）与汉密尔顿焦虑量表（Hamilton Anxiety Rating Scale, HAM-A）评估，躁狂症状采用杨氏躁狂量表（Young Mania Rating Scale, YMRS）评估。总体功能通过总体功能评定量表（Global Assessment of Functioning, GAF）量化。

与 FTD 相关的症状采用 SANS 与 SAPS 的条目进行评估。SANS 测量阴性 FTD 症状，如言语贫乏、内容贫乏、思维阻断以及反应潜伏期延长；SAPS 则聚焦于阳性 FTD 症状，包括思维脱轨、离题、不连贯、不合逻辑、迂回、言语压力、注意分散以及押韵联想。由于 FTD 条目存在缺失数据，排除了 8 名参与者，因此 FTD 相关分析的最终样本为 364 名个体。临床与人口学特征的完整概览见表 1。

表 1. 言语因子分析样本的描述性统计（N = 372）

言语特征

参与者观看主题统觉测验（Thematic Apperception Test, TAT）的四幅图片。TAT 是一种投射性心理测验工具，旨在诱发叙事，以揭示潜在的认知与情绪过程。要求每位参与者就每幅图片讲述一个故事，描述图片中可能正在发生的事情，每幅图片讲述 3 分钟，这一时长延长了既往研究中常用的 1 分钟讲述时长。言语被录音，并由受过训练的语言学人员使用 f4transkript 软件（https:// www.audiotranskription.de/f4transkript）逐字转录，转录者对诊断信息设盲。随后应用自然语言处理（Natural Language Processing, NLP）技术，从多个领域提取一系列语言学特征，包括 4 个词汇特征（类符-形符比、文本词汇多样性指标、代词与人称代词比例）、1 个形态学特征（形态复杂性）、4 个句法特征（句法复杂性、从属比、可读性与连接词比例）、5 个语义特征（语义连贯性、句子水平连贯性、词语水平连贯性、语义密度、基于图的衔接性）、3 个不流利指标（填充停顿比例、重复比例与语法错误），以及 1 个情感分析指标（负性情感概率）。特征提取使用 Python（version 3.11）完成。提取特征汇总见表 2。关于 NLP 特征如何提取的细节见补充材料（eMethod 1）。特征选择依据其在精神病学研究中的相关性，以及其捕捉与精神障碍相关的细微语言受损的潜力。

神经影像采集与预处理

结构性磁共振成像（magnetic resonance imaging, MRI）与弥散张量成像（diffusion tensor imaging, DTI）数据使用 3 特斯拉（3 T）MRI 扫描仪（Tim Trio，Siemens，德国埃尔兰根）在马尔堡大学采集。MRI 数据采集遵循一套广泛的质量保证流程，以确保数据的可靠性与一致性。由于缺失数据、图像质量差、运动伪影或扫描不完整而排除部分参与者后，最终样本在灰质体积（gray matter volume, GMV）分析中包含 303 名参与者，在 DTI 分析中包含 247 名参与者。神经影像数据采集与预处理的详细描述见补充材料（eMethod 2）。这两个神经影像样本的描述性统计见补充材料（Supplementary Table 1 和 2）。

统计分析

涉及因子模型与双变量相关分析的统计分析在 R（version 4.4.1）中进行。针对 NLP 的言语特征开展探索性因子分析（exploratory factor analysis, EFA），以识别潜在的潜变量因子。使用 Kaiser-Meyer-Olkin（KMO）检验与 Bartlett 球形度检验评估数据对因子分析的适用性。采用 Promax 旋转以允许因子间相关，因为预期潜在因子彼此相关而非正交。因子数量基于多项经验性标准确定。通过自助法（bootstrapping）评估稳健性，并通过整合多种提取方法计算平均因子解。对 SAPS 与 SANS 的 FTD 条目实施验证性因子分析（confirmatory factor analysis, CFA），以（重新）验证既往研究中识别出的因子结构。EFA 与 CFA 的完整方法细节及判据见补充材料（eMethod 3）。为检验 NLP 言语因子与 FTD 因子之间的关系，计算相关系数，并使用 Bonferroni 校正以调整多重比较。

采用基于体素的形态学分析（voxel-based morphometry, VBM）探索基于 NLP 得到的言语因子与 GMV 的关联。针对每个 NLP 因子建立广义线性模型，纳入年龄、性别、颅内总容量（total intracranial volume, TIV）与诊断组别作为协变量。VBM 分析使用 SPM12 与 CAT12 完成，绝对阈值遮罩值设为 0.1。在先以未校正阈值 p < 0.001 以及最小簇大小 k > 10 个体素为初始阈值的基础上，结果在簇水平的家族错误率（family-wise error, FWE）校正阈值 p < 0.05 时判定为显著。簇标注使用 Dartel 空间的 Neuromorphometrics 图谱完成。对于 DTI 分析，使用 FMRIB 软件库（FMRIB Software Library, FSL）的纤维束骨架空间统计（tract-based spatial statistics, TBSS）方法。采用无阈值簇增强（threshold-free cluster enhancement, TFCE）与 10,000 次置换的非参数置换检验。显著性阈值设定为 p < 0.05（FWE 校正）。TBSS 分析的协变量与 GMV 分析一致。此外，还对径向弥散度（radial diffusivity, RD）、平均弥散度（mean diffusivity, MD）与轴向弥散度（axial diffusivity, AD）进行了探索性分析。

表 2. 提取的、基于自然语言处理（Natural Language Processing, NLP）得到的言语特征说明

为检验基于 NLP 得到的言语因子与脑结构之间的显著关联是否受到言语智商与用药状态的影响，进行了调节分析。之所以选择这些调节变量，是因为它们在精神病学研究与言语领域中具有明确相关性。言语智商作为认知功能的关键指标，与语言能力与脑结构均相关，可能对观察到的关系构成混杂。用药状态被纳入是因为药物对脑形态具有已知影响，例如灰质与白质完整性的改变。因此，在 CAT12 与 FSL 中提取了显著簇的特征值。

结果

言语数据

参与者的言语产出介于 200 至 2496 个词之间。平均而言，言语产出为 1139 个词（SD = 370）与 86 句话（SD = 29）。各参与者的句子平均长度介于 6 至 36 个词之间。

表 3. 基于自助法的、探索性 NLP 言语因子的因子载荷

NLP 言语特征的探索性因子分析

为识别跨诊断的潜在 NLP 维度，对 NLP 言语特征实施探索性因子分析（exploratory factor analysis, EFA）。Kaiser-Meyer-Olkin（KMO）指标为 0.82，提示抽样充分；Bartlett 球形度检验显著，χ2(136) = 1245.67，p < 0.001，确认相关矩阵适合进行因子分析。在开展 EFA 之前，我们明确检视了所有基于 NLP 得到的言语特征之间的相互相关，并计算了方差膨胀因子（variance inflation factors, VIFs）。不存在任意成对相关超过 r = 0.80 的情况，且所有 VIF 值均低于 5，提示不存在问题性多重共线性。相关矩阵的热图见补充材料（Supplementary Fig. 1）。EFA 得到三因子解，可解释 NLP 言语特征总方差的 65%。为确保因子结构的稳健性，采用 n = 5000 的自助法（bootstrapping）。三因子解的旋转后自助载荷见表 3，因子名称根据载荷最高的特征进行命名。此外，我们通过整合使用不同提取方法进行的多次 EFA 结果，得到一个平均的三因子解。该平均解验证了因子结构在不同方法学下的稳定性与可靠性（见 Supplementary Fig. 2）。各组言语因子得分的分布见补充材料（Supplementary Fig. 3）。

因子 1：句法复杂性。因子 1 的特征是对表征句法复杂性与语篇衔接的指标呈现较高的正载荷。句法复杂性（λ1=0.743）与从属比（λ1=0.805）是该因子的显著贡献者。句法复杂性衡量句法解析树的平均深度，用以指示句子结构的复杂程度；从属比反映从属从句占总从句的比例，用以突出复杂语法结构的使用。连接词比例在该因子上也呈现较高载荷（λ1=0.801），表明更频繁地使用连接词（如连词与话语标记）来连接从句与句子，从而增强言语的衔接性。由 FastText Coherence 特征衡量的语义连贯性（λ1=0.695）进一步强调了语篇中概念之间逻辑且有意义的联系。相反，可读性指数（Readability Index）在该因子上呈现强负载荷（λ1=−0.796）。由于可读性指数这一指标中分数越低代表文本越复杂，因此其负载荷与将该因子解释为更高句法复杂性一致。

因子 2：词汇多样性与流利性。因子 2 由表征词汇多样性与言语流利性的特征所定义，这些特征在该因子上呈现较高的正载荷。基于图的衔接性（Graph-based cohesion）在该因子上的载荷最高（λ2 = 0.863），提示更复杂的词语联结网络对该维度贡献显著。形态复杂性（λ2 = 0.544）、类符-形符比（Type-Token Ratio, TTR；λ2 = 0.511）以及文本词汇多样性指标（Measure of Textual Lexical Diversity, MTLD；λ2 = 0.511）均呈正载荷，强调言语中词汇的丰富性与形态变化的多样性。填充停顿比例在该因子上呈现强负载荷（λ2 = −0.815），表明该因子得分越高，越少出现诸如"um"或"ah"等不流利现象。语法错误比例同样呈负载荷（λ2 = −0.435），提示语法更准确的言语对该因子有贡献。

因子 3：狭窄主题聚焦。因子 3 由代词比例（λ3 = 0.769）、语义密度（λ3 = 0.573）、词语水平连贯性（λ3 = 0.570）与句子水平连贯性（λ3 = 0.457）的较高正载荷所定义。代词比例衡量代词占总词元的比例，反映相较于特定名词更倾向于使用更一般性的指代，从而使语言更为简化。语义密度计算内容词向量之间两两余弦相似度的平均值，表示词语之间更高的相似性，这一特征体现为使用更常见或更缺乏变化的词汇。词语水平与句子水平连贯性的正载荷提示，尽管语言被简化，言语仍保持连贯性，这可能源于使用更直接的语言结构。这些特征表明，因子 3 捕捉了较为狭窄或聚焦的叙事风格特征，其特点是更频繁使用代词以及语义相关的内容。

NLP 言语因子与 FTD 因子之间的关系

为探讨语言特征与 FTD 症状之间的关系，我们计算了 NLP 言语因子与由临床评估得到的 FTD 因子之间的双变量相关（有关 FTD 条目 CFA 的细节见补充材料 eResults 2）。结果进行了多重比较校正（Bonferroni 校正后的 p 值）。因子 1（句法复杂性）与 FTD 紊乱（r = −0.23，p = 0.002）、FTD 空洞（r = −0.21，p = 0.003）以及 FTD 不连贯（r = −0.18，p = 0.014）均呈负相关。因子 2（词汇多样性与流利性）与 FTD 空洞呈负相关（r = −0.18，p = 0.016）。因子 3（狭窄主题聚焦）与各 FTD 因子之间未显示显著相关。各组 NLP 因子与 FTD 因子的分布见补充材料（Supplementary Table 4）。

图 1 基于 NLP 的言语因子"狭窄主题聚焦"与灰质体积（gray matter volume, GMV）之间的负相关（N = 303）。显著簇在簇水平的家族错误率（family-wise error, FWE）校正阈值 p < 0.05 下显示（初始簇定义阈值 p < 0.001）。

NLP 言语因子与 FTD 维度之间的关联在精神病性障碍组中最强，尤其体现在句法复杂性与 FTD 的紊乱、空洞与不连贯维度之间的负相关，以及词汇多样性与流利性与 FTD 空洞维度之间的负相关（Supplementary Fig. 4）。作为敏感性分析，我们在相关分析中排除精神病性障碍参与者（n = 48），以评估 NLP 言语因子与 FTD 维度之间的关联是否由该亚组驱动。结果模式整体保持不变，句法复杂性仍与 FTD 紊乱、空洞与不连贯维度呈显著负相关（Supplementary Analysis S1）。

表 4. 基于 NLP 得到的言语因子与分数各向异性（fractional anisotropy, FA）之间的负相关

NLP 言语因子与灰质体积之间的关联

在 FWE 校正后，未观察到因子 1（句法复杂性）或因子 2（词汇多样性与流利性）与灰质体积（gray matter volume, GMV）之间的显著相关。因子 3（狭窄主题聚焦）与 GMV 呈负相关，主要位于右侧后部岛叶，并额外涉及右侧极平面（planum polare）与右侧壳核（见图 1；k = 705，x/y/z = 36.0/--15.0/−1.5，p = 0.046 FWE；ß = −0.16，95% CI $-0.24, -0.09$ ），且在控制诊断组别后仍成立。该关联未受到言语智商或用药的显著调节（Supplementary Table 5）。

NLP 言语因子与弥散张量成像之间的关联

基于 NLP 得到的言语因子与分数各向异性（fractional anisotropy, FA）在关键白质束中呈显著关联，提示语言特征与白质完整性之间存在联系（见表 4 与图 2）。显示显著关联的共享白质束包括左侧丘脑前放射（anterior thalamic radiation, ATR）与左侧钩状束（uncinate fasciculus, UF），其中 FA 与句法复杂性及词汇多样性与流利性均呈负相关（图 2A 与 2B）。此外，词汇多样性与流利性还在右侧下纵束（inferior longitudinal fascicle, ILF）与上纵束（superior longitudinal fasciculus, SLF）中显示额外的负相关（图 2B）。在左侧皮质脊髓束（corticospinal tract, CST）中，FA 与狭窄主题聚焦呈显著负相关（图 2C）。进一步的调节分析显示，无论言语智商还是用药指标均未显著调节这些关联（见 Supplementary Table 6）。关于轴向弥散度（axial diffusivity, AD）、径向弥散度（radial diffusivity, RD）与平均弥散度（mean diffusivity, MD）的进一步关联也在额颞通路中呈现相似模式，详见 Supplementary Table 7。

为将观察到的 NLP-DTI 关联置于更具体的背景之中，我们与 Stein 等人报告的效应量进行了比较分析。Stein 等人在一个大型跨诊断样本（N = 830）中报告了由 SAPS/SANS 评定的 FTD 维度与 FA 的相关。Stein 等人发现，不连贯与双侧 ATR 的 FA 存在幅度不大的负关联（β = −0.15，左右各为 −0.15），并发现紊乱与右侧 ILF 的 FA 存在边缘性的正关联（β = 0.03）。相较之下，我们基于 NLP 得到的"多样性与流利性"因子在相同通路中显示出更强的 FA 负关联（左侧 ATR：β = −0.35；右侧 ATR：β = −0.33；右侧 ILF：ß = −0.27）。

为进一步评估基于 NLP 的特征相较于临床评定特征的相对敏感性，我们在当前样本（N = 242）中使用由 SAPS 与 SANS 得到的三个 FTD 因子进行了并行的 TBSS 分析。结果显示，紊乱与不连贯均与右侧扣带束海马段的 FA 呈显著负相关（见 Supplementary Table 8）。

讨论

本研究在一个大型样本中探讨了自发言语的基于自然语言处理（Natural Language Processing, NLP）得到的语言特征、形式思维障碍（formal thought disorder, FTD）以及神经解剖结构之间的关联，样本包括情感性障碍或精神病性障碍患者以及健康对照。通过将自动化言语分析与结构像和弥散加权神经影像相整合，本研究为理解语言紊乱的神经相关以及计算语言学测量的办法学优势提供了新的见解。关键发现包括：通过对一组广泛的、基于 NLP 得到的句法与语义特征进行探索性因子分析，识别出三个语言维度，即句法复杂性、词汇多样性与流利性，以及狭窄主题聚焦。识别出的 NLP 维度与 FTD 以及脑结构均相关。其中，句法复杂性与 FTD 的不连贯与空洞维度显著负相关，而词汇多样性与流利性与空洞维度呈特异性的负相关，表明计算语言学特征与临床上具有相关性的思维障碍子领域相对应。神经影像分析显示，狭窄主题聚焦因子与灰质体积（gray matter volume, GMV）降低存在特异性关联，主要位于右侧后部岛叶皮层，提示受限且自我指涉的言语内容具有相应的结构性相关。进一步地，基于 NLP 得到的句法复杂性与词汇多样性与流利性因子与关键语言相关通路中的白质微结构相关。这些关联提示语言紊乱由额颞连接性的破坏所支撑。在对诊断、用药与言语智商进行校正后，结果仍保持稳定，从而支持严重精神疾病中语言功能障碍的维度化与跨诊断模型。

图 2 基于 NLP 得到的言语因子与白质结构之间的负相关。 A、B、C：在 DTI 样本（N = 247）中，NLP 言语因子与分数各向异性（FA）之间的负相关。显著簇以家族错误率（FWE）校正阈值 p < 0.05 展示。

语言因子与形式思维障碍

基于 NLP 得到的句法复杂性因子涵盖语法结构与衔接性语篇，其与三个 FTD 维度（紊乱、空洞与不连贯）均呈负相关，这与既往研究一致，即句法缺陷与精神病性障碍中的思维紊乱相关，也与高风险个体以及 MDD 中的相关发现一致。这些结果表明，句法复杂性的降低反映了语言产生中支撑连贯思维的层级性与整合性环节的崩解，并与临床上"紊乱"与"不连贯"的构念高度一致。我们的结果扩展了既往工作，支持这样一种观点：句法复杂性的降低可能作为思维过程紊乱的跨诊断指示器，从而加深我们对 FTD 的理解，即其作为一种普遍特征影响不同精神健康状况中的语言表达。

NLP 因子词汇多样性与流利性刻画了更丰富的词汇、更大的形态变化，以及更流畅且更少不流利与错误的言语。其与 FTD 空洞因子的负相关提示，词汇受限且言语犹豫的个体更可能经历更严重的思维内容贫乏。从这一意义上说，词汇多样性与流利性得分较低捕捉了临床上作为"空洞"所见的言语贫乏的可量化表现，其特征为观念输出稀少、重复或模糊。这一关系与既往将词汇缺陷与言语贫乏及思维贫乏联系起来的发现一致，并进一步支持其作为精神病性障碍早期指示器以及前驱期认知狭窄的指标的效用。此外，近期研究也将词汇内容的改变与抑郁状态联系起来。本研究强化了词汇变异性作为精神障碍中认知与语言过程之跨诊断指示器的重要性。

NLP 因子狭窄主题聚焦以更频繁的代词使用与更高的语义密度为特征，但其与任何由临床评定得到的 FTD 维度均未呈显著相关。该缺乏关联可能反映狭窄主题聚焦捕捉到一种以重复、自我指涉或主题受限叙事为中心的言语限制形式，这种形式即使叙事变异性降低，仍可能保持局部连贯性与逻辑形式。因此，它可能代表一种不同的语言风格，并未被 SANS 与 SAPS 量表的传统 FTD 评分直接索引，因为这些量表主要评估逻辑与整体连贯性的破坏，而非主题层面的限制。更为细致的 FTD 量表如 TALD 可能会产生不同结果。

我们的发现为日益增长的、支持跨诊断以维度方式研究 FTD 的证据体系提供了补充，强调精神障碍中语言受损的共享性。例如，Stein 等人识别出 FTD 的三个核心维度，即紊乱、空洞与不连贯，并在 MDD、BD 与 SSD 中得到验证。Tang 等人同样确认了相似的结构，从而强化了 FTD 的跨诊断特性。在本研究中，这一因子模型再次得到确认。此外，我们基于 NLP 得到的言语因子也呈现跨诊断模式。因此，我们的发现强调自动化言语分析作为一种工具，用于跨诊断客观评估语言紊乱的价值。值得注意的是，语言紊乱（包括 FTD）不仅在 SSD 中普遍存在，也存在于情感性障碍中，从而进一步支持其作为精神病理的跨诊断特征的作用。

语言紊乱的神经相关

本研究强调一种跨诊断框架，表明语言维度与共享的脑结构相关，并且这种相关独立于诊断、当前用药与言语智商。重要的是，观察到的白质束与基于自然语言处理（Natural Language Processing, NLP）得到的言语特征之间的关联，不仅在解剖学上分布广泛，而且其效应量也大于两类对照指标：其一，Stein 等人样本中的 FTD 评分；其二，当前样本中由 FTD 因子得分得到的结果。这提示计算测量可能比人工评分对语言-脑耦合中细粒度的紊乱更为敏感，这可能反映出现有临床量表以及人工评定者在捕捉语言异常全谱方面的局限。

具体而言，丘脑前放射（anterior thalamic radiation, ATR）中的分数各向异性（fractional anisotropy, FA）与 NLP 言语因子句法复杂性以及词汇多样性与流利性均呈强负相关。ATR 连接丘脑与前额叶皮层，在记忆与语言加工中发挥关键作用，而 ATR 异常已被关联到认知能力缺陷与精神病理。

此外，NLP 言语因子与其他关键白质束中的 FA 也存在显著相关，例如钩状束（uncinate fasciculus, UF）与右侧上纵束（superior longitudinal fasciculus, SLF）。UF 连接颞极与额叶，参与语义加工以及情绪与认知信息的整合；SLF 促进半球间交流，并与语言加工、注意与工作记忆相关。这些发现与既往在精神病性障碍以及情感性障碍中报告的这些区域 FA 改变一致。狭窄主题聚焦与左侧皮质脊髓束（corticospinal tract, CST）中的 FA 呈负相关。尽管 CST 主要是一条运动通路，但其在韵律与构音控制中的已知作用提示，运动通路的完整性也可能影响语言产生。

除了与 FA 的关联之外，基于 NLP 得到的言语因子与轴向弥散度（axial diffusivity, AD）、径向弥散度（radial diffusivity, RD）与平均弥散度（mean diffusivity, MD）在额颞白质束中也呈显著相关。这在方法学上扩展了既往工作，例如 de Boer 等人仅在 SZ 中聚焦于 FA 与 MD。通过采用跨诊断框架并整合多种 DTI 参数，本研究为刻画精神障碍人群中自发言语的白质相关提供了更全面的表征。

除白质发现外，神经影像分析还识别出狭窄主题聚焦与右侧后部岛叶为中心的一个簇中灰质体积（gray matter volume, GMV）降低相关，并额外涉及右侧壳核与右侧极平面（planum polare）。岛叶在语言加工中发挥关键作用。极平面位于颞上回，通常与听觉加工相关，也可能参与语言理解的某些方面。壳核作为基底节背侧纹状体的皮层下成分，参与运动控制，并进一步与言语产生与构音控制的某些方面相关。此外，我们在岛叶与壳核发现的 GMV 改变与既往在精神病性障碍以及情感性障碍中的报告一致。

在方法学上，本研究通过在跨诊断样本中整合最先进的 NLP 技术与神经影像推进了该领域。既往工作依赖人工编码句法，而我们对一组全面的、计算得到的语言学特征实施探索性因子分析，以识别自发言语的潜在维度。作为同类研究中的首项工作，这一方法提供了对语言特征更整体的视角，例如同时捕捉 Schneider 所提出的句法复杂性与多样性两方面，并对不同诊断组之间语言表现差异提供更敏感的评估。既往 SZ 的 NLP 研究已将连贯性与语义相似性与额颞环路中的结构或功能异常联系起来，但这些研究局限于 SZ，且通常聚焦于孤立的语言标记。相较之下，本研究表明：（1）类似的语言-脑关联可跨越不同诊断类别；（2）这些关联可以通过由 NLP 导出的多变量、潜变量言语构念得到更全面的捕捉。

我们的研究结果共同支持一种关于语言紊乱的维度化、跨诊断框架，从而对传统的精神科诊断类别化路径提出挑战。与研究领域标准（Research Domain Criteria, RDoC）框架一致，我们的结果表明，语言受损及其神经相关并不局限于特定诊断，而是反映出精神病性障碍与情感性障碍之间共享的紊乱。关键的是，我们的发现凸显了自动化言语分析相较于传统精神病理评估的附加价值。这些发现与既往证据一致，即自动化言语分析通过客观量化细微的语言紊乱而具有显著优势，而这些紊乱在传统临床评估中可能会被遗漏。

尽管如此，仍需承认若干局限性。第一，我们的分析在德语语境下完成，这引发了跨语言可推广性的问题。尽管某些言语标记，尤其是与语义连贯性相关的指标，可能在不同语言间具有可推广性，但另一些指标，如代词使用或句法复杂性，可能会随语法结构而变化。未来在具有不同形态与句法特征的语言中开展跨语言验证，对于确立其普遍性至关重要。第二，横断面设计使得我们无法得出因果结论。需要纵向研究来确定语言异常是先于、后于，还是与神经解剖学改变共同发展。第三，尽管样本量较大，但不同诊断组之间的不平衡可能影响结果的可推广性，这一局限在一定程度上通过在所有分析中对诊断类别进行统计控制而得到缓解。最后，尽管基于主题统觉测验（Thematic Apperception Test, TAT）的言语诱发具有标准化优势，但其可能无法充分捕捉真实世界语言使用的复杂性。未来研究若纳入更自然的言语范式，例如自由对话或对话式任务，可能提升语言评估的生态效度。

结论

本研究表明，使用自然语言处理（Natural Language Processing, NLP）技术从自发言语中提取的语言特征，与形式思维障碍（formal thought disorder, FTD）症状以及脑结构异常在一个大型跨诊断样本中显著相关。所识别出的 NLP 言语因子，即句法复杂性、词汇多样性与流利性，以及狭窄主题聚焦，为理解精神障碍个体与健康对照的语言受损提供了有价值的见解。本研究的发现尤其强调语言因子与结构性脑异常之间的关联，突出了语言加工能力与神经基础设施之间复杂而精细的关系。通过捕捉细微且具有临床相关性的语言紊乱，自动化方法为更细致地检验语言紊乱提供了一种强有力的工具。这一方法推进了我们对语言与自发言语病理之间复杂相互作用的理解。

参考文献：

Seuffert, S., Mülfarth, R. R., Teutenberg, L., Thomas-Odenthal, F., Usemann, P., Alexander, N., Jamalabadi, H., Nenadić, I., Straube, B., Hahn, T., Dannlowski, U., Kircher, T., & Stein, F. (2025). Linking speech patterns to brain structure in affective and psychotic disorders: An integrative natural language processing approach. Molecular Psychiatry.