血浆蛋白质组学在46,165名成人中识别出与发作抑郁相关的蛋白质和通路

论文总结

1、识别出与抑郁症发病相关的血浆蛋白质特征,明确了其与抑郁症发病风险的关联模式(正向/负向关联)

2、通过MetaSpace和Cytoscape (v3.10.2)解析相关蛋白质涉及的生物学通路(GO,KEGG),通过孟德尔随机化分析确立蛋白质和抑郁症的因果关系,筛选潜在治疗靶点;

3、探究抑郁症相关蛋白质和大脑结构、遗传风险、压力事件(应激事件)的潜在关联。研究发现的结果在讨论部分与现有的研究结果相一致,抑郁症和免疫、炎症通路相关。且识别出的蛋白与前人研究也一致。

摘要

抑郁发作前的蛋白质组变化为其发展和潜在干预提供了宝贵见解。我们利用46,165名英国生物样本库参与者和2920种基线分析的血浆蛋白数据,进行了中位随访14.5年的纵向分析,探讨血浆蛋白与发作抑郁症之间的关系。随后,利用线性回归评估抑郁相关蛋白与大脑结构、遗传因素及压力相关事件之间的关联。我们的分析鉴定出157种与偶发抑郁相关的蛋白(P <1.71*10-5),包括与GAST、PLAUR、LRRN1、BCAN和ITGA11等蛋白的新关联。值得注意的是,GDF15表达水平较高(P = 6.18*10-26)和PLAUR(P = 2.88*10-14)与抑郁风险增加相关,而较高的LRRN1(P = 4.28*10-11)和ITGA11(P = 3.68*10-9)水平则与风险降低相关。157种蛋白质的失调与与抑郁相关的脑区相关,包括海马体和中颞回。此外,这些蛋白质变化与压力相关事件(包括自残事件、成人和儿童创伤)高度相关。生物途径富集分析强调了免疫反应的关键作用。EGFR和TNF成为蛋白质-蛋白质相互作用网络中的关键蛋白。BTN3A2新与偶发抑郁相关(P = 4.35*10-10),通过孟德尔随机化分析确认为因果因素。总之,我们的研究识别出与抑郁症发作相关的蛋白质组特征,凸显了其早期干预和个性化治疗途径的潜力。

引言

抑郁症是一个日益增长的全球问题,患病率超过5%[1],严重损害患者的生活质量和福祉,并带来重大社会负担[2,3]。尽管抑郁症普遍存在,但仍有相当比例的患者对现有治疗存在耐药性[4]。有限的持续缓解成功与我们对其发病机制的不完整理解密切相关[5--8]。解开这些复杂机制对于开发更有效的治疗干预至关重要。鉴于蛋白质是基因表达的最终产物,且对细胞功能至关重要[9],它们为疾病病理生理提供了直接的见解[10]。在抑郁发作前对蛋白质调控异常进行剖析,可以揭示诊断前的过程,揭示其潜在机制,并为量身定制的治疗策略铺平道路[11]。虽然已有多项研究探讨了血浆蛋白与抑郁症的关联[12--16],但其见解常受样本量小或蛋白质组覆盖有限的限制。此外,以往研究的一个重大限制是横断面设计,可以引入反向因果关系[2]。这一知识空白凸显了纵向研究的紧迫需求。此外,鉴于抑郁症源于生物和环境因素的复杂相互作用[5],因此在多样的生物和环境因素中审视这些蛋白质并理解它们相互关联的途径至关重要。英国生物样本库(UKB)凭借其丰富的表型数据,提供了一个有力的框架,用于研究血浆蛋白质组结构如何与抑郁症的发生相关。为识别风险特征、理解潜在发病机制并制定个性化治疗策略,我们进行了大规模蛋白质组学分析,评估46,165名前瞻性UKB参与者中2920名基线血浆蛋白水平与发生抑郁症之间的关联。我们还研究了这些与抑郁症相关的蛋白质与大脑结构、遗传风险和环境因素等多种因素之间的关系,并进一步表征了其生物通路。最后,我们进行孟德尔随机化分析,以建立因果联系并识别潜在的治疗靶点。

方法

UK Biobank

本研究涉及UKB数据[17],并持续随访参与者,整合了多种数据来源,包括定期更新的健康记录、血液采集、影像数据以及各种自我报告问卷。这些数据来自向UKB提供书面知情同意的个人。UKB队列已获得NHS西北国家研究伦理服务处批准(参考编号:16/NW/0274)。

血液蛋白质组学

英国委员会在瑞典Olink分析服务公司采集血液样本进行蛋白质组分析。采用了基于抗体的Olink ExploreTM近距离延伸测定。共测量了2923种不同的蛋白质。严格的质量控制程序已实施,详见之前的研究[18,19]。所有Olink面板的板内及板间变异系数分别低于20%和10%。关于样品选择、加工和质量控制程序的更多细节可参见之前的出版物[18,19]。采用了Olink报告的归一化蛋白表达(NPX)值(补充方法)。在排除缺失率超过60%的样本后,我们的研究共纳入了2920个独特蛋白质(补充方法)。

抑郁症状态评估

抑郁症病例通过结合初级保健数据、住院病历、死亡登记数据和自我报告数据来确定。主要结局为突发性抑郁,定义为国际疾病分类第10版(ICD-10)代码F32和F33。医疗就诊期间记录的诊断日期与英国生物样本库相关联,作为我们分析的发病日期。首次出现的数据(字段130894和130896)被用于确定诊断日期。所有在基线评估或之前被诊断为抑郁的参与者(4472例)均被排除。随访时间从登记日期起至最早出现抑郁症诊断、死亡或审查日期(即2023年10月13日)。所有无抑郁症诊断或死亡记录的参与者均被随访至数据截止日期(2023年10月13日)。退出项目的参与者被排除在研究之外。最后,我们的分析纳入了46,165名在基线前或基线时未被诊断为抑郁症的参与者。总体来看,约5%(2307例)参与者在随访期间发展为抑郁症,终生抑郁患病率为13.4%。鉴于本研究样本基线评估的平均年龄为56.9岁,我们预计随访期间新发抑郁病例的发生率低于基线评估前诊断的抑郁症病例[2]。

协变量度量

本研究基于技术参数、人口统计变量及其他混杂因素进行协变量选择。首先,我们纳入了以往研究中提出的若干技术参数[18,19],包括批次、评估中心、采血与蛋白质测量之间的时间(由每位参与者的平板和面板及蛋白质确定,有助于解决平板效应)、采血季节和禁食时长,以及前20个遗传主成分(PC)。其次,调整了人口统计变量,包括性别、年龄、体重指数(<25、25至<30和30公斤平方米)、族裔背景(白人及其他)、教育水平(分为高中、高中、低中、职业及其他)和社会经济地位(使用汤森贫困指数衡量)。最后,基于对抑郁可能混杂因素的既往了解,还纳入了吸烟状况和酒精状态。

脑区MRI

本研究采用了结构磁共振成像(MRI)数据,补充方法中提供了MRI采集、质量控制和预处理的详细信息。利用FreeSurfer软件估计了包括总GMV、皮层和皮层下GMV在内的全球灰质指标(https://surfer. nmr.mgh.harvard.edu/)。总白质高强度通过T1和T2 FLAIR图像计算。灰质微观结构通过四个脑灰质区域指标测量:表面积、皮层厚度、皮层和皮层下体积。采用了Desikan-Killiany图谱(68个皮层区域)和ASEG图谱(16个皮层下区域)[20]。白质微观结构通过六项白质束指标测量,包括分数各向异性(FA)、细胞内体积分数(ICVF)、各向同性体积分数(ISOVF)、束复杂度(OD)和扩散张量模式(MO)。共使用了27条结合、投射和丘脑通路的白质束[21]

压力相关事件

儿童创伤筛查器(CTS)用于测量儿童创伤,包括情感、身体和性虐待,以及情感和身体忽视(补充方法)。成年期创伤通过UKB心理健康问卷(MHQ)中的五项内容进行评估[22],该问卷评估了情感、身体和性虐待在关系中的表现、关系的亲密程度以及经济安全(补充方法)。自残经历使用了UKB MHQ中的四项题目[22],评估了生活不满、自残意念、自残和自杀(补充方法)。

血浆蛋白与抑郁症的关联

我们采用多变量Cox比例风险回归模型的时间事件发生分析,考察了伴有抑郁发生的蛋白质。模型调整了批次、评估中心、采血与蛋白质测量间隔、采血季节和禁食时长、前20名遗传PC、性别、年龄、身体质量指数、族裔、教育水平、社会经济地位、吸烟状况和酒精状况。多次测试采用了Bonferroni校正方法。在敏感性方面,我们进行了时间到事件分析,分别排除了自报告抑郁症诊断的参与者、基线评估后两年内被诊断为抑郁症的参与者,以及由UKB-PPP联盟选中的个体。我们排除了基线后两年内发展抑郁的参与者,以减少反向因果偏差并理解基线蛋白水平与抑郁发作之间的时间关系。我们还利用推算蛋白数据进行了敏感性分析,结果一致。此外,利用线性回归模型考察了血浆蛋白与抑郁症状(患者健康问卷4(PHQ-4)和患者健康问卷9(PHQ-9)评分)之间的关联,协变量与Cox比例风险模型一致。

蛋白质水平和大脑结构之间的关联

通过线性回归模型在4,948名参与者中,结合蛋白质和脑成像数据,考察了蛋白质与大脑结构的关联。这些参与者在蛋白质组学分析前或进行时均未被诊断为抑郁症(英国生物样本库基线,2006--2010年)。在中位随访期间,其中217名参与者出现了抑郁症。由于脑成像数据是在随访评估期间收集的(自2014年起),这217名参与者很可能在脑影像检查前后发展出抑郁症。在回归模型中,大脑结构作为因变量,蛋白质水平作为独立变量。协变量与事件发生时间分析中保持一致,并加上估计的总颅内容积(TIV;场26521)用于灰质体积分析。

多基因风险分析

基因型数据经过质量控制(补充方法),并用于计算多基因风险评分(PRS)。为确保分析不受样本重叠影响,我们使用了一项针对未纳入UKB个体的大型全基因组关联研究[23]的摘要数据。PRS通过PRSice软件[24]在多个代表性的p值阈值(pT)计算,包括P <0.001(pT_0.001)、P <0.05(pT_0.05)、P <0.1(pT_0.1)、P <0.5(pT_0.5)和P <1(pT_1)。关于PRS计算的更多信息可在补充方法中获得。

蛋白质水平与PRS对抑郁症的关联

为了探讨蛋白质水平的变化是否受抑郁症背后的遗传因素以及环境因素的影响,我们考察了蛋白质与PRS对抑郁症的关联。虽然抑郁PRS涵盖了众多与抑郁症相关基因的综合效应,这些基因代表了其遗传基础,我们的分析则考察了这些遗传因素是否影响蛋白质水平,并随后与抑郁症发生率相关。分析中使用了线性回归模型。除族裔分析外,协变量与事件发生时间分析一致,因为分析是在白人英国人群中进行的。

孟德尔随机化分析

我们进行了双向双样本磁共振分析[27],以探讨某一抑郁相关蛋白是否因果影响抑郁症风险,或反之亦然。我们利用了来自两个独立样本的抑郁症综合统计[23]和蛋白质[18]。GWAS中蛋白质的pQTL定位仅涉及英国生物样本库的欧洲参与者[18]。蛋白质和抑郁症的遗传工具基于与P相关蛋白的SNPs选<5 10 8。选定的SNP以1000 kb的距离和最大LD r²0.01的凝聚过程,利用1000基因组项目中欧洲群体的LD参考面板。采用了斯泰格滤波,排除具有回文特征和中间等位基因频率的SNP。在主要分析中,我们采用了反方差加权(IVW)方法来提供因果估计。为解决孟德尔随机化假设的潜在违背,进行了多种敏感性分析,采用了多种稳健方法,包括MR-Egger法、加权中位数法、简单模法和加权法,以及带随机效应模型的逆方差加权法[28]。所有分析均使用TwoSampleMR [28](v.0.5.5)R软件包完成。埃格截距测试旨在测试多效性[29]。Cochran的Q检验用于评估IVW估计的异质性[30]。计算了F统计量以评估仪器强度。此外,我们还使用MR-多效度残差和离群值(MR-PRESSO)[31]方法进一步检查多效性。

基因表达分析

我们利用GTEx v.8数据库分析了抑郁相关蛋白在多种相关组织中的基因表达[32]。接着,基因和组织类型根据基因表达水平进行层级聚类,这些水平以log2转化量表表示每百万转录本数。通过人脑单细胞RNA测序数据,分析了不同细胞类型的差异基因表达分析[33]。数据通过修拉软件包[34]进行预处理,详见补充方法。随后,我们用Wilcoxon秩和检验比较了特定细胞类型内的表达水平与所有其他细胞类型的综合表达。采用了Bonferroni修正(P < 0.05/30972)。

功能富集分析

我们利用Metascape[35]平台,深入探讨了多样生物通路和数据库中的功能富集。本次分析采用了基因本体(GO)术语[36](包括GO生物过程、GO细胞组分、GO分子功能)和京都基因与基因组百科全书(KEGG)通路[37]。编码2920个蛋白的基因作为分析的背景基因集。收集了P值<0.01、至少3个计数和富集因子>1.5(观察到计数与偶然计数的比值)的术语,并根据成员相似度进行聚类,正如之前一项研究所述[35]。表型富集分析使用小鼠基因组信息学平台(MGI)数据库进行[38]。MGI为探索人类特异数据库中难以获得的生物过程提供了宝贵资源[38],并广泛应用于生物医学研究中,以深入了解抑郁症等人类疾病[39]。我们首先获得了MGI数据库中19,326个带有可用表型注释的基因,其中2406个基因编码了作为背景基因集的2920个测试蛋白。在这些基因中,包含了编码抑郁相关蛋白的157个基因中的138个。每个表型的显著性通过使用费舍尔精确检验来确定,该检验基因集中与该表型相关基因比例与背景基因集中比例的差异。此外,我们还使用了TRRUST数据库[40],该数据库涵盖了转录因子(TF)靶点调控关系的全面集合。该数据库包含涉及800种人类转录因子的8444个TF靶点关系信息。通过利用TRRUST数据库和Metaspace,我们研究了抑制相关蛋白的上游调控因子,以识别出可能调控已识别蛋白表达和活性的转录因子。编码2920个测试蛋白的所有基因都被用作背景基因集。

蛋白质-蛋白质相互作用网络及重要性排名

我们利用Metascape[35]和Cytoscape(v3.10.2)[41]生成并可视化了蛋白质-蛋白质相互作用(PPI)网络。Metascape整合了来自多个来源的数据,包括STRING [42]、BioGrid[43]、OmniPath [44]和InWeb_IM [45]。通过分子复杂物检测(MCODE)算法识别了密集连接的子网络[46]。对于每个MCODE组件,进行了通路和过程富集分析,并选取p值排名前三的术语作为相应组件的功能描述符。

药物能力评估

我们使用GREP(基因组重定位)[47]软件评估了ICD10疾病类别中编码抑郁相关蛋白基因集的富集情况。该分析可识别针对该基因集的潜在药物[47]。使用了DrugBank [48]和治疗靶点数据库[49]。编码2920个测试蛋白的所有基因作为背景基因集。

结果

参与者特征

我们的分析中,我们纳入了46,165名无抑郁症史或基线抑郁病史的参与者,平均年龄为56.90岁(标准差(SD)8.22),其中53%为女性,94%为白人(见图1)。在蛋白质组学评估抽血后14.5年的中位随访期(四分位区间(IQR)13.7--15.3,区间:0--16.5,平均:13.8),有2307名参与者被诊断为抑郁症。表S1(在线)总结了按抑郁发作状态分类的参与者基线特征。在2923种可用蛋白质中,有2920种符合质量控制标准(补充方法和表S2在线)并被使用

蛋白质水平与发作抑郁的关联

图2。与发作抑郁症的蛋白质组广泛关联。(a)显示蛋白质水平与发生性压低之间的关系的火山图。采用Cox比例风险回归模型,调整了批次、评估中心、采血与蛋白质测量间隔时间、采血季节和禁食时长、前20名PC、性别、年龄、体质指数、族裔、教育水平、社会经济因素、吸烟和酒精状况。横轴表示风险比(HR)。纵轴表示每个关联的P值lg。P值低于蛋白质组整体显著性阈值的蛋白质(由Bonferroni校正确定,P<0.05/2920)显示在黑色水平线上方。经过多项检测,这些蛋白质被认为与抑郁发生显著相关。紫色点表示与偶发抑郁正相关的蛋白质,绿色点表示与负相关的蛋白质。(b) 火山图,展示了使用线性回归模型进行重复分析的结果,调整了批次、评估中心、采血与蛋白质测量间隔、采血季节和禁食时长、前20名PC、性别、年龄、身体质量指数、族裔、教育水平、社会经济水平、吸烟状况和酒精状况。x轴表示回归系数。纵轴表示每个协会的P值lg值。红点代表正向联想,蓝点代表负面联想。(c)本研究中抑郁相关蛋白(蓝点)与上一项研究(黄点)效果的比较。(d)抑郁相关蛋白与基线PHQ-4评分的关联。采用线性回归模型,调整与Cox比例风险模型相同的协变量。黑色横线表示显著关联的阈值。(e)抑郁相关蛋白与随访时PHQ-9评分的关联。(f) 抑郁相关蛋白的HRs在基线(x轴)和带调整(y轴)均绘制了PHQ-4评分的无调整图。

我们利用Cox比例风险模型,考察了未诊断为抑郁症的参与者血浆蛋白水平与发生抑郁症之间的关联。分析包括对英国基础(UKB)、人口统计变量及其他潜在混杂因素的技术参数调整(方法)。根据Bonferroni校正(P = 0.05/2920 = 1.71 10 5),我们识别出157种与偶发抑郁显著相关的蛋白质(见图2a;表S3在线)。在与抑郁相关的蛋白质中,143种蛋白呈正相关,14种蛋白与抑郁风险呈负相关。值得注意的是,生长/分化因子15(GDF15)(HR = 1.43 [1.34--1.52],P = 6.18 10 26)、胃泌素(GAST)(HR = 1.13 [1.09--1.16],P = 1.51 10 14)、尿激酶蛋白酶原激活表面受体(PLAUR)(HR = 1.68 [1.47--1.92],P = 2.88 10 14)、肿瘤坏死因子受体超家族成员10B(TNFRSF10B)(HR = 1.25 [1.18--1.32],P = 3.50 10 14)、V-set及含免疫球蛋白结构域蛋白2(VSIG2)(HR = 1.29 [1.21--1.39], P = 8.23 10 14),以及神经丝轻多肽(NEFL)(HR = 1.36 [1.25--1.47],P = 2.48 10 13)关联最显著。此外,富含亮氨酸的重复神经元蛋白1(LRRN1)(HR = 0.72 [0.66--0.80],P = 4.28 10 11)、整合素α-11(ITGA11)(HR = 0.72 [0.65--0.81],P = 3.68 10 9)、短英核心蛋白(BCAN)(HR = 0.78 [0.70.87],P = 5.70 10 6)水平显著呈负相关,表明发病抑郁风险较低。在敏感性分析中,我们进一步系统地排除了在主要分析中未被诊断为抑郁症的参与者,基于具体标准:自我报告抑郁症诊断者、基线评估后两年内被诊断为抑郁症者,以及由UKB-PPP联盟选定的个体。在排除这些后,所有157个已识别的蛋白质在错误发现率(FDR)修正后均保持统计显著性(见表S4-6在线)。为验证分析,我们纳入了最初被排除的4472名参与者基线前诊断的抑郁症主要分析。随后,我们比较了这些既有抑郁症诊断的参与者与43,858名在英国随访期间未被诊断为抑郁症的对照组之间的蛋白质水平。值得注意的是,所有157种蛋白质的方向一致,其中148种蛋白(94%)在FDR校正后仍保持统计显著性(见图2b;表S7在线)。此外,157种蛋白中的120种也在之前的研究中进行了研究[50],其中14种与抑郁症有显著关联(P <2.7 10 8;图2c;表S8在线)。这些发现凸显了所鉴定蛋白质与抑郁症之间的显著联系。此外,157个抑郁相关蛋白中有156个在Bonferroni修正后与基线PHQ-4分数呈横断面关联(P <0.05/2920)(图2d;表S9在线)。在157种抑郁相关蛋白中,有138种与FDR矫正后的随访PHQ-9评分相关(见图2e;表S10在线)。此外,经过基础PHQ-4评分的额外调整后,所有157种蛋白在FDR校正后仍与发生的抑郁显著相关(见图2f;表S11在线)。结果表明,这些血浆蛋白与抑郁症的关联比基线还要长。

图1。学习概述。上部面板:本研究使用的数据,包括抑郁症诊断和自我报告问卷信息、基因型数据、蛋白质组学数据、脑MRI数据及压力相关事件。中上左面板:利用Cox比例风险回归模型识别与发发性抑郁相关的重要蛋白。中上右面板:研究考察了血浆蛋白与抑郁相关表型(包括脑结构、遗传和环境因素)之间的关联。中下组:通过多种分析,如组织/细胞表达分析、通路富集分析、表型富集分析和上调蛋白富集分析,探讨了已识别蛋白的生物功能,以深入了解其在抑郁症中的潜在作用和分子机制。底部面板:使用孟德尔随机化分析探讨血浆蛋白与抑郁症之间的潜在因果关系,旨在揭示潜在的抑郁症药物靶点。此外,利用DrugBank的数据进行了药物定位分析,探索具有治疗抑郁潜力的现有药物。

抑郁相关蛋白与大脑结构的关联

为阐明血浆蛋白与发作抑郁症之间的关系,我们利用4948名在基线评估前或基线评估时未被诊断为抑郁症的参与者,结合蛋白质和影像数据,考察了已知抑郁相关蛋白与大脑结构之间的关联(方法)。经过FDR修正后,157个蛋白质中有50个与至少一项全球大脑结构测量中的一项相关。总体而言,较高的抑郁风险蛋白水平与总灰质体积(GMV)、皮层及皮层下GMV以及白质高强度体积(WMH)增加显著相关(图3a;表S12在线)。值得注意的是,GDF15、PLAUR、TFF3、TGFA、CSF1和AREG水平较高与较低的GMV密切相关,而NEFL水平较高则与白细胞生长体积增加的关联最为显著。此外,BCAN水平更高,ITGA11和ITGAV也与灰质体积增加相关。我们进一步考察了脑结构的区域性指标,包括灰质(体积、表面积、皮层厚度)与白质指标(包括各向异性分数、平均扩散率MD)之间的关联(方法)。经过FDR校正后,我们识别出64种蛋白质与至少一个脑区域指标有显著关联。值得注意的是,在这些关联中,BCAN、ITGA11、GDF15、LRRN1、NEFL和AREG与至少八个脑结构有显著关联。此外,我们还观察到148项脑区域指标与至少一种血浆蛋白之间存在显著关联。在68个脑皮层区域的体积中,涉及抑郁的几个脑区,包括左中颞回、左侧眼窝额回和右前方中额回,与三种以上蛋白质相关(图3b;表S13在线)。对于16个大脑皮层下区域,如双侧丘脑、双侧海马和双侧侧脑室等区域与三种以上蛋白质相关(图3b;表S13在线)。在27条主要通道中,包括双侧前丘脑放射、双侧后丘脑放射、双侧下纵束、左上方纵束、双侧上丘脑放射、左皮质脊髓束和带皮带回部分,至少与三种蛋白质相关(图3c;表S13在线)。这些发现凸显了抑郁相关蛋白与多个脑区之间复杂的关系,这些区域与抑郁症的发病机制有关

图3。抑郁相关蛋白与大脑结构的关联。(a)抑郁相关蛋白与多种脑容量指标之间的关联,包括脑总灰质体积(TGV)、皮层灰质体积(CGV)、皮层下灰质体积(SGV)和白质高强度(WMH)体积。采用线性回归模型,并获得了标准化系数。统计显著性基于双侧P值确定。颜色条表示关联方向,红色表示正相关(与抑郁相关蛋白水平较高,体积更大),蓝色表示负相关(相关性较低,体积较大)。FDR修正后的重要关联用星号表示,Bonferroni修正后的重要关联用"''符号表示。(b,c)抑郁相关蛋白与不同区域大脑结构指标(如灰质体积和白质指数)之间的关联。采用了线性回归模型。统计显著性基于双侧P值,显著关联通过FDR <0.05确定。颜色条表示显著关联蛋白的数量,颜色越深表示关联较多。

抑郁相关蛋白与多基因抑郁症风险评分的关联

为了探讨蛋白质水平与抑郁发生之间的关系是否由遗传因素驱动,我们考察了蛋白质水平与抑郁症遗传风险之间的关联。 我们通过一项大规模全基因组研究,在五个具有代表性的P值阈值(pT_0.001、pT_0.05、pT_0.1、pT_0.5、pT_1)生成了抑郁症的多基因风险评分(PRS)[23]。尽管157种抑郁相关蛋白中有23种与PRS名义上有显著关联,但这些关联均未经多次修正(图4a;表S14在线)。此外,在比较极低(底25%)和高(顶25%)PRS参与者的蛋白质水平时,157种蛋白质中无一显示出显著差异(在线表S15)。然而,157种抑郁相关蛋白中有50种与重度抑郁症呈显著遗传相关(见图4b;表S16在线)。这些结果表明,是蛋白质特异性的遗传结构而非整体遗传风险,促成了血浆蛋白与抑郁症的关联。

抑郁相关蛋白与压力相关事件的关联

为了进一步探讨抑郁症与蛋白质之间的关联是否由环境因素驱动,我们考察了蛋白质与压力相关事件(包括童年和成人虐待)以及自残经历之间的关联。所有14条(5项与童年虐待相关,5项与成人虐待相关,4项与自残经历相关)在FDR纠正后均与至少一种蛋白质相关。此外,8种蛋白质(PIGR、CXADR、TFF3、YAP1、ASGR1、FABP4、GAST、TNFRSF12A)与至少5个项目有显著关联(见图4b;表S17在线)。值得注意的是,较高的GDF15与生活不满(标准化b = 0.029,P = 1.61 10 3)和自残意念相关(标准化b = 0.033,P = 3.47 10 4)。此外,压力相关事件与抑郁状态之间的关联由157种抑郁相关蛋白显著介导(见图S1;表S18在线)。这些结果表明关联血浆与抑郁症之间,蛋白质与抑郁症可能源于压力相关事件。

图4。抑郁相关蛋白与遗传和环境因素的关联。(a)抑郁相关蛋白与重度抑郁症遗传风险在五个P阈值以下的关联。采用线性回归模型,调整了批次、评估中心、采血与蛋白质测量间隔时间、采血季节和空腹时间、前20名PC、性别、年龄、体重指数、教育水平、社会经济水平、吸烟和酒精状况。统计显著性基于双侧P值确定,显著关联则采用FDR < 0.05。名义上显著的关联用星号(*)标记。(b) 森林图显示了血浆蛋白与重度抑郁障碍之间的遗传相关估计值(rg)。横轴表示遗传相关估计,纵轴表示蛋白质。误差条表示rg为1.96*se±。(c--e) 使用线性回归模型研究了抑郁相关蛋白与环境因素(包括童年和成人创伤事件及自残经历)的关联。陪变量包括批次、评估中心、采血与蛋白质测量间隔时间、采血季节和禁食时长、前20名遗传主成分、性别、年龄、体重指数、族裔、教育水平、社会经济水平、吸烟和酒精状况。通过双侧P值确定统计显著性。使用FDR确定了显著关联<0.05。横轴表示应力相关事件的不同项目。纵轴表示每个关联的P值lg。圆点表示正相关,表示蛋白质水平较高与项目得分较高相关,而三角形点表示负相关,暗示蛋白质水平较高与项目得分较低相关。编码抑郁相关蛋白基因的表达

编码抑郁相关蛋白的基因表达模式通过基因型-组织表达(GTEx)v8数据库[32](见图S2)可视化。值得注意的是,GDF15、PLAUR和VSIG2在大脑中的表达水平低于血液及其他组织中观察到的高水平。相反,NEFL和BCAN主要在大脑中表达。此外,TNFRSF10B在血液、大脑及其他组织中表现出广泛的表达。随后,我们利用孟德尔随机化(MR)分析(补充方法)研究了基因表达水平与蛋白质表达水平的关联。在157种抑郁相关蛋白中,有57种同时具有eQTL和pQTL数据,其中36种在基因表达水平与血浆蛋白水平之间表现出显著的因果关系(见S19表在线)。此外,我们还利用人脑单细胞RNA测序数据检测了这些基因在特定细胞类型中是否表现出富集[33]。Bonferroni校正后,我们识别出157个基因中有75个显示富集于特定细胞类型(见图S3和表S20在线)。我们发现TNFRSF10B和PLAUR在小胶质细胞、内皮细胞、成纤维细胞和壁细胞中均表现出浓集表达。此外,NCS1和CNTN5在兴奋性和抑制性神经元中均高度表达。值得注意的是,LRRN1此前与女性共情能力显著相关且纹状体中表达较高[51],在兴奋性神经元中也表达较高。

抑郁症相关蛋白的生物学功能

图5。抑郁相关蛋白的功能分析。(a)生物途径富集分析结果。x轴表示每个项P值的lg。仅显示在FDR修正后仍具统计显著性的术语。纵轴列出不同的术语,每个术语的来源通过不同的颜色区分。缩写:GO:BP,基因本体:生物过程术语;GO:MF,基因本体论:分子功能术语;KEGG,《京都基因与基因组通路百科全书》。(b)表型富集分析结果。横轴表示每个项P值的lg值。纵轴表示MGI数据库中不同的表型。P值是通过费舍尔精确检验获得的。显示FDR修正后显著富集的表型。(c) 转录因子富集分析结果。显示了FDR校正后显著富集的转录因子。每个富集转录因子靶点都与相关基因相连。颜色条代表蛋白质与偶发抑郁之间的关联,深色表示显著性较高。(d)抑制相关蛋白的蛋白质-蛋白质相互作用网络。节点代表蛋白质,较深的色调表示等级较高。连接节点的边缘宽度代表两个连接蛋白之间的得分值,线条越粗表示相互作用证据越强越大。

我们进行了生物途径富集分析[35],以表征编码抑郁相关蛋白基因的生物学特性。值得注意的是,157个与抑制相关的蛋白富含免疫相关类别,包括调控白细胞激活、调控MAPK级联反应以及调控参与免疫反应的细胞因子生成(见图5a;表S21在线)。我们还利用小鼠基因组信息学平台研究了抑郁相关蛋白的表型富集[38]。显著富集的表型最高是免疫系统表型(精确度 = 1.44 10 5),其次是肿瘤表型(精确度 = 1.19 10 3)和稳态/代谢表型(精确度 = 2.44 10 3)(图5b;表S22在线)。这些发现表明免疫系统可能在抑郁症的发展中起关键作用。接下来,我们利用TRRUST数据库[40]探索抑郁相关蛋白的潜在转录因子靶点。我们鉴定出九种转录因子,这些因子与调控编码抑郁相关蛋白的基因的生物效应有关(见图5c;在线表S23),强调了免疫和炎症反应在抑郁症中的重要性。主要转录因子包括信号导引和转录激活因子3(STAT3)、转录因子AP-2α(TFAP2A)、转录因子Sp1(SP1)、核因子(NF)-jB亚基1(NFKB1)和NF-jB p65亚基(RELA)。NF-jB是先天免疫功能的核心,已被确认是慢性压力暴露引发的抑郁样行为的关键介导剂[52]。STAT3信号通路在免疫反应中至关重要,小胶质STAT3通过神经元巨噬细胞刺激集落因子介导的突触活动调控抑郁相关行为[53]。此外,调节GDF15和TNF的CCAAT/增强子结合蛋白b(CEBPB)显示出显著性,并被发现能抑制脑源性神经营养因子(BDNF)的表达,从而促进高脂饮食诱发的抑郁[54]。随后,我们进行了蛋白质-蛋白质相互作用(PPI)分析,阐明157种抑郁相关蛋白之间的复杂联系,并识别了该网络中的关键蛋白。利用Metascape[35],我们生成了一个PPI网络,包含118个节点(即蛋白质)和260个边缘(即相互作用)(见图5d;表S24在线)。值得注意的是,EFGR出现率最高,其次是肿瘤坏死因子(TNF),这与TNF在抑郁症发病机制中的重要作用相符[55]。此外,分子复合物检测(MCODE)算法[46]识别出三个密集连接的网络组成部分,突出了细胞因子活性、溶酶体和ECM-受体相互作用等生物途径的影响(见S4;表S25在线)。此外,为了基于真实蛋白质数据推断蛋白质调控,我们采用了随机森林方法(补充方法)进行网络推断分析。共识别出15,543个相关性,其中25个超过0.1的阈值。值得注意的是,CHGA与GAST之间的影响最显著(r = 0.272),其次是GAST对CHGA的影响(r = 0.239)(在线表S26)。结果进一步支持了基于实际蛋白质数据的抑郁相关蛋白之间的相互关联。

药物靶点影响

我们通过双向双样本磁共振分析(方法)调查抑郁相关蛋白与重度抑郁障碍之间是否有因果关系。在Bonferroni校正后,我们观察到采用逆方差加权(IVW)方法,丁酸细胞血综合素亚家族3成员A2(BTN3A2)水平较高与重度抑郁障碍之间存在因果关系(表S27在线)。BTN3A2的敏感性分析结果在方向和强度上均与IVW方法的估计一致。然而,未发现重度抑郁障碍与任何蛋白质之间存在显著因果关系(在线表S28)。随后,我们研究了编码抑郁相关蛋白的基因是否在当前获批治疗药物类别中被富集用于药物靶点。共有39个基因被确立为治疗123种疾病的药物靶点,包括恶性肿瘤、炎症性多关节病、高血压疾病、退行性疾病和系统性萎缩(表S29在线)。值得注意的是,TNF、EGFR、IL10、ITGAV、TGFB1、IGF2R和VEGFA均与20多种疾病相关。用于丘状鳞状疾病、非传染性肠炎和结肠炎,以及主要影响间质的呼吸系统疾病的药物靶点显示出名义富集,尽管未通过多项检测校正(在线表S29)。

讨论

尽管抑郁症的病理机制普遍存在,其复杂性仍要求全面理解以开发有效治疗方法。利用英国生物样本库队列的数据,我们鉴定出157种与抑郁症相关的蛋白质。值得注意的是,近一半的蛋白质与灰质结构和白质束有显著关联。蛋白质改变可能是将压力相关事件与抑郁状态联系起来的潜在介质。免疫反应通路在我们的分析中尤为重要,与当代将免疫与情绪障碍联系起来的理论相符。总之,我们的发现弥合了关键知识空白,突出蛋白质组标志物在预测和缓解抑郁发生方面的作用,从而为更个性化和有效的治疗策略铺平道路。我们的研究鉴定出一组与抑郁发作相关的蛋白质,包括GDF15、IL1RN、IL18R1、PLAUR、CCL3、CD4以及TNF超家族,这些蛋白以其在免疫反应和炎症过程中的作用而闻名。 慢性炎症与抑郁症的病理生理有关,免疫信号的改变可能促成抑郁症状。值得注意的是,GDF15与二元抑郁和定量抑郁特征均表现出显著关联,这与先前研究强调其与抑郁症状的关联一致[56]。例如,一项针对3577岁人群的横断面研究发现GDF15变异与抑郁评分之间存在显著相关[57]。此外,一项纵向研究观察到GDF15在老年受试者抑郁症状中的作用(>70岁)[58]。我们的研究聚焦于相对年轻的队列,同样显示GDF15水平与MDD之间存在纵向关系,表明GDF15水平的早期升高可能表明衰老过程。GDF15被认为与抑郁症相关的过程有关,包括炎症调节、氧化应激和细胞稳态[59--61]。此外,GDF15已知与体重调节相关[58],这是抑郁症的诊断标准,进一步证实了其与重度抑郁症的相关性。另一项关注蛋白PLAUR在调整基线抑郁评分前后效果最大。PLAUR参与了纤溶酶原激活系统,并被认为与神经炎症过程有关[62],表明其与抑郁症的发作有关。在我们的研究中,TNF是PPI网络中具有高重要性评分的关键潜在药物靶点,表明其在调控抑郁相关分子通路和生物过程中具有重要意义。先前研究表明,TNF的失调与神经炎症和突触可塑性改变有关,这些都是抑郁症的常见特征[63,64]。此外,针对TNF的干预措施在改善抑郁症状方面显示出希望[65,66]。炎症信号通路(如NFKB通路)的激活是由TNF-α与其受体相互作用触发的。在我们的研究中,两种转录因子NFKB1和RELA被发现与蛋白质组学相关,这与事件发生时间分析的结果一致。此外,BTN3A2被鉴定为一种具有潜在治疗意义的蛋白。在功能上,该基因在调节适应性免疫系统中的T细胞反应和监督细胞因子生成方面起到了关键作用[67,68]。MR分析显示,BTN3A2失调与抑郁症发生之间存在假定的因果关系。基于事件发生时间分析、功能阐明和药物靶点评估的见解,我们建议新兴的抑郁症治疗干预可能从聚焦抗炎策略中受益。

我们研究中大多数蛋白质观察到的正相关性值得注意,尤其是在之前血浆蛋白质组学分析中正相关蛋白比例较低的情况下[69,70]。蛋白质检测方法的差异,如本研究中使用Olink蛋白质组学,与其他研究中使用质谱或其他测序技术,可能影响检测到的蛋白质类型及其与疾病的关联。其他UKB蛋白研究中也观察到β值分布偏斜,尽管其生物学机制可能有所不同。例如,一项使用UKB Olink蛋白质组学的最新研究发现多种痴呆中正相关蛋白比例较高[71],另一项研究发现多发性硬化症中负相关蛋白比例较高[72]。此外,由于抑郁症患者常表现出升高的炎症标志物[73],大多数与抑郁症相关的正相关蛋白可能与其参与炎症过程有关,支持了升高的慢性炎症标志物在抑郁发病机制中起关键作用的理论[74]。尽管我们的研究显示上调蛋白比例较高,验证分析证实了95%的发现,从而强化了其稳健性。事件发生时间分析还鉴定出多种与神经保护激活和神经退行性相关的蛋白质,包括NEFL、LRRN1、LGALS9、PRSS8、GFRA1和CXCL9。NEFL是一种与神经丝相关的蛋白[75],其水平升高时与神经退行性疾病和轴突损伤有关[76]。此外,IGFBP4与抑郁症的关联与其调控胰岛素样生长因子的作用一致[77],这与神经发育和神经保护有关。抑郁症患者中这些蛋白的失调表明神经保护机制和神经完整性可能受到干扰。功能富集分析支持了这些发现,揭示了与细胞群体增殖、死亡受体活性和单核细胞分化的负向调控相关。LRRN1被鉴定为突触组装的正向调控因子。先前研究已将LRRN1突变与精神疾病联系起来,主要与认知同理心相关,而非情感障碍[51]。我们的研究进一步阐明了该蛋白可能降低抑郁症风险。为阐明不同脑区内的蛋白质组学景观,我们分析了抑郁相关蛋白与脑结构之间的关系。通过关注基线蛋白水平,我们旨在评估其与后续脑成像结果的潜在纵向关联,从而最大限度地减少同时发生抑郁状态的影响。在我们的研究中,抑郁风险蛋白水平升高与总GMV、皮层和皮层下GMV降低以及WMH增加相关。值得注意的是,NEFL与WMH呈明显正相关,而GDF15和PLAUR与GMV呈负相关。相反,BCAN与总WMH呈正相关。这些发现表明蛋白质组失调可能增加抑郁风险,并为蛋白质组变化与抑郁病理之间的机制提供了见解。此外,针对大脑区域的分析显示,与多个已知的抑郁相关脑区存在关联,包括前扣带皮层、丘脑、外侧室、中颞回、岛叶、海马体、眶额回和额上区[78--83]。只有少数早期研究探讨了抑郁症患者大脑区域的大规模蛋白质组学谱[84]。两项先前研究在抑郁患者中研究额叶皮层[85]和前扣带皮层[86]报告了蛋白质组表达模式的变化。我们的发现凸显了评估蛋白质组学的解剖分布,可能为抑郁病理个体间变异提供关键见解。理解抑郁症的多因素性质------它源于遗传倾向和环境诱因的结合------是一大挑战[87]。尽管我们观察到23种抑郁相关蛋白与多基因风险评分之间存在名义关联,但经过多重比较校正后,均无显著关联。这些发现表明,抑郁症的整体遗传风险可能对血浆蛋白与抑郁症之间的关联产生关键影响。相反,其他因素,尤其是环境因素,可能对这些观察到的关联产生更显著的影响。值得注意的是,我们的研究显示,在调整假发现率后,大多数与压力相关的事件至少与两种蛋白质相关。这些发现强调了在理解抑郁症背后生物机制时,考虑环境因素,尤其是与压力相关的因素的重要性。先前研究表明,经历童年或成年创伤的个体通常表现出较高水平的炎症生物标志物,包括反应蛋白、IL-6和TNF-a[88--92]。此前综述还指出,社会压力和不良经历会激活免疫系统,导致与抑郁症状相关的行为改变[93]。这种对逆境的反应对于涉及身体危险或伤害的生存至关重要[93]。此外,不同蛋白质与不同的压力相关事件被发现。因此,童年或成年期创伤、蛋白质组变化及随后抑郁症之间的关联复杂,且因个体差异和具体情况而变化。基于生物标志物定义更窄的患者群体可能改善特定亚组的治疗响应率[66]。孟德尔随机化分析显示BTN3A2蛋白水平与抑郁症之间存在因果关系。BTN3A2在适应性免疫系统中的T细胞反应中起着关键作用,其在自身免疫疾病[94]和多种癌症[95,96]中的作用已被广泛记录,强调其在免疫调节和功能障碍中的重要性。除了免疫相关功能外,BTN3A2还被认为与精神疾病如精神分裂症[97]和焦虑[98]以及神经质等精神病特征[99]有关。这些发现表明BTN3A2可能是免疫功能与心理健康之间的关键联系,凸显了其在精神疾病病因和靶向疗法开发中的潜在重要性。本研究具有多项优势。首先,我们延长的随访时间解决了该领域纵向研究的匮乏,从而更全面地理解抑郁症的发生情况。我们进行了多项敏感性分析,以增强研究结果的稳健性。例如,基线评估后两年内排除抑郁症诊断,降低了反向因果关系的潜在问题。此外,我们的分析涵盖了比以往更广泛的蛋白质种类,提供了更全面的抑郁分子景观视角。鉴于抑郁症的多维性,受遗传、环境因素和生化过程影响,我们的研究整合了这些维度,提供了跨多样人群的详细画像。此外,我们引用了英国生物银行Olink和冰岛SomaScan数据的比较分析,显示两者之间存在适度相关性,Olink的可靠性更高[100]。这一结果增强了我们发现的有效性和普遍性。尽管如此,本研究仍存在若干局限性。首先,我们来自英国生物样本库的队列主要由白人后裔组成,导致不同族裔背景中蛋白质表达的潜在差异尚未被探索。其次,我们的研究使用了英国生物样本库的抑郁症诊断病历,避免了右向审查的应用。由于这些诊断来自不同医疗机构,临床医生之间可能存在差异,也可能出现误诊和漏诊。未来利用数据集进行更全面的抑郁症病例记录的研究,将有助于证实和完善我们的发现。第三,尽管部分蛋白质在脑蛋白质组全相关研究[9]中与抑郁症相关(补充结果及表S30在线),但缺乏包含脑脊液/脑蛋白数据及偶发抑郁诊断的大规模前瞻性队列,限制了我们将主要发现从血浆蛋白扩展到脑/脑脊液蛋白的能力。然而,血浆蛋白质组学具有优势,尤其是在识别抑郁早期特征方面,因其易获取性。最后,由于缺乏具有Olink平台血浆蛋白数据的大规模前瞻性队列及突发抑郁诊断,且先前研究总结数据不完整,限制了我们评估复制率的能力,我们寻求英国生物库的独立样本验证以支持我们的发现。未来的蛋白质组研究对于复制我们的结果至关重要。总之,我们的大规模蛋白质组分析提供了一份稳健图谱,揭示了抑郁症发病的蛋白质组格局。我们识别出157个与抑郁症相关的蛋白质特征,包括GDF15、LRRN1、TNF和BTN3A2等关键蛋白。本研究不仅展示了大规模纵向蛋白质组学分析在理解抑郁症中的价值,也为个性化治疗干预开辟了有希望的方向。鉴于蛋白质在细胞功能中的复杂相互作用,我们的发现成为基础资源,揭示了抑郁症的病理生理前体,并为未来针对性、以患者为中心的治疗策略的发展奠定基础。

相关推荐
纪伊路上盛名在1 个月前
本地部署ColabFold, 实现蛋白质结构预测全自由
深度学习·神经网络·alphafold·计算生物学·蛋白质·结构预测·蛋白质折叠
纪伊路上盛名在3 个月前
Chap1:Neural Networks with NumPy(手搓神经网络理解原理)
python·深度学习·神经网络·机器学习·numpy·计算生物学·蛋白质
百泰派克生物科技3 个月前
串联质量标签(TMT)
人工智能·机器学习·蛋白质组学·蛋白质·质谱
纪伊路上盛名在5 个月前
如何批量获取蛋白质序列的所有结构域(domain)数据-2
数据库·人工智能·机器学习·统计·计算生物学·蛋白质
小白狮ww1 年前
更强的蛋白质突变效应预测!一键推理 DePLM 去噪蛋白质语言模型
人工智能·深度学习·语言模型·自然语言处理·deplm·蛋白质·蛋白质优化