HOI-Brain:从fMRI中准确提取带符号高阶交互用于脑疾病诊断的多通道

HOI-Brain:从fMRI中准确提取带符号高阶交互用于脑疾病诊断的多通道Transformer框架-文献速递/多模态医学影像最新进展

2026.6.10

本文提出HOI-Brain,用MTD提取fMRI中带符号四元高阶交互,并结合持久同调与多通道Transformer提升AD、PD和ASD诊断。

Title 题目

01

HOI-brain: A novel multi-channel transformers framework for brain disorder diagnosis by accurately extracting signed higher-order interactions from fMRI data

HOI-Brain:从fMRI中准确提取带符号高阶交互用于脑疾病诊断的多通道Transformer框架

文献速递介绍

02

引言首先指出,fMRI可通过BOLD信号刻画脑区之间的功能连接,是寻找AD、PD、ASD等脑疾病影像标志物的重要工具。现有脑网络学习方法多将ROI视为节点、功能连接视为边,GNN和Transformer等模型主要学习两两连接或全局两两依赖;超图模型虽然试图表达群组关系,但常依赖k近邻或k跳邻域构造,未必等价于真实的同时群体共波动,解释性也较弱。持久同调方法能提取拓扑结构,但多数工作集中在连通分量和一维环,或最多分析三元交互,缺少对四元及更高阶交互、符号信息和二维空洞组织的系统建模。基于这些不足,作者提出HOI-Brain:用时间导数乘积MTD捕捉瞬时k阶共波动,将正向和负向协同交互编码到单调加权单纯复形中,再用持久同调提取四元组和二维空洞等高阶拓扑特征,最后通过多通道Transformer融合低阶与高阶信息进行疾病分类。

相关工作

相关工作分三类讨论。第一类是基于深度学习的图模型,包括GroupINN、BrainGNN、FBNetGen、BPI-GNN和ASD-HNet等,这些方法能从功能脑网络中学习判别性表示,但基础假设仍是两两边连接,因此难以直接刻画多脑区同步交互。部分超图方法通过超边扩展群组关系,但超边通常由邻域或相似性启发式构造,既可能偏离真实群体依赖,也难以解释其神经拓扑含义。第二类是脑网络Transformer,如Brain Network Transformer、TSEN和Long-range Brain Transformer,它们擅长建模全局依赖,但输入多为原始时间序列或功能连接矩阵,忽略显式高阶拓扑信息。第三类是脑连接组上的持久同调研究,已有工作证明拓扑特征对脑病诊断有价值,但多集中于H0连通分量和H1一维环,较少分析H2二维空洞,更没有充分结合带符号高阶交互。

预备知识与数学基础

该部分首先形式化脑疾病诊断任务:给定带标签fMRI脑图数据,目标是学习从脑网络到疾病类别的映射,并要求模型能在未见样本上泛化。随后作者提出MTD来处理多变量时间序列:先对每个ROI的BOLD序列做一阶差分并标准化,再对多个ROI在同一时间点的标准化导数做逐元素乘积,得到k阶共波动强度。为了区分一致与不一致的群组变化,若所有ROI导数同为非负或同为非正,则符号映射为正,代表一致性协同;否则为负,代表不一致交互。本文重点研究k小于4的单纯形,尤其四个ROI构成的3-simplex四元交互。最后作者定义单调加权单纯复形,要求任一单纯形与其面之间的权重满足下闭包或上闭包条件,从而使高阶结构的权重具有层级一致性,为后续用滤波和持久同调提取特定高阶组织提供数学基础。

Aastract摘要

03

本文关注静息态fMRI脑网络诊断中传统方法过度依赖两两连接、难以刻画真实带符号高阶脑区协同的问题。作者提出HOI-Brain框架,先用时间导数乘积MTD估计多个ROI在每个时间点的瞬时共波动,再区分正向协同与负向协同高阶交互,并编码为满足上下闭包条件的单调加权单纯复形。随后,框架从这些复形中提取低阶边特征、带符号优良四元组特征以及通过持久同调得到的带符号二维空洞特征,并用多通道脑网络Transformer融合异质拓扑信息完成分类。ADNI、TaoWu、PPMI和ABIDE四个数据集上的实验表明,HOI-Brain总体优于20个传统机器学习、GNN、Transformer、超图神经网络和持久同调基线。模型还识别出疾病相关ROI和高阶组织模式:AD中一致性高阶交互随病程减弱,而PD和ASD中呈相反增强趋势。

Method 方法

04

方法部分给出HOI-Brain完整流程。第一步,模型对fMRI中每个ROI时间序列使用MTD,得到每个时间点的带符号k阶共波动,并进一步把一致性正符号交互拆分为正向协同和负向协同:前者表示多个脑区相对上一时间点同时激活增强,后者表示多个脑区同时抑制或下降。作者有意不重点分析不一致符号模式,因为这类模式可能包含混杂和冗余的多脑区信息。第二步,模型将正向协同和负向协同单纯形分别通过升序滤波和降序滤波构造成四类单调加权单纯复形:正向下闭包、负向下闭包、正向上闭包和负向上闭包。第三步,模型从这些复形中提取三类拓扑表示:低阶边矩阵用于保留基础连接组织;下闭包复形中的3-simplex用于得到带符号优良四元组,并通过边投影转换为边级矩阵;上闭包复形结合持久同调提取H2二维空洞,再用同调支架把空洞持久性映射到边权矩阵。每个时间点得到五个矩阵,随后对全时段求平均,以降低fMRI噪声影响并稳定特征。第四步,作者设计多通道脑网络Transformer:先用带符号高阶特征解耦机制自适应融合正向和负向四元组、正向和负向二维空洞;再分别对低阶边、四元组和空洞三个通道使用多头自注意力学习节点表示;随后通过正交初始化的软聚类读出模块捕捉不同通道中的功能模块结构;最后用注意力引导的特征融合机制对三类通道按样本和疾病自适应加权,并用MLP完成分类。

实验

实验使用四个静息态fMRI数据集评估模型,包括ADNI的CN、MCI、AD三分类,TaoWu的PD与NC,PPMI的PD与prodromal,以及ABIDE的ASD与NC。所有数据经fMRIPrep等流程预处理,并主要采用AAL-90脑区分区,同时在ABIDE上补充Schaefer-100分区鲁棒性实验。对比方法覆盖20个基线,包含传统机器学习、GNN、Transformer、超图神经网络和持久同调模型。主结果显示,HOI-Brain在ADNI上达到75.9%准确率和75.5% F1,在TaoWu上达到77.5%准确率和75.9% F1,在PPMI上达到66.1%准确率和64.7% F1,在ABIDE上达到65.6%准确率和65.3% F1,整体优于或高度竞争于所有基线。作者指出,Transformer基线通常优于普通GNN,说明全局连接建模很重要;持久同调类方法优于许多低阶方法,说明拓扑高阶特征有价值;而HOI-Brain进一步将带符号四元交互和二维空洞纳入统一模型,因此取得更稳定的提升。消融实验表明,仅用低阶边特征不如融合高阶特征;四元组和二维空洞优于传统三角和一维环组合;带符号高阶特征优于无符号特征;MTD得到的高阶特征优于扩展Pearson相关;去除符号解耦、通道融合或聚类读出都会降低性能。超参数分析显示,聚类数K从2增加到10或20时表现提升,进一步增至50或100时下降,符合脑功能模块数量较少的经验。

模型可解释性

可解释性分析首先考察通道注意力。ADNI和ABIDE上的结果显示,四元组交互通道的重要性通常高于二维空洞和低阶边通道,说明四元级高阶协同是最具判别力的信息来源之一。在符号层面,负向协同四元组往往比正向协同四元组更重要,而正向协同空洞通常比负向协同空洞更重要。ADNI上的组间统计显示,带符号四元组数量在CN、MCI、AD之间差异显著,且AD进展过程中正向四元组逐渐减少,负向四元组先减少后增加,提示从CN到MCI时整体协同下降,而从MCI到AD时脑网络可能更多依赖负向协同或抑制性补偿。聚类机制分析显示,低阶边、四元组和空洞通道的注意力矩阵都呈现一定模块性,且软聚类分配矩阵在大多数ROI上有接近单一高值的聚类归属,说明模型能发现不同拓扑层次下的脑功能模块。重要脑区分析中,ADNI上高注意ROI包括右尾状核、左海马、右海马旁回、左杏仁核和嗅觉相关区域,符合AD中内侧颞叶、边缘系统和感觉网络异常的文献;PPMI上重要ROI包括右后扣带回、额眶内侧、顶叶、杏仁核、丘脑和额下回,关联PD的感觉运动、皮层-基底节-丘脑和额纹状体环路;ABIDE上重要ROI包括双侧颞下回、左缘上回、双侧尾状核、颞极和扣带相关区域,指向ASD中的社会感知、皮层纹状体和感觉运动整合异常。

Discussion讨论

04

讨论部分强调,HOI-Brain的核心贡献不只是提升分类准确率,而是提供了一条从fMRI时间序列到可解释高阶脑网络组织的统一路径。MTD通过时间导数乘积增强了瞬时动态交互的时间分辨率,单调加权单纯复形把符号高阶共波动与拓扑结构联系起来,持久同调进一步将四元组与二维空洞组织转化为可用于学习的矩阵特征,多通道Transformer则能按通道保留异质结构差异并自适应融合。作者认为,四元组交互比三元交互更能反映真实高阶现象,因为部分三元模式可能可由两两交互线性分解。疾病机制方面,AD中正向HOI逐渐减弱、负向HOI增强,可能反映高阶协同功能受损和内部功能紊乱加重;PD和ASD中则呈现相反趋势,PD可能与高阶区域对感觉处理影响增强及幻觉相关机制有关,ASD则与某些脑区过连接现象相呼应。作者也明确指出,该框架更适合作为决策支持和标志物发现工具,而不是可直接临床部署的独立诊断系统。局限包括:当前主要分析一致性符号模式,未系统建模不一致交互;对全时间点特征求平均可能掩盖动态HOI状态变化;未来可扩展到EEG、MEG等其他神经时间序列模态。

Conclusion结论

05

结论总结认为,HOI-Brain能够从fMRI脑网络中准确捕获带符号高阶交互,提取可解释的高阶拓扑特征,并整合低阶与高阶信息用于脑疾病诊断。该方法在AD、PD和ASD相关数据集上优于20个基线,同时通过注意力和统计分析发现了疾病相关ROI、关键脑区交互以及特定病程阶段的高阶组织模式。论文强调,四元组及更高阶脑区交互对于精准医学、神经疾病机制理解和神经影像时间序列分析具有重要潜力,并且框架具有向其他神经影像或神经生理数据推广的可能。

Results结果

06

论文在四个LDCT数据集和四种LDPET场景上进行了广泛验证,并与多种先进方法进行比较。定量结果表明,FADFNet在信号保真度和感知质量指标上取得最优或具有竞争力的表现,同时相比生成式方法显著降低计算开销。跨数据集实验说明,频率分解、结构引导纹理恢复和参数高效微调能够共同提升模型在异构数据上的泛化能力。临床盲评结果进一步显示,FADFNet生成的重建图像质量可与全剂量参考图像相媲美,说明其在实际临床部署中具有潜在可靠性。

Figure

07

图1.该图展示从fMRI输入到疾病分类输出的完整流程:预处理得到ROI时间序列后,MTD计算瞬时高阶共波动;带符号交互被构造成四类单调加权单纯复形;持久同调用于提取四元组与二维空洞等高阶拓扑特征;最后低阶边、带符号四元组和带符号二维空洞三类通道进入多通道Transformer完成分类。它是理解本文方法贡献的核心总览图。

图2.该图解释了方法的关键数学与模型组件,包括下闭包和上闭包单调加权单纯复形、六种四元符号交互类型、二维空洞同调支架与四元组边投影矩阵的构造方式,以及单通道自注意力层的基本结构。图中强调本文只关注一致性正符号下的正向协同和负向协同,并把高阶结构转化为可输入Transformer的矩阵特征。

图3.该图比较HOI-Brain完整模型与去除符号解耦、去除注意力融合、去除多通道聚类读出三个变体在四个数据集上的表现,显示完整模型整体更优,支持各模块设计的必要性。右侧还展示聚类数K对准确率和召回率的影响,模型在K约为10或20时表现较好,过多聚类会导致性能下降。

图4.该图比较HOI-Brain完整模型与去除符号解耦、去除注意力融合、去除多通道聚类读出三个变体在四个数据集上的表现,显示完整模型整体更优,支持各模块设计的必要性。右侧还展示聚类数K对准确率和召回率的影响,模型在K约为10或20时表现较好,过多聚类会导致性能下降。

图5该图分别可视化ADNI、PPMI和ABIDE中注意力最高的前10个ROI及其关键脑区交互。AD相关结果突出尾状核、海马、海马旁回、杏仁核和嗅觉相关区域;PD结果涉及后扣带、顶叶、丘脑、杏仁核和额叶控制区域;ASD结果集中在颞下回、缘上回、尾状核、颞极和扣带等区域。这些结果支持HOI-Brain的神经生物学可解释性。

图6该图比较CN、MCI和AD三组中若干关键四元脑区组合的共波动幅度分布,显示从CN到MCI或AD,正向HOI总体逐渐减弱而负向HOI逐渐增强。若干涉及尾状核、海马、海马旁回、杏仁核、嗅觉区和颞极中回的四元交互在疾病阶段转变中具有显著差异,提示这些高阶交互可能作为AD早期诊断或病程追踪的候选标志物。

图7该图比较prodromal与PD组之间关键四元交互的分布,涉及后扣带回、额眶内侧、顶叶、丘脑、杏仁核和额下回等区域。结果显示从prodromal到PD,相关正向HOI增强、负向HOI减弱,提示皮层-丘脑-额叶和额叶-边缘控制环路的高阶共波动在PD转变中发生重构。

图8该图比较NC与ASD组之间多个关键四元脑区组合的共波动分布,所有展示的交互均具有显著组间差异。相关脑区包括颞下回、缘上回、尾状核、颞极中回和Rolandic operculum,说明ASD与颞顶、皮层纹状体和感觉运动整合系统的高阶共波动改变有关,并呈现正向HOI增强、负向HOI减弱的趋势。

相关推荐
RSTJ_16251 小时前
PYTHON+AI LLM DAY SEVENTY-TWO
人工智能
Stick_ZYZ1 小时前
A2A:让 Agent 从单兵作战走向团队协作
java·开发语言·网络·人工智能·python·ai
weixin_495248401 小时前
短剧漫剧批量译制全流程指南:短剧漫剧如何规模化译制?
人工智能
JAMSAN09301 小时前
16.0% 高增长!全球异构计算架构服务市场扩容态势
汇编·人工智能·架构
weixin_307779131 小时前
从切片迷宫到结构化智能:AI Agent解析PDF的完整范式
图像处理·人工智能·python·自动化·ocr
源码宝1 小时前
智能随访系统源码,技术架构设计:Spring Boot + Vue.js + 微服务实战
java·人工智能·源码·随访系统·智能随访·随访系统成品源码
zhqh1001 小时前
MOT16数据集做目标检测的预处理(类别合并与清理)
人工智能·目标检测·计算机视觉
BizViewStudio1 小时前
2026 年 GEO 成为企业线上流量增长核心风口|2026 品牌 GEO 运营指南,6 家全链路优化服务商解析
运维·网络·人工智能·microsoft·ai
benben0441 小时前
ONNX从入门到精通大全
人工智能·pytorch·python