【文献分享】MicroProphet一种具有时间感知能力的机器学习框架能够以个性化的方式精确预测微生物群落的动态变化

文章目录

介绍

利用稀疏的纵向数据准确预测微生物群落的动态行为,对于基于微生物组的精准医疗和生态监测而言,仍是一项极具挑战性的任务。现有的大多数模型依赖数据插值,并假定是种群层面的动态变化,这限制了它们在现实场景中捕捉个体微生物变化的能力。

我们提出了 MicroProphet,这是一种个性化的时序感知框架,能够从不完整的纵向观测数据中准确预测微生物丰度轨迹,且无需数据插补。它由一个时间感知的 Transformer 架构驱动,通过仅使用观察时间点的前 30% 来重建个体特定的微生物轨迹,并通过注意力机制捕捉关键的过渡状态。我们在合成群落、人类肠道微生物群、婴儿肠道发育以及尸体分解等不同生态系统中展示了其强大的跨生态系统泛化能力。该框架始终能够实现高预测准确性和生物学可解释性。在临床环境中,该框架能够早期检测出与疾病相关的微生物变化,并有助于优化针对微生物组的干预措施的时间安排。在法医领域,它能够根据早期的微生物信号准确推断出尸体的分解时间。通过将不完整且杂乱的微生物组数据转化为可操作的、个性化的预测结果,MicroProphet 为微生物生态学和精准健康领域的新一类时间感知系统奠定了基础。

微生物群落对于维持各种生态系统的健康起着至关重要的作用,涵盖从与人类相关的微生物群到农业和工业环境等多个方面[1,2,3]。随着精准医疗的日益受到重视,微生物群落的动态变化已成为理解个体健康状况的一个重要方向。与静态的横截面数据(这些数据仅能提供微生物组成的一时性概览)不同,纵向的微生物组数据揭示了微生物相互作用的演变轨迹及其生态后果,为随着时间推移对群落功能的机制性理解提供了更深入的见解。然而,将这些见解转化为可操作的预测仍是一个重大挑战,原因在于微生物组时间序列的样本采集不规律、大量数据缺失以及复杂的时态行为[4,5,6]。

经典的建模框架,如广义洛塔-沃尔泰拉系统(例如 MDSINE)[7]、动态贝叶斯网络(例如 CGBayesNets)[8]以及基于条件推理树的数字孪生模型(例如 Q-net)[9],为微生物群落动态的研究提供了重要见解。然而,这些方法在处理纵向微生物组数据中常见的固有缺失和异步采样问题时存在困难,这限制了它们在实际应用中的预测准确性和通用性[10,11,12]。尽管一些研究尝试通过统计样条估计和动态时间规整(DTW)[12]来解决这些问题,但这些方法依赖于数据插值,这可能会引入额外的偏差和扭曲。此外,大多数框架仍然局限于特定的生态系统,限制了它们在不同临床和环境设置中的应用潜力。

与此同时,序列建模方面的进展,特别是具有自注意力机制和时间位置编码的 Transformer 架构,极大地改变了基因表达和单细胞动态等领域的预测工作[13]。这些方法为从不完整且异质的生物数据中学习提供了新的途径,且无需明确的插补处理。尽管它们具有很大的潜力,但将其系统地应用于微生物组预测的研究仍相对较少,尤其是在需要同时具备预测准确性和生物学可解释性的情况下。

为解决这些局限性,我们提出了 MicroProphet,这是首个利用 Transformer 架构的个性化时态感知(也称为数字孪生)框架,该框架专为从不完整的纵向数据中建模微生物群落动态而设计。我们系统地在各种生态环境中验证了 MicroProphet,包括合成微生物群落、人类肠道微生物群和死后微生物群落演替。在这些代表性场景中,MicroProphet 能够从初始时间点的 30% 以下数据准确预测微生物丰度轨迹,且无需依赖基于插值的插补方法。值得注意的是,在 Corpse 数据集中,该模型成功捕捉到了表明显著组成变化的关键转折点。我们的方法为个性化轨迹预测和生态解释提供了数据驱动的基础,有望为微生物群监测和精准干预策略的未来发展提供指导。

代码

https://github.com/HUST-NingKang-Lab/MicroProphet

参考

相关推荐
跨境小彭12 小时前
凌风工具箱|TEMU/Shein/TK多站点销量数据可视化
大数据·信息可视化·数据分析·跨境电商·temu
optimistic_chen12 小时前
【AI Agent 全栈开发】RAG(检索增强生成)
java·linux·运维·人工智能·ai编程·rag
zhangxingchao12 小时前
AI应用开发四:RAG多模态数据处理
人工智能
碧海银沙音频科技研究院12 小时前
高通QCC3084-QCC518X蓝牙耳机项目
人工智能·深度学习·算法
@蔓蔓喜欢你12 小时前
CSS Grid布局完全指南:构建复杂布局的利器
人工智能·ai
xiami_world12 小时前
2026年团队AI工具栈架构指南:ChatGPT + Codex + AI白板智能体工程化落地方案
人工智能·ai·信息可视化·aigc·流程图
sheji10512 小时前
割草机器人行业浏览版内容汇总
人工智能·机器人·智能硬件
乐维_lwops12 小时前
【无标题】
运维·人工智能
qcx2312 小时前
【AI Daily】每日Arxiv论文研读Top5-2026-05-18
人工智能·ai·llm·论文·agent·arxiv
叶子Talk12 小时前
谷歌I/O明日开幕:Gemini 3.2对标GPT-5.5,AI眼镜十年后重启
人工智能·gpt·ai·谷歌·gemini·google i/o·gpt-5.5