二区5分纯生信|单细胞+非负矩阵+AlphaFold+机器学习组合

说在前面

学文不看刊

这篇分析总体来说工作量不算大,scRNA联合bulkRNA分析,多种机器学习组合预测模型,最后用了AlphaFold2预测蛋白及AutoDock分子对接

非常适合小白学习和模仿,其次在筛选出核心基因后可以再加几个外部数据集观察表达表征,单细胞层次也可再次进行验证,堆上工作量


今天给大家分享的一篇文章:Unveiling the molecular complexity of proliferative diabetic retinopathy through scRNA-seq, AlphaFold 2, and machine learning

  • 标题:通过 scRNA-seq、AlphaFold 2 和机器学习揭示增生性糖尿病视网膜病变的分子复杂性
  • 期刊名称:Frontiers in Endocrinology
  • 影响因子:5.2
  • JCR分区:Q1
  • 中科院分区:医学2区
  • 小类:内分泌学与代谢2区

摘要

背景 : 增生性糖尿病视网膜病变(PDR)是失明的主要原因,其发病机制复杂。本研究整合单细胞 RNA 测序(scRNA-seq)、非负矩阵分解(NMF)、机器学习和 AlphaFold 2 方法,探索 PDR 的分子水平。

方法 : 我们分析了 PDR 患者和健康对照者的 scRNA-seq 数据,以确定不同的细胞亚型和基因表达模式。NMF 用于定义 PDR 中的特定转录程序。利用 Meta-Program 1 中确定的氧化应激相关基因 (ORG),使用 12 种机器学习算法构建预测模型。此外,我们使用 AlphaFold 2 预测蛋白质结构,并辅以分子对接以验证潜在治疗靶点的结构基础。我们还分析了蛋白质-蛋白质相互作用 (PPI) 网络和关键 ORG 之间的相互作用。

结果 : 我们的 scRNA-seq 分析显示 PDR 患者有五种主要细胞类型和 14 种亚细胞类型,与对照组相比,基因表达存在显著差异。我们确定了三个关键元程序,强调了小胶质细胞在 PDR 发病机制中的作用。确定了三个关键 ORG(ALKBH1PSIP1ATP13A2),其中表现最佳的预测模型表现出较高的准确度(训练队列中的 AUC 为 0.989,验证队列中的 AUC 为 0.833)。此外,AlphaFold 2 预测与分子对接相结合显示白藜芦醇对 ALKBH1 具有很强的亲和力,表明其具有作为靶向治疗剂的潜力。PPI 网络分析揭示了中心 ORG 与其他基因之间复杂的相互作用网络,表明其在 PDR 发病机制中发挥着集体作用。

结论: 本研究深入了解了 PDR 的细胞和分子方面,并使用先进的技术方法确定了潜在的生物标志物和治疗目标。

关键词: ALKBH1;AlphaFold 2;NMF;PPI;糖尿病视网膜病变;机器学习;氧化应激;单细胞分析。

结果

图 1增生性糖尿病视网膜病变 (PDR) 样本与正常样本的单细胞 RNA 测序分析比较。

  • (A) PDR 和正常样本的单细胞 RNA 测序数据的质量控制。
  • (B)高度变异基因的鉴定。前 2000 个变异基因显示为红点。
  • ©主成分分析。据此,我们将细胞组分为两类。主成分的 ElbowPlot (D)和 JackStrawPlot (E) 。
  • 不同组(F)、8 个样本(G)、26 个簇(H)、5 种主要细胞类型(I)和 14 种亚细胞类型(J)的 t 分布随机邻域嵌入(t-SNE) 分析。

图 2 PDR 中细胞间通讯和基因表达的详细分析。

  • (A、B)基于所涉及基因数量(A)和相互作用权重/强度(B)的五种主要细胞类型的细胞间通讯网络图。
  • (C-F)小胶质细胞和间充质细胞的基因表达分析。两种细胞类型中上调(C)和下调(D)基因。(E)间充质细胞中下调的基因,但小胶质细胞中上调的基因。(F)间充质细胞中上调的基因,但小胶质细胞中下调的基因。

图 3小胶质细胞中的 PDR 基因模块目录。

  • (A)热图展示了小胶质细胞中 PDR 基因模块之间重叠的重要性,确定了三个共识模块:元程序 1、元程序 2 和元程序 3。
  • (B)从 Gene Ontology 和 PathCards 数据库中识别出元程序 1 和氧化应激相关基因 (ORG) 交叉处的 15 个基因。

图 4机器学习衍生的预测模型的开发。

  • (A)训练和验证队列中机器学习算法组合的 AUC 结果。训练队列为 GSE160306,验证队列为 GSE102485。
  • (B)性能最高的模型中包含的三个中心 ORG 的描述。
  • (C)使用 AlphaFold 2 预测的三个中心 ORG 的蛋白质结构。

图 5白藜芦醇与 ALKBH1 的分子对接。

  • (A) ALKBH1 蛋白的三维结构。
  • (B) ALKBH1 蛋白与白藜芦醇之间的结合相互作用图。
  • (C)白藜芦醇与 ALKBH1 的分子对接的近距离视图,突出显示局部扩增细节。

图 6蛋白质-蛋白质相互作用 (PPI) 网络的构建及三个枢纽 ORG 的功能富集分析。

  • (A)基于与三个枢纽 ORG 密切相关的 50 个基因构建 PPI 网络。
  • (B)使用七种分析算法确定了 PPI 网络中的前十个枢纽基因。
  • © UpSet 图显示所有算法确定的重叠基因。

图 7三种关键 ORG 与阴性对照基因 PXDNL 在各种疾病条件下的相互作用。

  • 分析使用比较毒理基因组学数据库 (CTD;http://ctdbase.org/ ) 进行。三个枢纽 ORG 与(A)糖尿病视网膜病变、(B)视网膜疾病、©眼部疾病、(D)血管疾病、(E)糖尿病并发症和(F)糖尿病之间的推断分数以条形图显示。

小结

  • 主要数据及方法:
Types Notes
分析数据 scRNA :GSE165784;bulkRNA :GSE102485、GSE160306;氧化应激相关基因:Gene Ontology、PathCards
分析方法 单细胞标准流程;小胶质细胞非负矩阵;机器学习组合ORG预测模型;AlphaFold2蛋白结构预测;AutoDock分子对接;PPI多算法网络拓扑分析;CTD评分可视化
相关推荐
阿利同学3 分钟前
热成像目标检测数据集
人工智能·目标检测·机器学习·目标跟踪·数据集·热成像目标检测数据集·机器学习 深度学习
阡之尘埃26 分钟前
Python数据分析案例59——基于图神经网络的反欺诈交易检测(GCN,GAT,GIN)
python·神经网络·数据挖掘·数据分析·图神经网络·反欺诈·风控大数据
环能jvav大师1 小时前
基于R语言的统计分析基础:使用dplyr包进行数据操作
大数据·开发语言·数据分析·r语言
AI完全体2 小时前
AI小项目4-用Pytorch从头实现Transformer(详细注解)
人工智能·pytorch·深度学习·机器学习·语言模型·transformer·注意力机制
Alluxio官方2 小时前
Alluxio Enterprise AI on K8s FIO 测试教程
人工智能·机器学习
经纬恒润2 小时前
应用案例分享 | 智驾路试数据分析及 SiL/HiL 回灌案例介绍
数据挖掘·数据分析·智能驾驶·ai智能体
AI大模型知识分享2 小时前
Prompt最佳实践|指定输出的长度
人工智能·gpt·机器学习·语言模型·chatgpt·prompt·gpt-3
标贝科技3 小时前
ChatGPT对话训练数据采集渠道有哪些
数据库·人工智能·机器学习·chatgpt
paixiaoxin5 小时前
学术新手进阶:Zotero插件全解锁,打造你的高效研究体验
人工智能·经验分享·笔记·机器学习·学习方法·zotero
破晓的历程5 小时前
【机器学习】:解锁数据背后的智慧宝藏——深度探索与未来展望
人工智能·机器学习