二区5分纯生信|单细胞+非负矩阵+AlphaFold+机器学习组合

说在前面

学文不看刊

这篇分析总体来说工作量不算大,scRNA联合bulkRNA分析,多种机器学习组合预测模型,最后用了AlphaFold2预测蛋白及AutoDock分子对接

非常适合小白学习和模仿,其次在筛选出核心基因后可以再加几个外部数据集观察表达表征,单细胞层次也可再次进行验证,堆上工作量


今天给大家分享的一篇文章:Unveiling the molecular complexity of proliferative diabetic retinopathy through scRNA-seq, AlphaFold 2, and machine learning

  • 标题:通过 scRNA-seq、AlphaFold 2 和机器学习揭示增生性糖尿病视网膜病变的分子复杂性
  • 期刊名称:Frontiers in Endocrinology
  • 影响因子:5.2
  • JCR分区:Q1
  • 中科院分区:医学2区
  • 小类:内分泌学与代谢2区

摘要

背景 : 增生性糖尿病视网膜病变(PDR)是失明的主要原因,其发病机制复杂。本研究整合单细胞 RNA 测序(scRNA-seq)、非负矩阵分解(NMF)、机器学习和 AlphaFold 2 方法,探索 PDR 的分子水平。

方法 : 我们分析了 PDR 患者和健康对照者的 scRNA-seq 数据,以确定不同的细胞亚型和基因表达模式。NMF 用于定义 PDR 中的特定转录程序。利用 Meta-Program 1 中确定的氧化应激相关基因 (ORG),使用 12 种机器学习算法构建预测模型。此外,我们使用 AlphaFold 2 预测蛋白质结构,并辅以分子对接以验证潜在治疗靶点的结构基础。我们还分析了蛋白质-蛋白质相互作用 (PPI) 网络和关键 ORG 之间的相互作用。

结果 : 我们的 scRNA-seq 分析显示 PDR 患者有五种主要细胞类型和 14 种亚细胞类型,与对照组相比,基因表达存在显著差异。我们确定了三个关键元程序,强调了小胶质细胞在 PDR 发病机制中的作用。确定了三个关键 ORG(ALKBH1PSIP1ATP13A2),其中表现最佳的预测模型表现出较高的准确度(训练队列中的 AUC 为 0.989,验证队列中的 AUC 为 0.833)。此外,AlphaFold 2 预测与分子对接相结合显示白藜芦醇对 ALKBH1 具有很强的亲和力,表明其具有作为靶向治疗剂的潜力。PPI 网络分析揭示了中心 ORG 与其他基因之间复杂的相互作用网络,表明其在 PDR 发病机制中发挥着集体作用。

结论: 本研究深入了解了 PDR 的细胞和分子方面,并使用先进的技术方法确定了潜在的生物标志物和治疗目标。

关键词: ALKBH1;AlphaFold 2;NMF;PPI;糖尿病视网膜病变;机器学习;氧化应激;单细胞分析。

结果

图 1增生性糖尿病视网膜病变 (PDR) 样本与正常样本的单细胞 RNA 测序分析比较。

  • (A) PDR 和正常样本的单细胞 RNA 测序数据的质量控制。
  • (B)高度变异基因的鉴定。前 2000 个变异基因显示为红点。
  • ©主成分分析。据此,我们将细胞组分为两类。主成分的 ElbowPlot (D)和 JackStrawPlot (E) 。
  • 不同组(F)、8 个样本(G)、26 个簇(H)、5 种主要细胞类型(I)和 14 种亚细胞类型(J)的 t 分布随机邻域嵌入(t-SNE) 分析。

图 2 PDR 中细胞间通讯和基因表达的详细分析。

  • (A、B)基于所涉及基因数量(A)和相互作用权重/强度(B)的五种主要细胞类型的细胞间通讯网络图。
  • (C-F)小胶质细胞和间充质细胞的基因表达分析。两种细胞类型中上调(C)和下调(D)基因。(E)间充质细胞中下调的基因,但小胶质细胞中上调的基因。(F)间充质细胞中上调的基因,但小胶质细胞中下调的基因。

图 3小胶质细胞中的 PDR 基因模块目录。

  • (A)热图展示了小胶质细胞中 PDR 基因模块之间重叠的重要性,确定了三个共识模块:元程序 1、元程序 2 和元程序 3。
  • (B)从 Gene Ontology 和 PathCards 数据库中识别出元程序 1 和氧化应激相关基因 (ORG) 交叉处的 15 个基因。

图 4机器学习衍生的预测模型的开发。

  • (A)训练和验证队列中机器学习算法组合的 AUC 结果。训练队列为 GSE160306,验证队列为 GSE102485。
  • (B)性能最高的模型中包含的三个中心 ORG 的描述。
  • (C)使用 AlphaFold 2 预测的三个中心 ORG 的蛋白质结构。

图 5白藜芦醇与 ALKBH1 的分子对接。

  • (A) ALKBH1 蛋白的三维结构。
  • (B) ALKBH1 蛋白与白藜芦醇之间的结合相互作用图。
  • (C)白藜芦醇与 ALKBH1 的分子对接的近距离视图,突出显示局部扩增细节。

图 6蛋白质-蛋白质相互作用 (PPI) 网络的构建及三个枢纽 ORG 的功能富集分析。

  • (A)基于与三个枢纽 ORG 密切相关的 50 个基因构建 PPI 网络。
  • (B)使用七种分析算法确定了 PPI 网络中的前十个枢纽基因。
  • © UpSet 图显示所有算法确定的重叠基因。

图 7三种关键 ORG 与阴性对照基因 PXDNL 在各种疾病条件下的相互作用。

  • 分析使用比较毒理基因组学数据库 (CTD;http://ctdbase.org/ ) 进行。三个枢纽 ORG 与(A)糖尿病视网膜病变、(B)视网膜疾病、©眼部疾病、(D)血管疾病、(E)糖尿病并发症和(F)糖尿病之间的推断分数以条形图显示。

小结

  • 主要数据及方法:
Types Notes
分析数据 scRNA :GSE165784;bulkRNA :GSE102485、GSE160306;氧化应激相关基因:Gene Ontology、PathCards
分析方法 单细胞标准流程;小胶质细胞非负矩阵;机器学习组合ORG预测模型;AlphaFold2蛋白结构预测;AutoDock分子对接;PPI多算法网络拓扑分析;CTD评分可视化
相关推荐
东方佑2 小时前
递归推理树(RR-Tree)系统:构建认知推理的骨架结构
开发语言·r语言·r-tree
算法_小学生2 小时前
支持向量机(SVM)完整解析:原理 + 推导 + 核方法 + 实战
算法·机器学习·支持向量机
cwn_3 小时前
自然语言处理NLP (1)
人工智能·深度学习·机器学习·自然语言处理
算法_小学生3 小时前
逻辑回归(Logistic Regression)详解:从原理到实战一站式掌握
算法·机器学习·逻辑回归
Bio Coder4 小时前
R语言中 read.table 和 read.delim 之间的区别
开发语言·r语言
云天徽上6 小时前
【数据可视化-74】电信用户流失数据可视化分析:Python + Pyecharts 炫酷大屏(含完整的数据,代码)
开发语言·python·信息可视化·数据挖掘·数据分析·数据可视化·pyecharts
行然梦实6 小时前
粒子群优化算法(Particle Swarm Optimization, PSO) 求解二维 Rastrigin 函数最小值问题
算法·机器学习·数学建模
愚戏师7 小时前
机器学习(重学版)基础篇(概念与评估)
人工智能·机器学习
向左转, 向右走ˉ7 小时前
随机森林算法原理及优缺点
算法·随机森林·机器学习
go54631584658 小时前
基于YOLOP与GAN的图像修复与防御系统设计与实现
人工智能·深度学习·神经网络·机器学习·生成对抗网络·矩阵