TCGA单基因高低分组的差异分析后的GSEA-GO和KEGG富集分析教程

TCGA单基因高低分组的差异分析后的GSEA-GO和GSEA-KEGG联合富集分析教程

分析思路

  1. 对该单基因的表达水平的中位数作为阈值把样本分成高表达组和低表达组
  2. 按该基因的高低表达样本分组来做该癌症的转录组差异分析
  3. 获取差异基因的GO和KEGG通路基因集
  4. 对差异基因按logFC进行排序和GO或KEGG通路基因集做GSEA富集分析
  5. 在一张图中做GSEA富集分析结果的可视化和绘制多个GSEA top5富集通路的富集曲线

单癌肿按单基因高低分组的差异分析后的GSEA-GO富集分析

分析界面

分析结果

GO通路基因集的GSEA富集结果表格

以下是表格中各重要列名的详细解读:

  • NES (Column E): Normalized Enrichment Score (归一化富集分数)
    • 含义: 它是对 ES(富集分数)进行归一化处理后的结果,消除了基因集大小差异的影响,可以直接在不同通路之间进行比较。
    • 如何看:
      • 正值 (>0): 表示该通路在你的实验组(或排序列表的顶部)中是激活/上调的。
      • 负值 (<0): 表示该通路在你的实验组中是抑制/下调的。
      • 数值大小: 绝对值越大,富集程度越高。一般认为 |NES| > 1 才有意义。
  • p.adjust (Column G): Adjusted p-value (校正后的 P 值)
    • 含义: 由于同时分析了成百上千条通路,存在多重假设检验的问题,因此不能只看原始 P 值。这是经过 BH (Benjamini-Hochberg) 等方法校正后的 P 值,也常被称为 FDR (False Discovery Rate)。
    • 如何看: 通常以 < 0.05 作为显著性的阈值。只有当 NES 绝对值较大且 p.adjust < 0.05 时,我们才认为这个结果是统计学显著且可信的。
  • Description (Column B): Pathway Name (通路描述)
    • 含义: 该基因集(通路)的具体名称,例如 "Nitrogen metabolism" (氮代谢)。这是你写文章或做生物学解释时用的名字。
  • setSize (Column C): Gene Set Size (基因集大小)
    • 含义: 该通路中包含的、且在你的测序数据中能找到的基因数量。
    • 作用: 如果数值太小(例如 < 10),结果可能不稳定;如果数值太大(例如 > 500),通路可能太宽泛,缺乏特异性。
  • enrichmentScore (Column D): ES (原始富集分数)
    • 含义: 计算出的原始分数,反映基因集在排序列表顶端或底端的聚集程度。
  • core_enrichment (Column K): Core Enrichment Genes (核心富集基因)
    • 含义: 这一列非常实用。它列出了导致该通路富集的关键基因(通常用 / 分隔)。
    • 作用: 这些就是该通路中贡献最大的基因(Leading Edge Genes)。如果你想挑选几个基因做 qPCR 验证或画热图,就从这一列里选。
  • ID (Column A): 数据库中的唯一编号。
  • pvalue (Column F): 原始 P 值,未经过多重检验校正,仅供参考。
  • qvalue (Column H): 也是一种错误发现率的度量,功能类似 p.adjust,通常要求 < 0.25。
  • rank (Column I): 达到 ES 峰值时在排序列表中的位置。

单癌肿按单基因高低分组的差异分析后的GSEA-KEGG富集分析

分析界面

分析结果

OmicsTools软件和分析教程介绍

前言和简介

OmicsTools全能医学生物生信分析电脑软件简介

我开发了一款本地电脑无限使用的零代码生信数据分析作图神器一站式全流程电脑软件OmicsTools,旨在成为可以做各种医学生物生信领域科研数据分析作图的的全能科研软件,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己电脑上快速进行大量的生信分析和加速大家的科研。

OmicsTools生信分析电脑软件可以做医学生物生信各个领域的科研数据分析和作图,并致力于成为医学生物生信领域的综合全能分析软件,一个软件帮助大家做医学生物生信领域的各种研究,快速出成果。

软件下载获取

我开发的本地电脑无限使用无限分析作图的生信零代码一键分析电脑软件神器OmicsTools 软件在github上的zihaoxingstudy1/OmicsTools(https://github.com/zihaoxingstudy1/OmicsTools)仓库中,也可以到我的生信交流q群群文件中下载,q群中的软件版本会更新一些,大家可以下载安装OmicsTools进行各种生信分析和可视化作图。

现在1群满员,会提示加3群,3群也可以下载到软件。

持续整理的各领域生信分析文档和答疑文档

所有人可编辑提问我对各种问题跟答疑答疑的腾讯文档

【腾讯文档】各领域生信分析全流程教程和答疑指导汇总版

https://docs.qq.com/doc/DWWtrd0Z2T1JHWVNa

以前很长一段时间大家遇到的各种生信分析问题和我对这些问题的答疑也都收录整理在我的腾讯文档对应的答疑文档中了,腾讯文档的答疑文档支持所有人编辑和提问。

这篇总的腾讯文档是各领域生信分析答疑指导汇总文档的入口,以后所有的生信分析教程资料都在这个在线word文档中就能检索到,答疑汇总也能在这个word文档中检索到,都在这个在线word文档对应的提问答疑文档文件中提问,提问的问题在文档中用红色字体显示,我答疑在文档中用黑色字体显示,提问答个疑的文档和教程的文档所有人都可编辑。大家在腾讯文档里提问好了之后,现在答疑文档也是比较多的,发个截图和答疑文档的链接网址给我看看,这样我能快速定位到你提问的是哪个问题。

可以提供的科研服务清单

相关推荐
Davina_yu5 小时前
Windows 下升级 R 语言至最新版
开发语言·windows·r语言
sensen_kiss8 小时前
INT303 Big Data Analysis 大数据分析 Pt.11 模型选择和词向量(Word Embeddings)
大数据·数据挖掘·数据分析
laocooon5238578868 小时前
数据收集, 数据清洗,数据分析,然后可视化,都涉及哪些知识
数据挖掘·数据分析
企业智能研究9 小时前
什么是数据治理?数据治理对企业有什么用?
大数据·人工智能·数据分析·agent
逻极12 小时前
数据分析项目:Pandas + SQLAlchemy,从数据库到DataFrame的丝滑实战
python·mysql·数据分析·pandas·sqlalchemy
醉卧考场君莫笑12 小时前
数据分析常用方法:上
数据挖掘·数据分析
小王毕业啦12 小时前
2003-2023年 285个地级市邻接矩阵、经济地理矩阵等8个矩阵数据
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
2501_9418036213 小时前
在奥斯陆智能水利场景中构建实时水资源调度与高并发水质数据分析平台的工程设计实践经验分享
数据挖掘·数据分析·云计算
城数派15 小时前
2001-2024年全球500米分辨率逐年土地覆盖类型栅格数据
大数据·人工智能·数据分析
AC赳赳老秦16 小时前
前端可视化组件开发:DeepSeek辅助Vue/React图表组件编写实战
前端·vue.js·人工智能·react.js·信息可视化·数据分析·deepseek