Nature图形复现—Graphpad绘制带P值的含数据点的小提琴图

带 P 值的含数据点的小提琴图是一种科研数据可视化图表,它同时呈现数据的分布特征、原始观测值和统计显著性:通过小提琴形状展示概率密度分布(反映数据集中趋势和离散程度),叠加抖动散点显示所有原始数据点(避免信息丢失并揭示潜在异常值),并在组间添加带有 P 值标注的显著性标记。

本期图表来源于 2023 年发表于 Nature communication 的文章数据图。

原文中使用差异小提琴图展示了 CTSB(Cathepsin B)在不同肿瘤分期(Stage I & II vs. Stage III & IV)HCC(肝细胞癌)患者中的表达水平比较,表达指标为 IDO/area。其中X轴:Stage I & II(n = 119)代表早期肿瘤;Stage III & IV(n = 75)则代表晚期肿瘤;Y轴:CTSB expression(IDO/area)表示单位面积中的 CTSB 表达强度;

每个点表示一个患者样本,小提琴图表示表达值的分布,点的颜色区分了两个组(蓝色 vs. 红色)。

统计显著性:标注的p值为0.0439,p < 0.05说明在统计学上存在显著差异。

图表结论:CTSB 表达在晚期 HCC(Stage III & IV)患者中显著高于早期患者(Stage I & II);这表明 CTSB 可能参与了肿瘤进展过程,是潜在的进展相关分子标志物。

本期教程我们来使用Graphpad复现Nature图形,绘制带P值的含数据点的小提琴图。

1.双击打开Graphpad,选择分组,在选项处选择"为每个点输入一个Y值并绘图";

2.将数据复制进软件中,点击新建分析;

3.在跳出的对话框,选择列分析---t检验(和非参数检验),点击确定;跳出对话框后,点击确定即可;

4.在跳出的分析报告中,可以看出p值为0.0439,样本值分别为119和75;

5.接着点击新建图表,在图表类型选择"列",选择箱线和小提琴图,选择小提琴图;

6.绘制出来的图形雏形如下图所示,接着需要对其进行细节美化;

7.双击图形,选择不同组别,分别对填充颜色,数据点颜色进行修改;

8.点击成对比较工具,双击对其修改,选择显示P值;

9.接着对其进行其他细节美化,包括纵坐标标题,样本数量添加,字体格式等,其最终效果图如下图所示:

以上就是Graphpad绘制带P值的小提琴图的基本步骤。带P值的含数据点的小提琴图是一种多维度的科研数据呈现方式,它巧妙融合了三种关键信息:小提琴轮廓直观展示数据的概率密度分布(揭示整体形态和离散程度),散布的原始数据点清晰呈现每个观测值(保留样本细节并识别离群值),而标注的显著性P值则定量化验证组间差异的统计学意义。大家快去试试吧!

------END------

相关推荐
不惑_1 小时前
AI大模型是怎么工作的?从石头分类说起
人工智能·分类·数据挖掘
MoRanzhi12031 小时前
5. Pandas 缺失值与异常值处理
数据结构·python·数据挖掘·数据分析·pandas·缺失值处理·异常值处理
李贺梖梖2 小时前
数据分析概述与环境搭建
数据分析
yzx9910135 小时前
多模态分类:图文结合的智能识别与代码实战
人工智能·分类·数据挖掘
jerryinwuhan17 小时前
Python数据挖掘之基础分类模型_支持向量机(SVM)
python·支持向量机·数据挖掘
weixin_525936331 天前
2020年美国新冠肺炎疫情数据分析与可视化
hadoop·python·数据挖掘·数据分析·spark·数据可视化
爱吃奶酪的松鼠丶1 天前
图像分类模型 传统训练VS迁移学习训练
分类·数据挖掘·迁移学习
matrixmind11 天前
Nivo 用React打造精美数据可视化的开源利器
其他·react.js·信息可视化·开源
西贝爱学习1 天前
IMDb Top 950 Movies Dataset (2025) 数据集【IMDb 前950电影数据集】
信息可视化·数据集
sheji34161 天前
【开题答辩全过程】以 Web数据挖掘在电子商务中的应用研究为例,包含答辩的问题和答案
前端·人工智能·数据挖掘