带 P 值的含数据点的小提琴图是一种科研数据可视化图表,它同时呈现数据的分布特征、原始观测值和统计显著性:通过小提琴形状展示概率密度分布(反映数据集中趋势和离散程度),叠加抖动散点显示所有原始数据点(避免信息丢失并揭示潜在异常值),并在组间添加带有 P 值标注的显著性标记。

本期图表来源于 2023 年发表于 Nature communication 的文章数据图。
原文中使用差异小提琴图展示了 CTSB(Cathepsin B)在不同肿瘤分期(Stage I & II vs. Stage III & IV)HCC(肝细胞癌)患者中的表达水平比较,表达指标为 IDO/area。其中X轴:Stage I & II(n = 119)代表早期肿瘤;Stage III & IV(n = 75)则代表晚期肿瘤;Y轴:CTSB expression(IDO/area)表示单位面积中的 CTSB 表达强度;
每个点表示一个患者样本,小提琴图表示表达值的分布,点的颜色区分了两个组(蓝色 vs. 红色)。
统计显著性:标注的p值为0.0439,p < 0.05说明在统计学上存在显著差异。
图表结论:CTSB 表达在晚期 HCC(Stage III & IV)患者中显著高于早期患者(Stage I & II);这表明 CTSB 可能参与了肿瘤进展过程,是潜在的进展相关分子标志物。
本期教程我们来使用Graphpad复现Nature图形,绘制带P值的含数据点的小提琴图。
1.双击打开Graphpad,选择分组,在选项处选择"为每个点输入一个Y值并绘图";

2.将数据复制进软件中,点击新建分析;

3.在跳出的对话框,选择列分析---t检验(和非参数检验),点击确定;跳出对话框后,点击确定即可;


4.在跳出的分析报告中,可以看出p值为0.0439,样本值分别为119和75;

5.接着点击新建图表,在图表类型选择"列",选择箱线和小提琴图,选择小提琴图;

6.绘制出来的图形雏形如下图所示,接着需要对其进行细节美化;

7.双击图形,选择不同组别,分别对填充颜色,数据点颜色进行修改;

8.点击成对比较工具,双击对其修改,选择显示P值;


9.接着对其进行其他细节美化,包括纵坐标标题,样本数量添加,字体格式等,其最终效果图如下图所示:

以上就是Graphpad绘制带P值的小提琴图的基本步骤。带P值的含数据点的小提琴图是一种多维度的科研数据呈现方式,它巧妙融合了三种关键信息:小提琴轮廓直观展示数据的概率密度分布(揭示整体形态和离散程度),散布的原始数据点清晰呈现每个观测值(保留样本细节并识别离群值),而标注的显著性P值则定量化验证组间差异的统计学意义。大家快去试试吧!
------END------