R语言绘图:小提琴图

小提琴图定义:

小提琴图(Violin Plot),是一种集成了箱线图和核密度图特征的数据可视化图形,用于展示多组数据的分布情况和概率密度。

小提琴图的作用:

1.显示数据分布:小提琴图能够清晰地展示数据的分布情况,包括数据的中位数、四分位数、离群值等统计信息。通过小提琴形状的宽度和高度,可以直观地比较不同组或条件下数据的分布差异。

2.比较多组数据:将不同基因在不同组织中的表达水平用小提琴图展示,以便研究它们的表达模式是否有显著差异。

3.异常值检测:在小提琴图中,可以观察到小提琴外部的离散数据点,这些数据点往往表示数据中的异常值。可以通过观察离群点的出现情况来判断数据中是否存在异常值。

小提琴图怎么做?

R语言绘制小提琴图

R 复制代码
# 代码来源:https://www.r2omics.cn/
# 加载R包,没有安装请先安装  install.packages("包名") 
library(tidyverse)

# 读取箱线图数据文件
df = read.delim("https://www.r2omics.cn/res/demodata/boxplot.txt",# 将此处换成你自己电脑里的文件
                header = T      # 指定第一行是列名
)

# 把数据转换成ggplot常用的类型(长数据)
df = df %>%
  pivot_longer(-1,names_to = "Sample",values_to = "Value")

# 绘图
p = ggplot(df,aes(x=Sample,y=Value,fill=Sample))+
  # stat_boxplot(geom = "errorbar",    # 添加误差线
  #  width=0.3)+
  geom_violin(alpha = 1,              # 透明度
              trim = T,               # 是否修剪尾巴,即将数据控制到真实的数据范围内
              scale = "count",         # 如果"area"(默认),所有小提琴都有相同的面积(在修剪尾巴之前)。如果是"count",区域与观测的数量成比例。如果是"width",所有的小提琴都有相同的最大宽度。

               )+
  theme_bw()+                          # 主题
  theme(
    axis.text.x = element_text(angle = 90,
                               vjust = 0.5
    )       # x轴刻度改为倾斜90度,防止名称重叠
  )
p

箱线图和小提琴图合并

R 复制代码
# 其实就是在小提琴的图层下再画一个箱线图
p +
  geom_boxplot(width=0.16,
               fill="white",
               outlier.alpha = 0
              )

添加显著性标签

R 复制代码
library(ggsignif)  # 用于添加显著性标签

p + geom_signif(                         # 添加显著性标签
    comparisons=list(c("Sample1","Sample2"),c("Sample3","Sample4")), # 选择你想在哪组上添加标签
    step_increase = 0.1,
    test="t.test",                     # "t 检验,比较两组(参数)" = "t.test","Wilcoxon 符号秩检验,比较两组(非参数)" = "wilcox.test"
    test.args = list("var.equal" = T), # 等方差 
    map_signif_level=F                 # 标签样式F为数字,T为*号
  )
相关推荐
92year3 小时前
用Google ADK从零搭一个能调工具的AI Agent:Python实操全过程
python·ai·mcp
woxihuan1234563 小时前
SQL删除数据时存在依赖关系_设置外键级联删除ON DELETE
jvm·数据库·python
Jetev3 小时前
如何确定SQL字段是否为空_使用IS NULL与IS NOT NULL
jvm·数据库·python
蛐蛐蛐4 小时前
昇腾910B4上安装新版本CANN的正确流程
人工智能·python·昇腾
m0_702036534 小时前
mysql如何处理不走索引的OR查询_使用UNION ALL优化重写
jvm·数据库·python
沪漂阿龙4 小时前
AI大模型面试题:线性回归是什么?最小二乘法、平方误差、正规方程、Ridge、Lasso 一文讲透
人工智能·机器学习·线性回归·最小二乘法
2401_846339564 小时前
MySQL在云环境如何选择存储类型_SSD与高性能云盘配置建议
jvm·数据库·python
2601_957780845 小时前
Claude 4.6 对阵 GPT-5.4:2026 开发者大模型 API 选型深度解析
人工智能·python·gpt·ai·claude
2601_957780845 小时前
GPT-5.5 深度解析:2026年4月OpenAI旗舰模型的技术跨越与商业决策指南
大数据·人工智能·python·gpt·openai
zhaoyong2225 小时前
SQL如何统计每个用户的首次行为时间_MIN聚合与分组
jvm·数据库·python