利用R绘制小提琴图

小提琴图

小提琴图是一种用于显示数值数据分布的图表类型。它的形状类似于小提琴,因此得名。与箱线图只能显示有限的统计量(中位数、四分位数等)不同,小提琴图能够展示数据的完整概率密度分布。本文结合R内置数据diamonds,利用ggplot2实现绘图。

注意: 小提琴图是数据可视化中一种非常强大的工具,它结合了箱线图和密度图的优点,能够提供比传统箱线图更丰富的数据分布信息。

欢迎大家在评论区留言或私信,交流学习心得或学习R的过程中遇到的问题。感谢大家的支持和关注,您的支持是我创作的最大动力。

目录

1.diamonds数据集介绍

diamonds 数据集是 R 语言中 ggplot2 包内置的一个经典数据集,包含了 53,940 颗钻石的物理属性和价格信息。这个数据集经常被用于数据可视化教学、统计分析和机器学习演示。

go 复制代码
# 加载数据集
library(ggplot2)
data(diamonds)
# 查看基本信息
str(diamonds)
# 输出:tibble [53,940 × 10] (S3: tbl_df/tbl/data.frame)
# 查看前几行
head(diamonds)

数据集包含 10 个变量,53,940 个观测值。主要变量解释如下:

变量 解释
price 钻石价格(美元)
carat 克拉重量(1克拉 = 0.2克)
cut 切工质量
color 颜色等级
clarity 净度等级

2.绘制小提琴图

代码如下:

go 复制代码
library(ggplot2)
# 示例1:精美的箱线图+小提琴图+抖动点
p1 <- ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
  # 1. 小提琴图,显示分布密度,alpha设置透明度
  geom_violin(alpha = 0.7, width = 0.8) +
  # 2. 箱线图,用白色突出显示关键统计量
  geom_boxplot(width = 0.2, alpha = 0.7, color = "grey30", outlier.shape = NA) +
  # 3. 抖动点,避免点重叠,增加数据感
  geom_jitter(shape = 16, size = 0.8, alpha = 0.1, width = 0.2) +
  # 4. 使用经典的Viridis色盲友好配色
  scale_fill_viridis_d(option = "plasma") +
  # 5. 设置标签和标题
  labs(
    title = "钻石价格按切工等级的分布",
    subtitle = "结合了小提琴图、箱线图和原始数据点",
    x = "切工等级",
    y = "价格 (美元)",
    caption = "数据源:R datasets::diamonds"
  ) +
  # 6. 使用 minimalist 主题,使图形更简洁
  theme_minimal() +
  # 7. 微调主题,例如标题居中、调整图例位置
  theme(
    plot.title = element_text(face = "bold", hjust = 0.5),
    plot.subtitle = element_text(hjust = 0.5),
    legend.position = "none" # 移除图例,因为x轴已经标明了类别
  )

# 显示图形
print(p1)

出图效果如下:

※※大家在使用的时候遇到任何问题欢迎留言,您的支持是我创作的最大动力。※※

相关推荐
知识分享小能手36 分钟前
R语言入门学习教程,从入门到精通,R语言数据计算与分组统计(9)
开发语言·学习·r语言
light blue bird5 小时前
设备数据变化上传图表数据汇总组件
大数据·前端·信息可视化
码界筑梦坊6 小时前
116-基于Flask的健身房会员锻炼数据可视化分析系统
python·信息可视化·数据分析·flask·毕业设计
财经资讯数据_灵砚智能7 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月2日
人工智能·python·信息可视化·自然语言处理·ai编程
财经资讯数据_灵砚智能8 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月3日
大数据·人工智能·python·信息可视化·自然语言处理
超级码力66616 小时前
【Latex文件架构】Latex文件架构模板
算法·数学建模·信息可视化
图扑可视化17 小时前
基于图扑软件 HT 2.5D 组态可视化技术的场景实现
信息可视化·数字孪生·组态软件
Elastic 中国社区官方博客19 小时前
ES|QL METRICS_INFO 和 TS_INFO:为你的时间序列数据建立目录
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索
Alex艾力的IT数字空间1 天前
再思“把事情做对”与“把事情做好”的辩证关系与先后顺序
信息可视化·需求分析·学习方法·抽象工厂模式·远程工作·原型模式·中介者模式
老黄编程1 天前
大型工地实时数据处理与三维重构系统方案
人工智能·ubuntu·信息可视化·重构·入侵检测·大型数据集中处理