利用R绘制箱线图

绘制箱线图

利用R语言绘制箱线图非常方便,主要通过 boxplot() 函数或ggplot2包实现。

注意:

箱线图中的箱子表示数据的四分位距(IQR);

箱体内的线表示中位数;

须线通常延伸到1.5倍IQR范围内的最远数据点;

超出须线的点被视为异常值。

欢迎大家在评论区留言或私信,交流学习心得或学习R的过程中遇到的问题。感谢大家的支持和关注,您的支持是我创作的最大动力。

目录

1.利用boxplot绘制

R自带了很多数据集,例如 mtcars,我们可以用其中的 mpg(英里/加仑)数据来绘制箱线图。

  • 绘制基本的箱线图
go 复制代码
# 查看数据前几行
head(mtcars)

# 绘制基础的箱线图
boxplot(mtcars$mpg,
        main = "汽车每加仑里程箱线图", # 标题
        ylab = "英里/加仑",           # Y轴标签
        xlab = "总样本",              # X轴标签
        col = "lightblue")            # 箱体颜色

出图效果如下:

  • 按分组绘制箱线图
    比较不同气缸数(cyl)汽车的每加仑里程。
go 复制代码
# 将cyl转换为因子,以便正确分组
mtcars$cyl <- as.factor(mtcars$cyl)

# 按分组绘制
boxplot(mpg ~ cyl, 
        data = mtcars,
        main = "不同气缸数的汽车每加仑里程",
        xlab = "气缸数",
        ylab = "英里/加仑",
        col = c("lightgreen", "lightblue", "lightyellow"))

出图效果如下:

2.利用ggplot2绘制

首先安装并加载包

go 复制代码
install.packages("ggplot2")  # 如果尚未安装
library(ggplot2)
  • 基础箱线图
go 复制代码
ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_boxplot(fill = "lightblue", alpha = 0.7) +  # alpha控制透明度
  labs(title = "不同气缸数的汽车每加仑里程",
       x = "气缸数",
       y = "英里/加仑") +
  theme_minimal()  # 使用简洁主题

出图效果如下:

  • 添加数据点(抖动点)
    为了显示原始数据的分布,可以在箱线图上叠加数据点。
go 复制代码
ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_boxplot(fill = "lightblue", outlier.colour = "red") +  # 异常点标为红色
  geom_jitter(width = 0.2, alpha = 0.6, color = "blue") +     # 添加抖动点
  labs(title = "箱线图与数据点",
       x = "气缸数",
       y = "英里/加仑") +
  theme_classic()

出图效果如下:

3.其他

  • 水平箱线图

只需在 boxplot() 中添加 horizontal = TRUE 参数,或在 ggplot2 中使用 coord_flip()。

go 复制代码
# 基础方法
boxplot(mpg ~ cyl, data = mtcars, horizontal = TRUE)

# ggplot2方法
ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_boxplot(fill = "lightcoral") +
  coord_flip() +  # 坐标轴翻转
  labs(title = "水平箱线图")

出图效果如下:

  • 自定义
    自定义颜色和外观
go 复制代码
ggplot(mtcars, aes(x = cyl, y = mpg, fill = cyl)) +  # 按cyl填充颜色
  geom_boxplot(alpha = 0.8, 
               outlier.shape = 16,    # 异常点形状
               outlier.size = 2,      # 异常点大小
               outlier.color = "red") +
  scale_fill_brewer(palette = "Set2") +  # 使用ColorBrewer调色板
  labs(title = "自定义颜色的箱线图") +
  theme_bw() +  # 黑白主题
  theme(legend.position = "none")  # 隐藏图例

出图效果如下:

  • 不显示异常值的箱线图
go 复制代码
boxplot(mpg ~ cyl, data = mtcars, outline = FALSE)  # outline = FALSE

# 在ggplot2中
ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_boxplot(fill = "lightblue", outlier.shape = NA)  # outlier.shape = NA

出图效果如下:

※※大家在使用的时候遇到任何问题欢迎留言,您的支持是我创作的最大动力。※※

相关推荐
wheeldown4 小时前
【Linux】Linux 进程通信:System V 共享内存(最快方案)C++ 封装实战 + 通信案例,4 类经典 Bug 快速修复
linux·运维·服务器·开发语言
小年糕是糕手4 小时前
【数据结构】双向链表“0”基础知识讲解 + 实战演练
c语言·开发语言·数据结构·c++·学习·算法·链表
将车2444 小时前
C++实现二叉树搜索树
开发语言·数据结构·c++·笔记·学习
梵得儿SHI5 小时前
Java 反射机制核心类详解:Class、Constructor、Method、Field
java·开发语言·反射·class·constructor·java反射·java反射机制
hbqjzx5 小时前
记录一个自动学习的脚本开发过程
开发语言·javascript·学习
Sirens.5 小时前
Java核心概念:抽象类、接口、Object类深度剖析
java·开发语言·github
程序员阿鹏6 小时前
49.字母异位词分组
java·开发语言·leetcode
天桥下的卖艺者6 小时前
R语言手搓一个计算生存分析C指数(C-index)的函数算法
c语言·算法·r语言
Yurko136 小时前
【C语言】基本语法结构(上篇)
c语言·开发语言·学习