{ggstatsplot} 是 {ggplot2} 包的扩展,用于创建图形,其中包含信息丰富的绘图本身中包含的统计测试的详细信息。在典型的探索性数据分析工作流程中,数据可视化和统计建模是两个不同的阶段:可视化通知建模,而建模又可以建议不同的可视化方法,依此类推。 {ggstatsplot} 的中心思想很简单:以带有统计细节的图形形式将这两个阶段合二为一,这使得数据探索变得更简单、更快捷。
绘制图形如下:
代码如下所示:
R
library(ggplot2)
library(ggstatsplot)
# 设置随机数种子
set.seed(123)
# 绘制分组箱线图
ggplot(iris, aes(x = Species, y = Sepal.Length)) +
geom_boxplot() +
labs(title = "Distribution of sepal length across Iris species")#ggplot() 函数创建了一个 ggplot 对象,并使用 aes() 函数来指定 x 轴为 Species,y 轴为 Sepal.Length。然后使用 geom_boxplot() 函数添加了箱线图的几何对象。最后,使用 labs() 函数添加了标题,标题为 "Distribution of sepal length across Iris species"。
对于图中的所有统计测试,默认模板遵守统计报告的黄金标准。
gg Betweenstats() 函数具有用于重复测量设计的相同孪生函数 ggwithinstats(),其行为方式相同,但进行了一些细微调整以正确可视化重复测量设计。从下面的示例可以看出,绘图结构之间的唯一区别在于,现在组均值通过路径连接,以突出显示这些数据彼此配对的事实。
代码如下:
R
set.seed(123)
library(WRS2) # for data
library(afex) # to run ANOVA
ggwithinstats(
data = WineTasting, #data:数据集,这里使用了WineTasting
x = Wine, #x:自变量,这里是酒的类型
y = Taste, #y:因变量,这里是口味得分
title = "Wine tasting" #title:图表标题,这里是"Wine tasting"
)