【R语言】概率密度图

概率密度图是用来表示连续型数据的分布情况的一种图形化方法。它通过在数据的取值范围内绘制一条曲线来描述数据的分布情况,曲线下的面积代表了在该范围内观察到某一数值的概率。具体来说,对于给定的连续型数据,概率密度图会使用核密度估计(Kernel Density Estimation,KDE)等方法来估计数据的概率密度函数。然后,在数据的取值范围内绘制一条平滑的曲线,曲线在不同取值处的高度表示了该取值出现的概率密度,即在该取值附近观察到数据点的频率。

概率密度图通常用于比较不同组或不同条件下连续型数据的分布情况。在这个图中,不同组或条件的密度曲线以不同的颜色或图案进行区分,使得用户可以直观地比较它们的分布形状、中心趋势以及离散程度。

代码如下:

R 复制代码
library(ggplot2)
library(cowplot)
library(gridExtra)

# 第一个图,绘制了 iris 数据集中 Sepal.Length 与 Sepal.Width 的散点图,根据 Species 分组着色
plot1 <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + 
  geom_point() +
  theme_minimal_grid(12)

# 第二个图,绘制了 iris 数据集中 Sepal.Length 的密度图,根据 Species 填充颜色
plot2 <- ggplot(iris, aes(Sepal.Length, fill = Species)) + 
  geom_density(alpha = 0.5) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
  theme_minimal_hgrid(12)

# 使用 grid.arrange() 函数将 plot1 和 plot2 组合在一起。nrow 参数指定了行数为 2,即两个图形将竖直排列。heights 参数指定了每行的高度,这里使用了相等的高度
combined_plot <- grid.arrange(plot1, plot2, nrow = 2, heights = c(1, 1))

# 展示组合后的图
combined_plot
相关推荐
波诺波10 小时前
通用装饰器示例
开发语言·python
沐知全栈开发10 小时前
Maven POM 简介
开发语言
艾莉丝努力练剑11 小时前
【C++模版进阶】如何理解非类型模版参数、特化与分离编译?
linux·开发语言·数据结构·c++·stl
kaikaile199511 小时前
MATLAB实现自适应卡尔曼滤波(AKF)
开发语言·matlab
立志成为大牛的小牛11 小时前
数据结构——二十五、邻接矩阵(王道408)
开发语言·数据结构·c++·学习·程序人生
007php00711 小时前
猿辅导Java面试真实经历与深度总结(二)
java·开发语言·python·计算机网络·面试·职场和发展·golang
惊鸿.Jh11 小时前
C++可变参数模板
开发语言·python
素素.陈11 小时前
向RAGFlow中上传文档到对应的知识库
开发语言·python
万粉变现经纪人14 小时前
如何解决 pip install -r requirements.txt 私有索引未设为 trusted-host 导致拒绝 问题
开发语言·python·scrapy·flask·beautifulsoup·pandas·pip
qq_4798754314 小时前
C++ std::Set<std::pair>
开发语言·c++