【R语言】概率密度图

概率密度图是用来表示连续型数据的分布情况的一种图形化方法。它通过在数据的取值范围内绘制一条曲线来描述数据的分布情况,曲线下的面积代表了在该范围内观察到某一数值的概率。具体来说,对于给定的连续型数据,概率密度图会使用核密度估计(Kernel Density Estimation,KDE)等方法来估计数据的概率密度函数。然后,在数据的取值范围内绘制一条平滑的曲线,曲线在不同取值处的高度表示了该取值出现的概率密度,即在该取值附近观察到数据点的频率。

概率密度图通常用于比较不同组或不同条件下连续型数据的分布情况。在这个图中,不同组或条件的密度曲线以不同的颜色或图案进行区分,使得用户可以直观地比较它们的分布形状、中心趋势以及离散程度。

代码如下:

R 复制代码
library(ggplot2)
library(cowplot)
library(gridExtra)

# 第一个图,绘制了 iris 数据集中 Sepal.Length 与 Sepal.Width 的散点图,根据 Species 分组着色
plot1 <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + 
  geom_point() +
  theme_minimal_grid(12)

# 第二个图,绘制了 iris 数据集中 Sepal.Length 的密度图,根据 Species 填充颜色
plot2 <- ggplot(iris, aes(Sepal.Length, fill = Species)) + 
  geom_density(alpha = 0.5) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
  theme_minimal_hgrid(12)

# 使用 grid.arrange() 函数将 plot1 和 plot2 组合在一起。nrow 参数指定了行数为 2,即两个图形将竖直排列。heights 参数指定了每行的高度,这里使用了相等的高度
combined_plot <- grid.arrange(plot1, plot2, nrow = 2, heights = c(1, 1))

# 展示组合后的图
combined_plot
相关推荐
2301_807367191 分钟前
C++中的解释器模式变体
开发语言·c++·算法
always_TT34 分钟前
C语言中的字符与字符串(char数组)
c语言·开发语言
forAllforMe1 小时前
LAN9252 从机寄存器配置--C语言举例
c语言·开发语言
weixin_537590451 小时前
《C程序设计语言》练习答案(练习1-4)
c语言·开发语言
chushiyunen1 小时前
python中的内置属性 todo
开发语言·javascript·python
麦麦鸡腿堡1 小时前
JavaWeb_请求参数,设置响应数据,分层解耦
java·开发语言·前端
2301_819414302 小时前
C++与区块链智能合约
开发语言·c++·算法
不想看见4042 小时前
Valid Parentheses栈和队列--力扣101算法题解笔记
开发语言·数据结构·c++
炸膛坦客2 小时前
单片机/C/C++八股:(十五)内存对齐、结构体内存对齐
c语言·开发语言·单片机
娇娇yyyyyy2 小时前
QT编程(13): Qt 事件机制eventfilter
开发语言·qt