【R语言】概率密度图

概率密度图是用来表示连续型数据的分布情况的一种图形化方法。它通过在数据的取值范围内绘制一条曲线来描述数据的分布情况,曲线下的面积代表了在该范围内观察到某一数值的概率。具体来说,对于给定的连续型数据,概率密度图会使用核密度估计(Kernel Density Estimation,KDE)等方法来估计数据的概率密度函数。然后,在数据的取值范围内绘制一条平滑的曲线,曲线在不同取值处的高度表示了该取值出现的概率密度,即在该取值附近观察到数据点的频率。

概率密度图通常用于比较不同组或不同条件下连续型数据的分布情况。在这个图中,不同组或条件的密度曲线以不同的颜色或图案进行区分,使得用户可以直观地比较它们的分布形状、中心趋势以及离散程度。

代码如下:

R 复制代码
library(ggplot2)
library(cowplot)
library(gridExtra)

# 第一个图,绘制了 iris 数据集中 Sepal.Length 与 Sepal.Width 的散点图,根据 Species 分组着色
plot1 <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + 
  geom_point() +
  theme_minimal_grid(12)

# 第二个图,绘制了 iris 数据集中 Sepal.Length 的密度图,根据 Species 填充颜色
plot2 <- ggplot(iris, aes(Sepal.Length, fill = Species)) + 
  geom_density(alpha = 0.5) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
  theme_minimal_hgrid(12)

# 使用 grid.arrange() 函数将 plot1 和 plot2 组合在一起。nrow 参数指定了行数为 2,即两个图形将竖直排列。heights 参数指定了每行的高度,这里使用了相等的高度
combined_plot <- grid.arrange(plot1, plot2, nrow = 2, heights = c(1, 1))

# 展示组合后的图
combined_plot
相关推荐
玩电脑的辣条哥2 小时前
Python如何播放本地音乐并在web页面播放
开发语言·前端·python
ll7788114 小时前
LeetCode每日精进:20.有效的括号
c语言·开发语言·算法·leetcode·职场和发展
Jackson@ML6 小时前
Python数据可视化简介
开发语言·python·数据可视化
赵琳琅6 小时前
Java语言的云计算
开发语言·后端·golang
lly2024066 小时前
jQuery 杂项方法
开发语言
赵琳琅6 小时前
MDX语言的安全开发
开发语言·后端·golang
开开又心心的学嵌入式7 小时前
C语言——指针进阶应用
c语言·开发语言
开开又心心的学嵌入式7 小时前
C语言——指针基础知识
c语言·开发语言
lonelyhiker7 小时前
javascript的原型链
开发语言·javascript·原型模式
夏梓蕙8 小时前
Elixir语言的软件开发工具
开发语言·后端·golang