【R语言】概率密度图

概率密度图是用来表示连续型数据的分布情况的一种图形化方法。它通过在数据的取值范围内绘制一条曲线来描述数据的分布情况,曲线下的面积代表了在该范围内观察到某一数值的概率。具体来说,对于给定的连续型数据,概率密度图会使用核密度估计(Kernel Density Estimation,KDE)等方法来估计数据的概率密度函数。然后,在数据的取值范围内绘制一条平滑的曲线,曲线在不同取值处的高度表示了该取值出现的概率密度,即在该取值附近观察到数据点的频率。

概率密度图通常用于比较不同组或不同条件下连续型数据的分布情况。在这个图中,不同组或条件的密度曲线以不同的颜色或图案进行区分,使得用户可以直观地比较它们的分布形状、中心趋势以及离散程度。

代码如下:

R 复制代码
library(ggplot2)
library(cowplot)
library(gridExtra)

# 第一个图,绘制了 iris 数据集中 Sepal.Length 与 Sepal.Width 的散点图,根据 Species 分组着色
plot1 <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + 
  geom_point() +
  theme_minimal_grid(12)

# 第二个图,绘制了 iris 数据集中 Sepal.Length 的密度图,根据 Species 填充颜色
plot2 <- ggplot(iris, aes(Sepal.Length, fill = Species)) + 
  geom_density(alpha = 0.5) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
  theme_minimal_hgrid(12)

# 使用 grid.arrange() 函数将 plot1 和 plot2 组合在一起。nrow 参数指定了行数为 2,即两个图形将竖直排列。heights 参数指定了每行的高度,这里使用了相等的高度
combined_plot <- grid.arrange(plot1, plot2, nrow = 2, heights = c(1, 1))

# 展示组合后的图
combined_plot
相关推荐
趙卋傑5 分钟前
测试开发场景下常见的 MCP 服务
开发语言·python·测试工具·ai编程
@atweiwei5 分钟前
langchainrust:Rust 版 LangChain 框架(LLM+Agent+RAG)
开发语言·rust·langchain·agent·向量数据库·rag
阿里嘎多学长7 分钟前
2026-04-11 GitHub 热点项目精选
开发语言·程序员·github·代码托管
yugi9878387 分钟前
基于最大信息熵的粒子群优化算法图像分割(MATLAB实现)
开发语言·算法·matlab
yaoxin5211237 分钟前
376. Java IO API - 使用 Globbing 和自定义 Filter 过滤目录内容
java·开发语言·python
飞翔的SA16 分钟前
全程 Python:无需离开 Python 即可实现光速级 CUDA 加速,无需c++支持
开发语言·c++·python·nvidia·cuda
冰暮流星23 分钟前
javascript之dom访问css
开发语言·javascript·css
北风toto23 分钟前
java进制转换方法
java·开发语言·python
楼田莉子30 分钟前
设计模式:创建型设计模式简介
服务器·开发语言·c++·设计模式
好家伙VCC33 分钟前
**基于Colab的高效Python深度学习开发流程:从环境配置到模型部署全流程实战**在当前人工智
java·开发语言·python·深度学习