多维高斯分布

高斯分布(Gaussian Distribution)

高斯分布,又称正态分布,是一种最常见的概率分布形式,广泛应用于统计学、机器学习和自然科学等领域。


高斯分布的概率密度函数(PDF)

对于给定的均值 μ 和方差 ,一维高斯分布的概率密度函数为:

其中:

  • x: 随机变量(输入数据点)
  • μ: 均值(mean),表示高斯分布的中心
  • : 方差(variance),表示数据的离散程度
  • σ: 标准差(standard deviation),即
  • exp: 自然指数函数(e≈2.718 的幂函数)

特点:

  1. 对称性:关于均值 μ\muμ 对称。
  2. 钟形曲线 :图形呈钟形,两端逐渐趋近于零但不会到达零。
  3. 68-95-99.7 法则
    • 68% 的数据位于均值 ±1σ内
    • 95% 的数据位于均值 ±2σ内
    • 99.7% 的数据位于均值 ±3σ内

多维高斯分布(Multivariate Gaussian Distribution)

在高维空间中,高斯分布的概念可以推广到多维情况,其概率密度函数为:

其中:

  • x: d-维向量,表示输入数据点
  • μ: d-维向量,表示均值向量(中心位置)
  • Σ: 协方差矩阵,描述了数据的分布形态
  • ∣Σ∣: 协方差矩阵的行列式
  • : 协方差矩阵的逆
  • : x 与均值之差的转置

高斯分布的图示

  1. 一维高斯分布

    • 形状为单峰的钟形曲线。
  2. 二维高斯分布

    • 在二维空间中,高斯分布呈现椭圆等高线的形状。椭圆的方向和形状由协方差矩阵 Σ 决定。
  3. 多维高斯分布

    • 在高维空间中,分布会呈现类似于高维椭圆的形状。

高斯分布的意义

  1. 自然现象的拟合:许多自然现象(如身高、体重、考试成绩)服从正态分布。
  2. 机器学习:在聚类算法(如高斯混合模型,GMM)和降维方法(如主成分分析,PCA)中常用。
  3. 统计推断:正态分布在最大似然估计、贝叶斯推断中有着重要的应用。
  4. 误差分析:根据中心极限定理,独立随机变量的和近似服从正态分布。

Python实现高斯分布

下面是用 scipymatplotlib 库生成和绘制高斯分布的示例代码:

复制代码
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 生成一维高斯分布的数据
mu, sigma = 0, 1  # 均值和标准差
x = np.linspace(-5, 5, 1000)  # 数据点
y = norm.pdf(x, mu, sigma)  # 计算概率密度

# 绘制一维高斯分布
plt.plot(x, y, label=f'N(μ={mu}, σ={sigma})')
plt.title("1D Gaussian Distribution")
plt.xlabel("x")
plt.ylabel("Probability Density")
plt.legend()
plt.grid()
plt.show()
相关推荐
张艾拉 Fun AI Everyday3 分钟前
Gartner 2025年新兴技术成熟度曲线
人工智能
菜鸟‍8 分钟前
【论文学习】大语言模型(LLM)论文
论文阅读·人工智能·学习
默 语44 分钟前
AI驱动软件测试全流程自动化:从理论到实践的深度探索
运维·人工智能·驱动开发·ai·自动化·ai技术·测试全流程
说私域1 小时前
基于开源AI大模型、AI智能名片与S2B2C商城小程序的购物中心精准零售数据架构研究
人工智能·小程序·开源
key061 小时前
大模型在网络安全领域的应用与评测
网络·人工智能·web安全
北京耐用通信1 小时前
破解工业通信瓶颈:耐达讯自动化Modbus转Profinet网关连接驱动器的奥秘
人工智能·物联网·网络协议·自动化·信息与通信
应用市场2 小时前
OpenCV进阶:图像变换、增强与特征检测实战
人工智能·opencv·计算机视觉
说私域2 小时前
开源链动2+1模式、AI智能名片与S2B2C商城小程序:社群经济的数字化重构路径
人工智能·小程序·开源
rengang662 小时前
智能化的重构建议:大模型分析代码结构,提出可读性和性能优化建议
人工智能·性能优化·重构·ai编程
灵遁者书籍作品2 小时前
语言的拓扑学约束公理:语言对实在的描述具有拓扑不变量——某些真理必须通过悖论、沉默或隐喻表达
人工智能·计算机视觉