概率分布是描述随机变量可能取值及其相应概率的数学函数或规律。它提供了随机变量在各个取值上的概率信息,用于表示随机现象的不确定性和随机性。
概率分布可以分为两类:离散概率分布和连续概率分布。
1. 离散概率分布: 适用于描述离散随机变量的概率分布。它列举了随机变量可能的取值及其对应的概率。常见的例子包括二项分布、泊松分布等。
离散概率分布的例子:二项分布
二项分布: 描述在一系列独立的重复试验中成功次数的概率分布。例如,一次抛硬币,如果我们关心的是正面朝上的次数,可以用二项分布来建模。
假设进行了n次抛硬币试验,每次试验有两个可能结果(正面或反面),成功定义为正面朝上。成功的次数(k)可以取0、1、2、...、n。那么,成功次数的概率分布就是二项分布。
上图展示了一个二项分布(Binomial Distribution)的概率质量函数(PMF)图,其中进行了10次独立的二元试验,每次成功的概率为0.5。
2. 连续概率分布: 适用于描述连续随机变量的概率分布。它通过概率密度函数(Probability Density Function, PDF)来表示随机变量在某一取值附近的概率。常见的例子包括正态分布、指数分布等。
连续概率分布的例子:正态分布
正态分布: 描述自然界中许多随机变量的分布,也被称为高斯分布。它是一个连续概率分布,通常以钟形曲线的形式呈现。
正态分布由两个参数完全描述:均值(μ)和标准差(σ)。曲线的峰值位于均值处,标准差决定了曲线的宽度。
例如,人的身高可以近似地服从正态分布。如果我们知道某群体的平均身高和标准差,我们可以使用正态分布来估计不同身高区间的概率。
这是身高的正态分布概率密度函数图。在这个例子中,平均身高μ=170 厘米,标准差 σ=5 厘米。横轴表示身高范围,纵轴表示概率密度。正态分布的曲线呈钟形,最高点对应于平均身高,标准差决定了曲线的宽度。
这两个例子分别展示了离散概率分布和连续概率分布在实际问题中的应用。概率分布的性质包括概率的非负性(所有概率值都是非负的)、概率之和或积分为1。通过概率分布,我们可以对随机变量的行为和趋势进行建模,以便更好地理解和分析与随机性相关的现象。