Posison Distribution

泊松分布 (Poisson Distribution)

泊松分布是概率论中的一个重要离散分布,描述单位时间或单位空间内随机事件发生的次数,假设事件是独立的且平均发生率是已知的。


定义

泊松分布的概率质量函数 (PMF) 为:
P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots P(X=k)=k!λke−λ,k=0,1,2,...

  • X X X:随机变量,表示单位时间或单位空间内事件发生的次数。
  • k k k:事件发生的具体次数(非负整数)。
  • λ \lambda λ:事件发生的平均次数(泊松分布的参数)。
  • e e e:自然对数的底数,约等于 2.718 2.718 2.718。

性质

  1. 期望和方差
    E [ X ] = λ , V a r ( X ) = λ \mathbb{E}[X] = \lambda, \quad \mathrm{Var}(X) = \lambda E[X]=λ,Var(X)=λ

    泊松分布的期望值和方差均等于参数 (\lambda)。

  2. 稀疏事件建模:泊松分布常用于建模稀疏事件(事件发生概率低,但可能次数多)。

  3. 无上界性:虽然泊松分布是离散分布,但事件发生次数 (k) 没有上限(但概率会迅速趋近于 0)。

  4. 加法性 :若 X 1 ∼ Poisson ( λ 1 ) X_1 \sim \text{Poisson}(\lambda_1) X1∼Poisson(λ1), X 2 ∼ Poisson ( λ 2 ) X_2 \sim \text{Poisson}(\lambda_2) X2∼Poisson(λ2),且 X 1 X_1 X1和 X 2 X_2 X2 独立,则:
    X 1 + X 2 ∼ Poisson ( λ 1 + λ 2 ) X_1 + X_2 \sim \text{Poisson}(\lambda_1 + \lambda_2) X1+X2∼Poisson(λ1+λ2)


适用条件

  1. 独立性:单位时间/空间内事件的发生是独立的。
  2. 均匀性:事件发生的平均速率 (\lambda) 是固定的。
  3. 单事件性:在极小的时间间隔内,只能发生一次事件。

例子

例子 1:客户到达速率

某银行的客户到达速率为每分钟 2 2 2人 ( λ = 2 (\lambda = 2 (λ=2)。假设客户到达服从泊松分布:

  • 问题:一分钟内没有客户到达的概率是多少?

    解答
    P ( X = 0 ) = λ 0 e − λ 0 ! = 2 0 e − 2 1 = e − 2 ≈ 0.1353 P(X = 0) = \frac{\lambda^0 e^{-\lambda}}{0!} = \frac{2^0 e^{-2}}{1} = e^{-2} \approx 0.1353 P(X=0)=0!λ0e−λ=120e−2=e−2≈0.1353

    结果:一分钟内没有客户到达的概率约为 (13.53%)。


例子 2:网页访问量

某网站的访问量平均每小时为 10 10 10 次 ( λ = 10 (\lambda = 10 (λ=10)。假设访问次数服从泊松分布:

  • 问题:一小时内正好有 (15) 次访问的概率是多少?

    解答
    P ( X = 15 ) = λ 15 e − λ 15 ! = 1 0 15 e − 10 15 ! P(X = 15) = \frac{\lambda^{15} e^{-\lambda}}{15!} = \frac{10^{15} e^{-10}}{15!} P(X=15)=15!λ15e−λ=15!1015e−10

    使用计算工具计算得:
    P ( X = 15 ) ≈ 0.0347 P(X = 15) \approx 0.0347 P(X=15)≈0.0347

    结果 :一小时内正好有 15 15 15 次访问的概率约为 3.47 % 3.47\% 3.47%。


例子 3:电话呼叫

某呼叫中心每小时接到的呼叫数平均为 6 6 6 次 l a m b d a = 6 lambda = 6 lambda=6。假设呼叫次数服从泊松分布:

  • 问题 :一小时内接到超过 8 8 8 次呼叫的概率是多少?

    解答
    P ( X > 8 ) = 1 − P ( X ≤ 8 ) = 1 − ∑ k = 0 8 P ( X = k ) P(X > 8) = 1 - P(X \leq 8) = 1 - \sum_{k=0}^8 P(X = k) P(X>8)=1−P(X≤8)=1−∑k=08P(X=k)

    逐项计算 P ( X = k ) P(X = k) P(X=k),或直接使用计算工具得:
    P ( X > 8 ) ≈ 0.194 P(X > 8) \approx 0.194 P(X>8)≈0.194

    结果 :一小时内接到超过 8 8 8 次呼叫的概率约为 19.4 % 19.4\% 19.4%。


泊松分布与其他分布的关系

  1. 与二项分布的关系

    当二项分布的试验次数 n n n 很大,单次成功概率 p p p 很小,且 n p = λ np = \lambda np=λ 为常数时,二项分布可近似为泊松分布:
    P ( X = k ) = ( n k ) p k ( 1 − p ) n − k ≈ λ k e − λ k ! P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \approx \frac{\lambda^k e^{-\lambda}}{k!} P(X=k)=(kn)pk(1−p)n−k≈k!λke−λ

  2. 与指数分布的关系

    泊松过程中的事件间隔时间服从指数分布。如果事件发生的速率为 l a m b d a lambda lambda,则事件间隔时间 T T T 的概率密度函数为:
    f T ( t ) = λ e − λ t , t ≥ 0 f_T(t) = \lambda e^{-\lambda t}, \quad t \geq 0 fT(t)=λe−λt,t≥0


总结

泊松分布在实际生活中应用广泛,包括:

  • 客户到达次数
  • 事故发生次数
  • 电话呼叫数量
  • 射线探测计数

它适合描述独立稀疏事件的发生次数,是统计学、工程学、管理科学等领域的重要工具。

相关推荐
适应规律14 小时前
强化学习笔记(赵世钰)
笔记·线性代数·概率论
Zero1 天前
机器学习概率论与统计学--(8)概率论:数字特征
机器学习·概率论·随机变量·统计学·方差·协方差·期望
Zero1 天前
机器学习概率论与统计学--(9)统计学:参数估计
机器学习·概率论·统计学·矩估计·最大似然估计·点估计
R语言爱好者2 天前
对比两点分布、二项分布和泊松分布,几何分布,超几何分布之间的区别
概率论·高中数学
bulingg3 天前
L1与L2正则化的差异
线性代数·矩阵·概率论
皮蛋瘦肉熬不成粥4 天前
MES(The Measures of Effect Size )工具箱的使用
matlab·概率论
我要学好英语4 天前
概率密度——分布、期望、方差和协方差
深度学习·概率论·概率密度·方差·协方差·期望·分布
我要学好英语4 天前
概率法则——贝叶斯定理
深度学习·概率论·贝叶斯定理
Eloudy5 天前
贝叶斯定律的内涵
概率论
Zero5 天前
机器学习概率论与统计学--(6)概率论:连续分布
机器学习·概率论·统计学·概率密度函数·连续分布