概率论基础教程第5章 连续型随机变量(三)

5.5 指数随机变量

指数随机变量是一种重要的连续型随机变量,常用于描述等待时间或寿命。

定义

概率密度

如果随机变量 XXX 的密度函数为:
f(x)={λe−λxif x≥00if x<0 \boxed{f(x) = \begin{cases} \lambda e^{-\lambda x} & \text{if } x \geq 0 \\ 0 & \text{if } x < 0 \end{cases}} f(x)={λe−λx0if x≥0if x<0

其中 λ>0\lambda > 0λ>0 是参数,则称 XXX 为参数为 λ\lambdaλ 的指数随机变量

分布函数

指数随机变量的分布函数为:
F(a)=P{X⩽a}=∫0aλe−λx dx=1−e−λaa⩾0 \boxed{F(a) = P\{X \leqslant a\} = \int_0^a \lambda e^{-\lambda x} \, \mathrm{d}x = 1 - e^{-\lambda a} \qquad a \geqslant 0} F(a)=P{X⩽a}=∫0aλe−λxdx=1−e−λaa⩾0

验证

  • f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
  • ∫0∞λe−λx dx=−e−λx∣0∞=1\int_{0}^{\infty} \lambda e^{-\lambda x} \, \mathrm{d}x = -e^{-\lambda x} \big|_{0}^{\infty} = 1∫0∞λe−λxdx=−e−λx 0∞=1,满足归一性条件

期望与方差

例 5a:计算期望和方差

  1. 计算 E[Xn]E[X^n]E[Xn]
    E[Xn]=∫0∞xnλe−λx dx E[X^n] = \int_{0}^{\infty} x^n \lambda e^{-\lambda x} \, \mathrm{d}x E[Xn]=∫0∞xnλe−λxdx

    使用分部积分法(令 u=xnu = x^nu=xn,dv=λe−λx dx\mathrm{d}v = \lambda e^{-\lambda x} \, \mathrm{d}xdv=λe−λxdx):
    E[Xn]=−xne−λx∣0∞+∫0∞e−λxnxn−1 dx=nλE[Xn−1] E[X^n] = -x^n e^{-\lambda x} \big|{0}^{\infty} + \int{0}^{\infty} e^{-\lambda x} n x^{n-1} \, \mathrm{d}x = \frac{n}{\lambda} E[X^{n-1}] E[Xn]=−xne−λx 0∞+∫0∞e−λxnxn−1dx=λnE[Xn−1]

  2. 计算 E[X]E[X]E[X] (令 n=1n=1n=1):
    E[X]=1λE[X0]=1λ⋅1=1λ E[X] = \frac{1}{\lambda} E[X^{0}] = \frac{1}{\lambda} \cdot 1 = \frac{1}{\lambda} E[X]=λ1E[X0]=λ1⋅1=λ1

  3. 计算 E[X2]E[X^2]E[X2] (令 n=2n=2n=2):
    E[X2]=2λE[X]=2λ⋅1λ=2λ2 E[X^2] = \frac{2}{\lambda} E[X] = \frac{2}{\lambda} \cdot \frac{1}{\lambda} = \frac{2}{\lambda^2} E[X2]=λ2E[X]=λ2⋅λ1=λ22

  4. 计算方差
    Var(X)=E[X2]−(E[X])2=2λ2−(1λ)2=1λ2 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{2}{\lambda^2} - \left(\frac{1}{\lambda}\right)^2 \\ &= \frac{1}{\lambda^2} \end{aligned} Var(X)=E[X2]−(E[X])2=λ22−(λ1)2=λ21

结论

  • 期望:E[X]=1λ\boxed{E[X] = \frac{1}{\lambda}}E[X]=λ1
  • 方差:Var(X)=1λ2\boxed{Var(X) = \frac{1}{\lambda^2}}Var(X)=λ21

无记忆性

一个非负随机变量 XXX 称为无记忆的 (memoryless),如果:
P{X>s+t∣X>t}=P{X>s}for all s,t≥0(5.1) \boxed{P\{X > s+t \mid X > t\} = P\{X > s\} \quad \text{for all } s, t \ge 0} \tag{5.1} P{X>s+t∣X>t}=P{X>s}for all s,t≥0(5.1)

直观解释

  • 如果设备已经工作了 ttt 小时且仍在工作,则它还能再工作 sss 小时的概率,与设备刚开始工作时能工作 sss 小时的概率相同
  • 设备"忘记"了它已经工作了多长时间

式 (5.1) 等价于:
P{X>s+t}=P{X>s}P{X>t}(5.2) \boxed{P\{X > s+t\} = P\{X > s\}P\{X > t\}} \tag{5.2} P{X>s+t}=P{X>s}P{X>t}(5.2)

证明
P{X>s+t∣X>t}=P{X>s+t,X>t}P{X>t}=P{X>s+t}P{X>t} \begin{aligned} P\{X > s+t \mid X > t\} &= \frac{P\{X > s+t, X > t\}}{P\{X > t\}} \\ &= \frac{P\{X > s+t\}}{P\{X > t\}} \end{aligned} P{X>s+t∣X>t}=P{X>t}P{X>s+t,X>t}=P{X>t}P{X>s+t}

  • 对于指数分布,P{X>x}=e−λxP\{X > x\} = e^{-\lambda x}P{X>x}=e−λx

  • 代入得:
    P{X>s+t∣X>t}=P{X>s+t}P{X>t}=e−λ(s+t)e−λt=e−λs=P{X>s} \begin{aligned} P\{X > s+t \mid X > t\} &= \frac{P\{X > s+t\}}{P\{X > t\}} \\ &= \frac{e^{-\lambda(s+t)}}{e^{-\lambda t}} \\ &= e^{-\lambda s} \\ &= P\{X > s\} \end{aligned} P{X>s+t∣X>t}=P{X>t}P{X>s+t}=e−λte−λ(s+t)=e−λs=P{X>s}

所以5.2成立

对于指数随机变量:
P{X>x}=1−F(x)=e−λx P\{X > x\} = 1 - F(x) = e^{-\lambda x} P{X>x}=1−F(x)=e−λx

验证式 (5.2):
P{X>s+t}=e−λ(s+t)=e−λse−λt=P{X>s}P{X>t} P\{X > s+t\} = e^{-\lambda(s+t)} = e^{-\lambda s} e^{-\lambda t} = P\{X > s\}P\{X > t\} P{X>s+t}=e−λ(s+t)=e−λse−λt=P{X>s}P{X>t}

因此,指数随机变量是无记忆的


例题

例 5b:电话通话时长

假设电话通话时长 XXX 是参数为 λ=110\lambda = \frac{1}{10}λ=101 的指数随机变量(即平均通话时长为 10 分钟)。

(a) 等待时间超过 10 分钟的概率
P{X>10}=1−F(10)=e−λ⋅10=e−1≈0.368 P\{X > 10\} = 1 - F(10) = e^{-\lambda \cdot 10} = e^{-1} \approx 0.368 P{X>10}=1−F(10)=e−λ⋅10=e−1≈0.368

(b) 等待时间在 10 到 20 分钟之间的概率
P{10<X<20}=F(20)−F(10)=(1−e−λ⋅20)−(1−e−λ⋅10)=e−1−e−2≈0.233 \begin{aligned} P\{10 < X < 20\} &= F(20) - F(10) \\ &= (1 - e^{-\lambda \cdot 20}) - (1 - e^{-\lambda \cdot 10}) \\ &= e^{-1} - e^{-2} \approx 0.233 \end{aligned} P{10<X<20}=F(20)−F(10)=(1−e−λ⋅20)−(1−e−λ⋅10)=e−1−e−2≈0.233


例 5c:邮局问题

史密斯先生走进邮局时,发现两个职员正在接待琼斯女士和布朗先生。史密斯先生被告知,一旦处理完琼斯或布朗的事情,就开始接待他。如果职员给每位顾客服务的时间都服从参数为 λ\lambdaλ 的指数分布,求史密斯先生是最后一个办完事情的概率。

  1. 当史密斯开始接受服务时,琼斯女士和布朗先生中有一个已经离开,另一个仍在继续接受服务
  2. 由于指数分布的无记忆性,仍在接受服务的顾客(琼斯女士或布朗先生)的剩余服务时间 服从参数为 λ\lambdaλ 的指数分布,与刚开始接受服务时相同
  3. 由对称性可知,剩下的一个人在史密斯先生之前完成服务的概率为 12\frac{1}{2}21

因此,史密斯先生是最后一个办完事情的概率为 12\boxed{\frac{1}{2}}21。


例 5d:汽车电池问题

汽车在电池电量用完之前跑的英里数服从均值为 10,000 英里的指数分布。某人计划开始一个 5,000 英里的旅行,求不用更换电池就能跑完全程的概率。

  1. 服从指数分布的情况

    • 由于无记忆性,电池剩余寿命服从参数为 λ=110\lambda = \frac{1}{10}λ=101(单位:千英里)的指数分布

    • 所求概率:
      P{电池能跑完 5,000 英里}=P{X>5}=e−λ⋅5=e−0.5≈0.6065 P\{\text{电池能跑完 5,000 英里}\} = P\{X > 5\} = e^{-\lambda \cdot 5} = e^{-0.5} \approx 0.6065 P{电池能跑完 5,000 英里}=P{X>5}=e−λ⋅5=e−0.5≈0.6065

  2. 不服从指数分布的情况

    • 设 ttt 表示旅行前电池已跑过的里程数(单位:千英里)

    • 所求概率:
      P{X>t+5∣X>t}=1−F(t+5)1−F(t) P\{X > t+5 \mid X > t\} = \frac{1-F(t+5)}{1-F(t)} P{X>t+5∣X>t}=1−F(t)1−F(t+5)

    • 需要知道 ttt 的值才能计算

结论

  • 服从指数分布时:概率为 e−0.5≈0.6065e^{-0.5} \approx 0.6065e−0.5≈0.6065
  • 不服从指数分布时:需要额外信息(已跑里程 ttt)

拉普拉斯分布

拉普拉斯分布(也称为双指数分布)是指数分布的扩展。

定义

拉普拉斯随机变量的密度函数 为:
f(x)=12λe−λ∣x∣−∞<x<∞ f(x) = \frac{1}{2}\lambda e^{-\lambda|x|} \qquad -\infty < x < \infty f(x)=21λe−λ∣x∣−∞<x<∞

分布函数
F(x)={12eλxx≤01−12e−λxx>0 F(x) = \begin{cases} \frac{1}{2} e^{\lambda x} & x \le 0\\ 1 - \frac{1}{2} e^{-\lambda x} & x > 0 \end{cases} F(x)={21eλx1−21e−λxx≤0x>0

例 5e:电信信号传输

  • 传输机制
    • 当传输信息为 1 时,发送值为 2
    • 当传输信息为 0 时,发送值为 -2
    • 接收到的信号为 R=x+NR = x + NR=x+N,其中 xxx 是发送值,NNN 是噪声
  • 解码规则
    • 如果 R≥0.5R \geq 0.5R≥0.5,则解码为 1
    • 如果 R<0.5R < 0.5R<0.5,则解码为 0

当噪声为参数 λ=1\lambda = 1λ=1 的拉普拉斯随机变量时:

  1. 信息 1 被错误认为 0 的概率 (当 R<0.5R < 0.5R<0.5):
    P{N<−1.5}=12e−1.5≈0.1116 P\{N < -1.5\} = \frac{1}{2} e^{-1.5} \approx 0.1116 P{N<−1.5}=21e−1.5≈0.1116

  2. 信息 0 被错误认为 1 的概率 (当 R≥0.5R \geq 0.5R≥0.5):
    P{N≥2.5}=12e−2.5≈0.041 P\{N \geq 2.5\} = \frac{1}{2} e^{-2.5} \approx 0.041 P{N≥2.5}=21e−2.5≈0.041


危险率函数

危险率函数(hazard rate function)是可靠性工程中的重要概念。

定义

对于正值连续型随机变量 XXX(表示寿命),危险率函数定义为:
λ(t)=f(t)F‾(t),where F‾(t)=1−F(t) \boxed{\lambda(t) = \frac{f(t)}{\overline{F}(t)}, \qquad \text{where } \overline{F}(t) = 1 - F(t)} λ(t)=F(t)f(t),where F(t)=1−F(t)

考虑零件已经使用了 ttt 小时,不能继续使用 dtdtdt 小时的条件概率:
P{X∈(t,t+dt)∣X>t}=P{X∈(t,t+dt),X>t}P{X>t}=P{X∈(t,t+dt)}P{X>t}≈f(t) dtF‾(t)=λ(t) dt \begin{aligned} P\{X \in (t, t+dt) \mid X > t\} &= \frac{P\{X \in (t, t+dt), X > t\}}{P\{X > t\}} \\ &= \frac{P\{X \in (t, t+dt)\}}{P\{X > t\}} \\ &\approx \frac{f(t) \, dt}{\overline{F}(t)} \\ &= \lambda(t) \, dt \end{aligned} P{X∈(t,t+dt)∣X>t}=P{X>t}P{X∈(t,t+dt),X>t}=P{X>t}P{X∈(t,t+dt)}≈F(t)f(t)dt=λ(t)dt

因此,λ(t)\lambda(t)λ(t) 表示使用时间为 ttt 的零件不能再继续使用的条件概率强度

对于指数分布:
λ(t)=f(t)F‾(t)=λe−λte−λt=λ \lambda(t) = \frac{f(t)}{\overline{F}(t)} = \frac{\lambda e^{-\lambda t}}{e^{-\lambda t}} = \lambda λ(t)=F(t)f(t)=e−λtλe−λt=λ

结论 :指数分布的危险率函数是常数 λ\lambdaλ。

!TIP

指数分布是唯一 具有常数危险率的分布。如果 λ(t)=λ\lambda(t) = \lambdaλ(t)=λ(常数),则 F(t)=1−e−λtF(t) = 1 - e^{-\lambda t}F(t)=1−e−λt。

危险率函数 λ(s)\lambda(s)λ(s) 可以唯一确定分布函数 FFF:
∫0tλ(s) ds=∫0tf(s)1−F(s) ds=−ln⁡(1−F(s))∣0t=−ln⁡(1−F(t))+ln⁡(1−F(0))=−ln⁡(1−F(t))(因为 F(0)=0) \begin{aligned} \int_{0}^{t} \lambda(s) \, \mathrm{d}s &= \int_{0}^{t} \frac{f(s)}{1 - F(s)} \, \mathrm{d}s \\ &= -\ln(1 - F(s)) \big|_{0}^{t} \\ &= -\ln(1 - F(t)) + \ln(1 - F(0)) \\ &= -\ln(1 - F(t)) \quad (\text{因为 } F(0) = 0) \end{aligned} ∫0tλ(s)ds=∫0t1−F(s)f(s)ds=−ln(1−F(s)) 0t=−ln(1−F(t))+ln(1−F(0))=−ln(1−F(t))(因为 F(0)=0)

解得:
F(t)=1−exp⁡{−∫0tλ(s) ds}(5.4) \boxed{F(t) = 1 - \exp\left\{-\int_0^t \lambda(s) \, \mathrm{d}s\right\}} \tag{5.4} F(t)=1−exp{−∫0tλ(s)ds}(5.4)

例 5f:吸烟者死亡率

问题:各个年龄段吸烟者的死亡率是非吸烟者死亡率的两倍,这意味着什么?

  • 设 λs(t)\lambda_s(t)λs(t) 为吸烟者的危险率函数
  • 设 λn(t)\lambda_n(t)λn(t) 为非吸烟者的危险率函数
  • 条件:λs(t)=2λn(t)\lambda_s(t) = 2\lambda_n(t)λs(t)=2λn(t)

年龄为 AAA 的非吸烟者能活到年龄 BBB (A<BA < BA<B) 的概率
P{非吸烟者活到 B∣活到 A}=P{X>B}P{X>A}=exp⁡{−∫0Bλn(t) dt}exp⁡{−∫0Aλn(t) dt}=exp⁡{−∫ABλn(t) dt} \begin{aligned} P\{\text{非吸烟者活到 } B \mid \text{活到 } A\} &= \frac{P\{X > B\}}{P\{X > A\}} \\ &= \frac{\exp\left\{-\int_0^B \lambda_n(t) \, \mathrm{d}t\right\}}{\exp\left\{-\int_0^A \lambda_n(t) \, \mathrm{d}t\right\}} \\ &= \exp\left\{-\int_A^B \lambda_n(t) \, \mathrm{d}t\right\} \end{aligned} P{非吸烟者活到 B∣活到 A}=P{X>A}P{X>B}=exp{−∫0Aλn(t)dt}exp{−∫0Bλn(t)dt}=exp{−∫ABλn(t)dt}

年龄为 AAA 的吸烟者能活到年龄 BBB 的概率
P{吸烟者活到 B∣活到 A}=exp⁡{−∫ABλs(t) dt}=exp⁡{−2∫ABλn(t) dt}=[exp⁡{−∫ABλn(t) dt}]2 \begin{aligned} P\{\text{吸烟者活到 } B \mid \text{活到 } A\} &= \exp\left\{-\int_A^B \lambda_s(t) \, \mathrm{d}t\right\} \\ &= \exp\left\{-2\int_A^B \lambda_n(t) \, \mathrm{d}t\right\} \\ &= \left[\exp\left\{-\int_A^B \lambda_n(t) \, \mathrm{d}t\right\}\right]^2 \end{aligned} P{吸烟者活到 B∣活到 A}=exp{−∫ABλs(t)dt}=exp{−2∫ABλn(t)dt}=[exp{−∫ABλn(t)dt}]2

结论

  • 吸烟者能存活到给定年龄的概率是非吸烟者的相应概率的平方
  • 而不是"非吸烟者概率的一半"

具体例子

  • 如果 λn(t)=120\lambda_n(t) = \frac{1}{20}λn(t)=201(50≤t≤6050 \leq t \leq 6050≤t≤60)
  • 50 岁非吸烟者活到 60 岁的概率:e−1/2≈0.6065e^{-1/2} \approx 0.6065e−1/2≈0.6065
  • 50 岁吸烟者活到 60 岁的概率:e−1≈0.3679e^{-1} \approx 0.3679e−1≈0.3679

5.6 Γ分布

定义

如果随机变量的密度函数为:
f(x)={λe−λx(λx)α−1Γ(α)x≥00x<0 f(x) = \begin{cases} \frac{\lambda e^{-\lambda x} (\lambda x)^{\alpha - 1}}{\Gamma(\alpha)} & x \geq 0\\ 0 & x < 0 \end{cases} f(x)={Γ(α)λe−λx(λx)α−10x≥0x<0

其中 α>0\alpha > 0α>0,λ>0\lambda > 0λ>0,Γ(α)\Gamma(\alpha)Γ(α) 是 Γ 函数,则称该随机变量服从参数为 (α,λ)(\alpha, \lambda)(α,λ) 的 Γ 分布

Γ 函数定义为:
Γ(α)=∫0∞e−yyα−1 dy \Gamma(\alpha) = \int_0^\infty e^{-y} y^{\alpha-1} \, \mathrm{d}y Γ(α)=∫0∞e−yyα−1dy

性质

  1. Γ(α)=(α−1)Γ(α−1)\Gamma(\alpha) = (\alpha-1)\Gamma(\alpha-1)Γ(α)=(α−1)Γ(α−1)

首先,回顾Γ函数的定义:
Γ(α)=∫0∞e−xxα−1 dx,α>0 \Gamma(\alpha) = \int_0^\infty e^{-x} x^{\alpha-1} \, \mathrm{d}x, \quad \alpha > 0 Γ(α)=∫0∞e−xxα−1dx,α>0

我们使用分部积分法来证明递推关系。令:

  • u=xα−1u = x^{\alpha-1}u=xα−1,则 du=(α−1)xα−2 dx\mathrm{d}u = (\alpha-1)x^{\alpha-2} \, \mathrm{d}xdu=(α−1)xα−2dx
  • dv=e−x dx\mathrm{d}v = e^{-x} \, \mathrm{d}xdv=e−xdx,则 v=−e−xv = -e^{-x}v=−e−x

应用分部积分公式 ∫u dv=uv−∫v du\int u \, \mathrm{d}v = uv - \int v \, \mathrm{d}u∫udv=uv−∫vdu:

Γ(α)=∫0∞e−xxα−1 dx=[−xα−1e−x]0∞−∫0∞(−e−x)⋅(α−1)xα−2 dx=[−xα−1e−x]0∞+(α−1)∫0∞e−xxα−2 dx \begin{aligned} \Gamma(\alpha) &= \int_0^\infty e^{-x} x^{\alpha-1} \, \mathrm{d}x \\ &= \left[ -x^{\alpha-1} e^{-x} \right]_0^\infty - \int_0^\infty (-e^{-x}) \cdot (\alpha-1)x^{\alpha-2} \, \mathrm{d}x \\ &= \left[ -x^{\alpha-1} e^{-x} \right]_0^\infty + (\alpha-1) \int_0^\infty e^{-x} x^{\alpha-2} \, \mathrm{d}x \end{aligned} Γ(α)=∫0∞e−xxα−1dx=[−xα−1e−x]0∞−∫0∞(−e−x)⋅(α−1)xα−2dx=[−xα−1e−x]0∞+(α−1)∫0∞e−xxα−2dx

现在分析边界项 [−xα−1e−x]0∞\left[ -x^{\alpha-1} e^{-x} \right]_0^\infty[−xα−1e−x]0∞:

  1. 当 x→∞x \to \inftyx→∞ 时

    • xα−1x^{\alpha-1}xα−1 是多项式增长
    • e−xe^{-x}e−x 是指数衰减
    • 指数衰减比多项式增长更快,因此 xα−1e−x→0x^{\alpha-1} e^{-x} \to 0xα−1e−x→0
  2. 当 x→0+x \to 0^+x→0+ 时

    • 如果 α>1\alpha > 1α>1,则 xα−1→0x^{\alpha-1} \to 0xα−1→0
    • 如果 0<α≤10 < \alpha \leq 10<α≤1,需要更仔细分析:
      • xα−1=1x1−αx^{\alpha-1} = \frac{1}{x^{1-\alpha}}xα−1=x1−α1
      • 由于 1−α≥01-\alpha \geq 01−α≥0,当 x→0+x \to 0^+x→0+ 时,x1−α→0x^{1-\alpha} \to 0x1−α→0,但 e−x→1e^{-x} \to 1e−x→1
      • 实际上,xα−1e−x∼xα−1x^{\alpha-1} e^{-x} \sim x^{\alpha-1}xα−1e−x∼xα−1,而 α−1>−1\alpha-1 > -1α−1>−1(因为 α>0\alpha > 0α>0)
      • 这保证了积分在 x=0x=0x=0 处收敛

因此,边界项为零:

−xα−1e−x\]0∞=0 \\left\[ -x\^{\\alpha-1} e\^{-x} \\right\]_0\^\\infty = 0 \[−xα−1e−x\]0∞=0 代入得: Γ(α)=0+(α−1)∫0∞e−xxα−2 dx=(α−1)Γ(α−1) \\begin{aligned} \\Gamma(\\alpha) \&= 0 + (\\alpha-1) \\int_0\^\\infty e\^{-x} x\^{\\alpha-2} \\, \\mathrm{d}x \\\\ \&= (\\alpha-1) \\Gamma(\\alpha-1) \\end{aligned} Γ(α)=0+(α−1)∫0∞e−xxα−2dx=(α−1)Γ(α−1) 这就证明了递推关系: Γ(α)=(α−1)Γ(α−1) \\boxed{\\Gamma(\\alpha) = (\\alpha-1)\\Gamma(\\alpha-1)} Γ(α)=(α−1)Γ(α−1) > \[!NOTE

这个递推关系对所有 α>1\alpha > 1α>1 成立,因为需要 α−1>0\alpha-1 > 0α−1>0 以保证 Γ(α−1)\Gamma(\alpha-1)Γ(α−1) 有定义。


  1. Γ(n)=(n−1)!\Gamma(n) = (n-1)!Γ(n)=(n−1)!

我们使用数学归纳法来证明这个性质。

基础步骤:n=1n = 1n=1

计算 Γ(1)\Gamma(1)Γ(1):
Γ(1)=∫0∞e−xx1−1 dx=∫0∞e−x dx=[−e−x]0∞=−(0−1)=1 \begin{aligned} \Gamma(1) &= \int_0^\infty e^{-x} x^{1-1} \, \mathrm{d}x \\ &= \int_0^\infty e^{-x} \, \mathrm{d}x \\ &= \left[ -e^{-x} \right]_0^\infty \\ &= -(0 - 1) \\ &= 1 \end{aligned} Γ(1)=∫0∞e−xx1−1dx=∫0∞e−xdx=[−e−x]0∞=−(0−1)=1

而 0!=10! = 10!=1,所以:
Γ(1)=0! \Gamma(1) = 0! Γ(1)=0!

基础步骤成立。

归纳假设

假设对某个正整数 kkk,有:
Γ(k)=(k−1)! \Gamma(k) = (k-1)! Γ(k)=(k−1)!

归纳步骤

我们需要证明:
Γ(k+1)=k! \Gamma(k+1) = k! Γ(k+1)=k!

根据已证明的递推关系:
Γ(k+1)=k⋅Γ(k) \Gamma(k+1) = k \cdot \Gamma(k) Γ(k+1)=k⋅Γ(k)

代入归纳假设:
Γ(k+1)=k⋅(k−1)!=k! \Gamma(k+1) = k \cdot (k-1)! = k! Γ(k+1)=k⋅(k−1)!=k!

因此,由数学归纳法,对所有正整数 nnn:
Γ(n)=(n−1)! \boxed{\Gamma(n) = (n-1)!} Γ(n)=(n−1)!

Γ 分布常用于表示某个事件总共发生 nnn 次的等待时间

证明 :设 TnT_nTn 为第 nnn 个事件发生的时间,则:
P{Tn⩽t}=P{N(t)⩾n}=∑j=n∞e−λt(λt)jj! P\{T_n \leqslant t\} = P\{N(t) \geqslant n\} = \sum_{j=n}^{\infty} \frac{e^{-\lambda t} (\lambda t)^j}{j!} P{Tn⩽t}=P{N(t)⩾n}=j=n∑∞j!e−λt(λt)j

其中 N(t)N(t)N(t) 是 [0,t][0, t][0,t] 内发生的事件数,服从参数为 λt\lambda tλt 的泊松分布。

对上式求导得 TnT_nTn 的密度函数:

fTn(t)=ddtP{Tn≤t}=ddt∑j=n∞e−λt(λt)jj! f_{T_n}(t) = \frac{d}{dt} P\{T_n \leq t\} = \frac{d}{dt} \sum_{j=n}^{\infty} \frac{e^{-\lambda t} (\lambda t)^j}{j!} fTn(t)=dtdP{Tn≤t}=dtdj=n∑∞j!e−λt(λt)j

由于级数在 t \\geq 0 上一致收敛(因为泊松分布的概率和为1),我们可以交换导数与求和顺序:

fTn(t)=∑j=n∞ddt(e−λt(λt)jj!) f_{T_n}(t) = \sum_{j=n}^{\infty} \frac{d}{dt} \left( \frac{e^{-\lambda t} (\lambda t)^j}{j!} \right) fTn(t)=j=n∑∞dtd(j!e−λt(λt)j)

我们对通项求导:

ddt(e−λt(λt)jj!)=1j!⋅ddt(e−λt(λt)j) \frac{d}{dt} \left( \frac{e^{-\lambda t} (\lambda t)^j}{j!} \right) = \frac{1}{j!} \cdot \frac{d}{dt} \left( e^{-\lambda t} (\lambda t)^j \right) dtd(j!e−λt(λt)j)=j!1⋅dtd(e−λt(λt)j)

ddt(e−λt(λt)j)=−λe−λt(λt)j+e−λt⋅jλ(λt)j−1=λe−λt(λt)j−1(−λt+j) \frac{d}{dt} \left( e^{-\lambda t} (\lambda t)^j \right) = -\lambda e^{-\lambda t} (\lambda t)^j + e^{-\lambda t} \cdot j \lambda (\lambda t)^{j-1} = \lambda e^{-\lambda t} (\lambda t)^{j-1} \left( -\lambda t + j \right) dtd(e−λt(λt)j)=−λe−λt(λt)j+e−λt⋅jλ(λt)j−1=λe−λt(λt)j−1(−λt+j)

代入原式:

fTn(t)=∑j=n∞λe−λt(λt)j−1j!(j−λt) f_{T_n}(t) = \sum_{j=n}^{\infty} \frac{\lambda e^{-\lambda t} (\lambda t)^{j-1}}{j!} (j - \lambda t) fTn(t)=j=n∑∞j!λe−λt(λt)j−1(j−λt)

我们将求和拆成两部分:

fTn(t)=λe−λt∑j=n∞(λt)j−1j!(j−λt)=λe−λt[∑j=n∞j(λt)j−1j!−λt∑j=n∞(λt)j−1j!] f_{T_n}(t) = \lambda e^{-\lambda t} \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} (j - \lambda t) = \lambda e^{-\lambda t} \left[ \sum_{j=n}^{\infty} \frac{j (\lambda t)^{j-1}}{j!} - \lambda t \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} \right] fTn(t)=λe−λtj=n∑∞j!(λt)j−1(j−λt)=λe−λt[j=n∑∞j!j(λt)j−1−λtj=n∑∞j!(λt)j−1]

简化:

处理第一项:
∑j=n∞(λt)j−1(j−1)!=∑k=n−1∞(λt)kk!令 k=j−1 \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{(j-1)!} = \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} \quad \text{令 } k = j-1 j=n∑∞(j−1)!(λt)j−1=k=n−1∑∞k!(λt)k令 k=j−1

处理第二项:
∑j=n∞(λt)j−1j!=∑j=n∞(λt)j−1j⋅(j−1)!=∑k=n−1∞(λt)k(k+1)!令 k=j−1 \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} = \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j \cdot (j-1)!} = \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} \quad \text{令 } k = j-1 j=n∑∞j!(λt)j−1=j=n∑∞j⋅(j−1)!(λt)j−1=k=n−1∑∞(k+1)!(λt)k令 k=j−1

所以:

fTn(t)=λe−λt[∑k=n−1∞(λt)kk!−λt∑k=n−1∞(λt)k(k+1)!] f_{T_n}(t) = \lambda e^{-\lambda t} \left[ \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} - \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} \right] fTn(t)=λe−λt[k=n−1∑∞k!(λt)k−λtk=n−1∑∞(k+1)!(λt)k]

考虑第二项中的 \\lambda t \\sum_{k=n-1}\^{\\infty} \\frac{(\\lambda t)\^k}{(k+1)!}

m = k+1 ,则当 k = n-1 时, m = n ,所以:

∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)m−1m!⇒λt∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)mm! \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^{m-1}}{m!} \Rightarrow \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} k=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m−1⇒λtk=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m

因此第二项变为:

λt∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)mm! \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} λtk=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m

而第一项是:

∑k=n−1∞(λt)kk!=(λt)n−1(n−1)!+∑k=n∞(λt)kk! \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} = \frac{(\lambda t)^{n-1}}{(n-1)!} + \sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!} k=n−1∑∞k!(λt)k=(n−1)!(λt)n−1+k=n∑∞k!(λt)k

所以代入回原式:

fTn(t)=λe−λt[((λt)n−1(n−1)!+∑k=n∞(λt)kk!)−∑m=n∞(λt)mm!] f_{T_n}(t) = \lambda e^{-\lambda t} \left[ \left( \frac{(\lambda t)^{n-1}}{(n-1)!} + \sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!} \right) - \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} \right] fTn(t)=λe−λt[((n−1)!(λt)n−1+k=n∑∞k!(λt)k)−m=n∑∞m!(λt)m]

注意到两个无穷级数相同,相减为零,剩下:

fTn(t)=λe−λt⋅(λt)n−1(n−1)! f_{T_n}(t) = \lambda e^{-\lambda t} \cdot \frac{(\lambda t)^{n-1}}{(n-1)!} fTn(t)=λe−λt⋅(n−1)!(λt)n−1

即:

fTn(t)=λe−λt(λt)n−1(n−1)! f_{T_n}(t) = \frac{\lambda e^{-\lambda t} (\lambda t)^{n-1}}{(n-1)!} fTn(t)=(n−1)!λe−λt(λt)n−1


可证:

fTn(t)=ddtP(Tn≤t)=λe−λt(λt)n−1(n−1)! \boxed{ f_{T_n}(t) = \frac{d}{dt} P(T_n \leq t) = \frac{\lambda e^{-\lambda t} (\lambda t)^{n-1}}{(n-1)!} } fTn(t)=dtdP(Tn≤t)=(n−1)!λe−λt(λt)n−1

这正是参数为 (n,λ)(n, \lambda)(n,λ) 的 Γ 分布。

!NOTE

  • 当 n=1n=1n=1 时,Γ 分布退化为指数分布
  • 当 λ=12\lambda = \frac{1}{2}λ=21,α=n2\alpha = \frac{n}{2}α=2n 时,称为自由度为 nnn 的 χ2\chi^2χ2 分布

期望和方差

  • 期望:E[X]=αλ\boxed{E[X] = \frac{\alpha}{\lambda}}E[X]=λα
  • 方差:Var(X)=αλ2\boxed{Var(X) = \frac{\alpha}{\lambda^2}}Var(X)=λ2α

我们计算:

E[X]=∫0∞x⋅fX(x) dx=∫0∞x⋅λαxα−1e−λxΓ(α) dx=λαΓ(α)∫0∞xαe−λx dx \mathbb{E}[X] = \int_0^{\infty} x \cdot f_X(x) \, dx = \int_0^{\infty} x \cdot \frac{\lambda^\alpha x^{\alpha - 1} e^{-\lambda x}}{\Gamma(\alpha)} \, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha} e^{-\lambda x} \, dx E[X]=∫0∞x⋅fX(x)dx=∫0∞x⋅Γ(α)λαxα−1e−λxdx=Γ(α)λα∫0∞xαe−λxdx

u = \\lambda x ,则 x = u / \\lambda ,,, dx = du / \\lambda

代入:

∫0∞xαe−λx dx=∫0∞(uλ)αe−u⋅duλ=1λα+1∫0∞uαe−u du=Γ(α+1)λα+1 \int_0^{\infty} x^{\alpha} e^{-\lambda x} \, dx = \int_0^{\infty} \left( \frac{u}{\lambda} \right)^{\alpha} e^{-u} \cdot \frac{du}{\lambda} = \frac{1}{\lambda^{\alpha + 1}} \int_0^{\infty} u^{\alpha} e^{-u} \, du = \frac{\Gamma(\alpha + 1)}{\lambda^{\alpha + 1}} ∫0∞xαe−λxdx=∫0∞(λu)αe−u⋅λdu=λα+11∫0∞uαe−udu=λα+1Γ(α+1)

因此:

E[X]=λαΓ(α)⋅Γ(α+1)λα+1=Γ(α+1)λΓ(α) \mathbb{E}[X] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha + 1)}{\lambda^{\alpha + 1}} = \frac{\Gamma(\alpha + 1)}{\lambda \Gamma(\alpha)} E[X]=Γ(α)λα⋅λα+1Γ(α+1)=λΓ(α)Γ(α+1)

利用伽马函数的性质: \\Gamma(\\alpha + 1) = \\alpha \\Gamma(\\alpha) ,所以:

E[X]=αΓ(α)λΓ(α)=αλ \mathbb{E}[X] = \frac{\alpha \Gamma(\alpha)}{\lambda \Gamma(\alpha)} = \frac{\alpha}{\lambda} E[X]=λΓ(α)αΓ(α)=λα

E[X2]=∫0∞x2fX(x) dx=λαΓ(α)∫0∞xα+1e−λx dx \mathbb{E}[X^2] = \int_0^{\infty} x^2 f_X(x) \, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha + 1} e^{-\lambda x} \, dx E[X2]=∫0∞x2fX(x)dx=Γ(α)λα∫0∞xα+1e−λxdx

同样令 u = \\lambda x ,则 x = u / \\lambda ,,, dx = du / \\lambda ,代入:

∫0∞xα+1e−λx dx=∫0∞(uλ)α+1e−u⋅duλ=1λα+2∫0∞uα+1e−u du=Γ(α+2)λα+2 \int_0^{\infty} x^{\alpha + 1} e^{-\lambda x} \, dx = \int_0^{\infty} \left( \frac{u}{\lambda} \right)^{\alpha + 1} e^{-u} \cdot \frac{du}{\lambda} = \frac{1}{\lambda^{\alpha + 2}} \int_0^{\infty} u^{\alpha + 1} e^{-u} \, du = \frac{\Gamma(\alpha + 2)}{\lambda^{\alpha + 2}} ∫0∞xα+1e−λxdx=∫0∞(λu)α+1e−u⋅λdu=λα+21∫0∞uα+1e−udu=λα+2Γ(α+2)

所以:

E[X2]=λαΓ(α)⋅Γ(α+2)λα+2=Γ(α+2)λ2Γ(α) \mathbb{E}[X^2] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha + 2)}{\lambda^{\alpha + 2}} = \frac{\Gamma(\alpha + 2)}{\lambda^2 \Gamma(\alpha)} E[X2]=Γ(α)λα⋅λα+2Γ(α+2)=λ2Γ(α)Γ(α+2)

利用递推关系:

  • \\Gamma(\\alpha + 2) = (\\alpha + 1)\\Gamma(\\alpha + 1) = (\\alpha + 1)\\alpha \\Gamma(\\alpha)

因此:

E[X2]=(α+1)αΓ(α)λ2Γ(α)=α(α+1)λ2 \mathbb{E}[X^2] = \frac{(\alpha + 1)\alpha \Gamma(\alpha)}{\lambda^2 \Gamma(\alpha)} = \frac{\alpha(\alpha + 1)}{\lambda^2} E[X2]=λ2Γ(α)(α+1)αΓ(α)=λ2α(α+1)

Var(X)=E[X2]−(E[X])2=α(α+1)λ2−(αλ)2=α(α+1)−α2λ2=αλ2 \mathrm{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = \frac{\alpha(\alpha + 1)}{\lambda^2} - \left( \frac{\alpha}{\lambda} \right)^2 = \frac{\alpha(\alpha + 1) - \alpha^2}{\lambda^2} = \frac{\alpha}{\lambda^2} Var(X)=E[X2]−(E[X])2=λ2α(α+1)−(λα)2=λ2α(α+1)−α2=λ2α


5.7 韦布尔分布

定义

韦布尔分布的分布函数为:
F(x)={0x≤ν1−exp⁡{−(x−να)β}x>ν F(x) = \begin{cases} 0 & x \leq \nu \\ 1 - \exp\left\{-\left(\frac{x-\nu}{\alpha}\right)^{\beta}\right\} & x > \nu \end{cases} F(x)={01−exp{−(αx−ν)β}x≤νx>ν

密度函数为:
f(x)={0x⩽νβα(x−να)β−1exp⁡{−(x−να)β}x>ν f(x) = \begin{cases} 0 & x \leqslant \nu \\ \frac{\beta}{\alpha} \left( \frac{x - \nu}{\alpha} \right)^{\beta - 1} \exp \left\{ - \left( \frac{x - \nu}{\alpha} \right)^{\beta} \right\} & x > \nu \end{cases} f(x)={0αβ(αx−ν)β−1exp{−(αx−ν)β}x⩽νx>ν

应用

韦布尔分布广泛应用于:

  • 疲劳数据分析
  • 生命现象研究
  • "最弱链"模型(当对象的任何一部分毁坏时,对象寿命终止)

5.8 柯西分布

定义

柯西分布的密度函数为:
f(x)=1π11+(x−θ)2−∞<x<+∞ f(x) = \frac{1}{\pi} \frac{1}{1 + (x - \theta)^2} \qquad -\infty < x < +\infty f(x)=π11+(x−θ)21−∞<x<+∞

例题

问题 :一束光线围绕 y 轴上距离 x 轴一个单位的中心旋转,求光线指向 x 轴上点 XXX 的分布。

  • 光线与 y 轴夹角 θ\thetaθ 服从 (−π/2,π/2)(-\pi/2, \pi/2)(−π/2,π/2) 上的均匀分布

  • X=tan⁡θX = \tan\thetaX=tanθ

  • 分布函数:
    F(x)=P{X≤x}=P{tan⁡θ≤x}=P{θ≤arctan⁡x}=12+1πarctan⁡x F(x) = P\{X \leq x\} = P\{\tan\theta \leq x\} = P\{\theta \leq \arctan x\} = \frac{1}{2} + \frac{1}{\pi}\arctan x F(x)=P{X≤x}=P{tanθ≤x}=P{θ≤arctanx}=21+π1arctanx

  • 密度函数:
    f(x)=ddxF(x)=1π(1+x2) f(x) = \frac{\mathrm{d}}{\mathrm{d}x}F(x) = \frac{1}{\pi(1+x^2)} f(x)=dxdF(x)=π(1+x2)1

因此,XXX 服从柯西分布。


5.9 β分布

定义

β分布的密度函数为:
f(x)={1B(a,b)xa−1(1−x)b−10<x<10其他 f(x) = \begin{cases} \frac{1}{B(a,b)} x^{a-1} (1-x)^{b-1} & 0 < x < 1 \\ 0 & \text{其他} \end{cases} f(x)={B(a,b)1xa−1(1−x)b−100<x<1其他

其中 B(a,b)B(a,b)B(a,b) 是 β 函数:
B(a,b)=∫01xa−1(1−x)b−1 dx B(a,b) = \int_0^1 x^{a-1} (1-x)^{b-1} \, \mathrm{d}x B(a,b)=∫01xa−1(1−x)b−1dx

β 函数与 Γ 函数的关系

B(a,b)=Γ(a)Γ(b)Γ(a+b) B(a,b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)} B(a,b)=Γ(a+b)Γ(a)Γ(b)

期望和方差

  • 期望:E[X]=aa+b\boxed{E[X] = \frac{a}{a+b}}E[X]=a+ba
  • 方差:Var(X)=ab(a+b)2(a+b+1)\boxed{Var(X) = \frac{ab}{(a+b)^2(a+b+1)}}Var(X)=(a+b)2(a+b+1)ab
特性
  • 当 a=ba = ba=b 时,密度函数关于 x=12x = \frac{1}{2}x=21 对称
  • 当 a=b=1a = b = 1a=b=1 时,退化为 (0,1)(0,1)(0,1) 上的均匀分布
  • 当 b>ab > ab>a 时,密度函数向左偏斜
  • 当 a>ba > ba>b 时,密度函数向右偏斜

5.10 随机变量函数的分布

定理 7.1

设 XXX 为连续型随机变量,密度函数为 fXf_XfX。设 g(x)g(x)g(x) 为严格单调(递增或递减)且可微的函数,则随机变量 Y=g(X)Y = g(X)Y=g(X) 的密度函数为:
fY(y)={fX[g−1(y)]∣ddyg−1(y)∣if y=g(x) for some x0if y≠g(x) for any x \boxed{f_Y(y) = \begin{cases} f_X[g^{-1}(y)] \left| \frac{d}{dy} g^{-1}(y) \right| & \text{if } y = g(x) \text{ for some } x \\ 0 & \text{if } y \neq g(x) \text{ for any } x \end{cases}} fY(y)={fX[g−1(y)] dydg−1(y) 0if y=g(x) for some xif y=g(x) for any x

其中 g−1(y)g^{-1}(y)g−1(y) 是满足 g(x)=yg(x) = yg(x)=y 的 xxx 值。

证明(g(x)g(x)g(x) 递增的情况)
FY(y)=P{g(X)≤y}=P{X≤g−1(y)}=FX(g−1(y)) \begin{aligned} F_Y(y) &= P\{g(X) \leq y\} \\ &= P\{X \leq g^{-1}(y)\} \\ &= F_X(g^{-1}(y)) \end{aligned} FY(y)=P{g(X)≤y}=P{X≤g−1(y)}=FX(g−1(y))

求导得:
fY(y)=fX(g−1(y))ddyg−1(y) f_Y(y) = f_X(g^{-1}(y)) \frac{d}{dy} g^{-1}(y) fY(y)=fX(g−1(y))dydg−1(y)

由于 g−1(y)g^{-1}(y)g−1(y) 单调非降,导数非负,因此:
fY(y)=fX(g−1(y))∣ddyg−1(y)∣ f_Y(y) = f_X(g^{-1}(y)) \left| \frac{d}{dy} g^{-1}(y) \right| fY(y)=fX(g−1(y)) dydg−1(y)


例题

例 7a :Y=XnY = X^nY=Xn,其中 XXX 服从 (0,1)(0, 1)(0,1) 上的均匀分布

  • 分布函数:
    FY(y)=P{Y≤y}=P{Xn≤y}=P{X≤y1/n}=y1/n(0≤y≤1) F_Y(y) = P\{Y \leq y\} = P\{X^n \leq y\} = P\{X \leq y^{1/n}\} = y^{1/n} \quad (0 \leq y \leq 1) FY(y)=P{Y≤y}=P{Xn≤y}=P{X≤y1/n}=y1/n(0≤y≤1)

  • 密度函数:
    fY(y)=1ny1/n−1(0≤y≤1) f_Y(y) = \frac{1}{n} y^{1/n - 1} \quad (0 \leq y \leq 1) fY(y)=n1y1/n−1(0≤y≤1)

例 7b :Y=X2Y = X^2Y=X2

  • 分布函数:
    FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y) F_Y(y) = P\{Y \leq y\} = P\{-\sqrt{y} \leq X \leq \sqrt{y}\} = F_X(\sqrt{y}) - F_X(-\sqrt{y}) FY(y)=P{Y≤y}=P{−y ≤X≤y }=FX(y )−FX(−y )

  • 密度函数:
    fY(y)=12y[fX(y)+fX(−y)] f_Y(y) = \frac{1}{2\sqrt{y}} [f_X(\sqrt{y}) + f_X(-\sqrt{y})] fY(y)=2y 1[fX(y )+fX(−y )]

例 7c :Y=∣X∣Y = |X|Y=∣X∣

  • 分布函数:
    FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y) F_Y(y) = P\{Y \leq y\} = P\{-y \leq X \leq y\} = F_X(y) - F_X(-y) FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y)

  • 密度函数:
    fY(y)=fX(y)+fX(−y)(y≥0) f_Y(y) = f_X(y) + f_X(-y) \quad (y \geq 0) fY(y)=fX(y)+fX(−y)(y≥0)

例 7d :Y=XnY = X^nY=Xn,其中 XXX 是非负连续型随机变量

  • g(x)=xng(x) = x^ng(x)=xn,g−1(y)=y1/ng^{-1}(y) = y^{1/n}g−1(y)=y1/n

  • ddyg−1(y)=1ny1/n−1\frac{d}{dy} g^{-1}(y) = \frac{1}{n} y^{1/n-1}dydg−1(y)=n1y1/n−1

  • 密度函数:
    fY(y)=1ny1/n−1f(y1/n)(y≥0) f_Y(y) = \frac{1}{n} y^{1/n-1} f(y^{1/n}) \quad (y \geq 0) fY(y)=n1y1/n−1f(y1/n)(y≥0)

例 7e:对数正态分布

如果 XXX 服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则 Y=eXY = e^XY=eX 服从对数正态分布

  • g(x)=exg(x) = e^xg(x)=ex,g−1(y)=ln⁡(y)g^{-1}(y) = \ln(y)g−1(y)=ln(y)

  • ddyg−1(y)=1y\frac{d}{dy} g^{-1}(y) = \frac{1}{y}dydg−1(y)=y1

  • 密度函数:
    fY(y)=12πσyexp⁡{−(ln⁡(y)−μ)22σ2}(y>0) f_Y(y) = \frac{1}{\sqrt{2\pi}\sigma y} \exp\left\{-\frac{(\ln(y) - \mu)^2}{2\sigma^2}\right\} \quad (y > 0) fY(y)=2π σy1exp{−2σ2(ln(y)−μ)2}(y>0)


本节小结

指数随机变量

特性 公式
密度函数 f(x)={λe−λxx≥00x<0f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}f(x)={λe−λx0x≥0x<0
分布函数 F(x)={1−e−λxx≥00x<0F(x) = \begin{cases} 1 - e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}F(x)={1−e−λx0x≥0x<0
期望 E[X]=1λE[X] = \frac{1}{\lambda}E[X]=λ1
方差 Var(X)=1λ2Var(X) = \frac{1}{\lambda^2}Var(X)=λ21
无记忆性 P{X>s+t∣X>t}=P{X>s}P\{X > s+t \mid X > t\} = P\{X > s\}P{X>s+t∣X>t}=P{X>s}
危险率函数 λ(t)=λ\lambda(t) = \lambdaλ(t)=λ(常数)

其他连续分布

分布 密度函数 期望 方差
Γ分布 f(x)={λe−λx(λx)α−1Γ(α)x≥00x<0f(x) = \begin{cases} \frac{\lambda e^{-\lambda x} (\lambda x)^{\alpha - 1}}{\Gamma(\alpha)} & x \geq 0 \\ 0 & x < 0 \end{cases}f(x)={Γ(α)λe−λx(λx)α−10x≥0x<0 αλ\frac{\alpha}{\lambda}λα αλ2\frac{\alpha}{\lambda^2}λ2α
韦布尔分布 f(x)={βα(x−να)β−1e−(x−να)βx>ν0x≤νf(x) = \begin{cases} \frac{\beta}{\alpha} \left( \frac{x - \nu}{\alpha} \right)^{\beta - 1} e^{-\left( \frac{x - \nu}{\alpha} \right)^{\beta}} & x > \nu \\ 0 & x \leq \nu \end{cases}f(x)={αβ(αx−ν)β−1e−(αx−ν)β0x>νx≤ν - -
柯西分布 f(x)=1π11+(x−θ)2f(x) = \frac{1}{\pi} \frac{1}{1 + (x - \theta)^2}f(x)=π11+(x−θ)21 不存在 不存在
β分布 f(x)={1B(a,b)xa−1(1−x)b−10<x<10其他f(x) = \begin{cases} \frac{1}{B(a,b)} x^{a-1} (1-x)^{b-1} & 0 < x < 1 \\ 0 & \text{其他} \end{cases}f(x)={B(a,b)1xa−1(1−x)b−100<x<1其他 aa+b\frac{a}{a+b}a+ba ab(a+b)2(a+b+1)\frac{ab}{(a+b)^2(a+b+1)}(a+b)2(a+b+1)ab

随机变量函数的分布

  • 定理 7.1 :fY(y)=fX[g−1(y)]∣ddyg−1(y)∣f_Y(y) = f_X[g^{-1}(y)] \left| \frac{d}{dy} g^{-1}(y) \right|fY(y)=fX[g−1(y)] dydg−1(y)
  • 应用
    • Y=XnY = X^nY=Xn:fY(y)=1ny1/n−1f(y1/n)f_Y(y) = \frac{1}{n} y^{1/n-1} f(y^{1/n})fY(y)=n1y1/n−1f(y1/n)
    • Y=∣X∣Y = |X|Y=∣X∣:fY(y)=fX(y)+fX(−y)f_Y(y) = f_X(y) + f_X(-y)fY(y)=fX(y)+fX(−y)
    • 对数正态分布:fY(y)=12πσyexp⁡{−(ln⁡(y)−μ)22σ2}f_Y(y) = \frac{1}{\sqrt{2\pi}\sigma y} \exp\left\{-\frac{(\ln(y) - \mu)^2}{2\sigma^2}\right\}fY(y)=2π σy1exp{−2σ2(ln(y)−μ)2}
相关推荐
CM莫问16 小时前
详解机器学习中的马尔可夫链
人工智能·算法·机器学习·概率论·马尔可夫·马尔科夫
做cv的小昊20 小时前
【TJU】研究生应用统计学课程笔记(4)——第二章 参数估计(2.1 矩估计和极大似然估计、2.2估计量的优良性原则)
人工智能·笔记·考研·数学建模·数据分析·excel·概率论
朱阿朱2 天前
机器学习数学基础
人工智能·机器学习·概率论·高数
做cv的小昊3 天前
【TJU】研究生应用统计学课程笔记(2)——第一章 数理统计的基本知识(1.3 统计中常用的分布族)
笔记·线性代数·数学建模·矩阵·概率论·学习方法·抽象代数
做cv的小昊3 天前
【TJU】研究生应用统计学课程笔记(3)——第一章 数理统计的基本知识(1.4 正态总体的样本均值和样本方差的分布、1.5 充分统计量和完备统计量)
笔记·学习·线性代数·机器学习·数学建模·概率论
the sun343 天前
概率论:事件与概率的深度剖析
概率论
Chen--Xing8 天前
密码杂凑函数 -- 生日攻击
概率论·hash·生日攻击·crypto·杂凑函数
做cv的小昊11 天前
【TJU】研究生应用统计学课程笔记(1)——第一章 数理统计的基本知识(1.1 数理统计的基本内容、1.2 数理统计的基本概念)
笔记·线性代数·考研·数学建模·ai·矩阵·概率论
做cv的小昊12 天前
【TJU】应用统计学——第五周作业(3.1 假设检验的基本思想、3.2 单个正态总体参数的假设检验)
学习·线性代数·机器学习·数学建模·矩阵·概率论·tju
炼金士14 天前
大模型、运筹优化、概率论与控制论在港口物流智能调度中的融合应用(挑战与未来研究报告)
人工智能·概率论·集装箱码头