概率论基础教程第5章连续型随机变量(三)

5.5 指数随机变量

指数随机变量是一种重要的连续型随机变量，常用于描述等待时间或寿命。

定义

概率密度

如果随机变量 XXX 的密度函数为：
f(x)={λe−λxif x≥00if x<0 \boxed{f(x) = \begin{cases} \lambda e^{-\lambda x} & \text{if } x \geq 0 \\ 0 & \text{if } x < 0 \end{cases}} f(x)={λe−λx0if x≥0if x<0

其中 λ>0\lambda > 0λ>0 是参数，则称 XXX 为参数为 λ\lambdaλ 的指数随机变量。

分布函数

指数随机变量的分布函数为：
F(a)=P{X⩽a}=∫0aλe−λx dx=1−e−λaa⩾0 \boxed{F(a) = P\{X \leqslant a\} = \int_0^a \lambda e^{-\lambda x} \, \mathrm{d}x = 1 - e^{-\lambda a} \qquad a \geqslant 0} F(a)=P{X⩽a}=∫0aλe−λxdx=1−e−λaa⩾0

验证：

f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
∫0∞λe−λx dx=−e−λx∣0∞=1\int_{0}^{\infty} \lambda e^{-\lambda x} \, \mathrm{d}x = -e^{-\lambda x} \big|_{0}^{\infty} = 1∫0∞λe−λxdx=−e−λx 0∞=1，满足归一性条件

期望与方差

例 5a：计算期望和方差

解：

计算 E[Xn]E[X^n]E[Xn] ：
E[Xn]=∫0∞xnλe−λx dx E[X^n] = \int_{0}^{\infty} x^n \lambda e^{-\lambda x} \, \mathrm{d}x E[Xn]=∫0∞xnλe−λxdx

使用分部积分法（令 u=xnu = x^nu=xn，dv=λe−λx dx\mathrm{d}v = \lambda e^{-\lambda x} \, \mathrm{d}xdv=λe−λxdx）：
E[Xn]=−xne−λx∣0∞+∫0∞e−λxnxn−1 dx=nλE[Xn−1] E[X^n] = -x^n e^{-\lambda x} \big|{0}^{\infty} + \int{0}^{\infty} e^{-\lambda x} n x^{n-1} \, \mathrm{d}x = \frac{n}{\lambda} E[X^{n-1}] E[Xn]=−xne−λx 0∞+∫0∞e−λxnxn−1dx=λnE[Xn−1]
计算 E[X]E[X]E[X] （令 n=1n=1n=1）：
E[X]=1λE[X0]=1λ⋅1=1λ E[X] = \frac{1}{\lambda} E[X^{0}] = \frac{1}{\lambda} \cdot 1 = \frac{1}{\lambda} E[X]=λ1E[X0]=λ1⋅1=λ1
计算 E[X2]E[X^2]E[X2] （令 n=2n=2n=2）：
E[X2]=2λE[X]=2λ⋅1λ=2λ2 E[X^2] = \frac{2}{\lambda} E[X] = \frac{2}{\lambda} \cdot \frac{1}{\lambda} = \frac{2}{\lambda^2} E[X2]=λ2E[X]=λ2⋅λ1=λ22
计算方差 ：
Var(X)=E[X2]−(E[X])2=2λ2−(1λ)2=1λ2 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{2}{\lambda^2} - \left(\frac{1}{\lambda}\right)^2 \\ &= \frac{1}{\lambda^2} \end{aligned} Var(X)=E[X2]−(E[X])2=λ22−(λ1)2=λ21

结论：

期望：E[X]=1λ\boxed{E[X] = \frac{1}{\lambda}}E[X]=λ1
方差：Var(X)=1λ2\boxed{Var(X) = \frac{1}{\lambda^2}}Var(X)=λ21

无记忆性

一个非负随机变量 XXX 称为无记忆的 （memoryless），如果：
P{X>s+t∣X>t}=P{X>s}for all s,t≥0(5.1) \boxed{P\{X > s+t \mid X > t\} = P\{X > s\} \quad \text{for all } s, t \ge 0} \tag{5.1} P{X>s+t∣X>t}=P{X>s}for all s,t≥0(5.1)

直观解释：

如果设备已经工作了 ttt 小时且仍在工作，则它还能再工作 sss 小时的概率，与设备刚开始工作时能工作 sss 小时的概率相同
设备"忘记"了它已经工作了多长时间

式 (5.1) 等价于：
P{X>s+t}=P{X>s}P{X>t}(5.2) \boxed{P\{X > s+t\} = P\{X > s\}P\{X > t\}} \tag{5.2} P{X>s+t}=P{X>s}P{X>t}(5.2)

证明：
P{X>s+t∣X>t}=P{X>s+t,X>t}P{X>t}=P{X>s+t}P{X>t} \begin{aligned} P\{X > s+t \mid X > t\} &= \frac{P\{X > s+t, X > t\}}{P\{X > t\}} \\ &= \frac{P\{X > s+t\}}{P\{X > t\}} \end{aligned} P{X>s+t∣X>t}=P{X>t}P{X>s+t,X>t}=P{X>t}P{X>s+t}

对于指数分布，P{X>x}=e−λxP\{X > x\} = e^{-\lambda x}P{X>x}=e−λx
代入得：
P{X>s+t∣X>t}=P{X>s+t}P{X>t}=e−λ(s+t)e−λt=e−λs=P{X>s} \begin{aligned} P\{X > s+t \mid X > t\} &= \frac{P\{X > s+t\}}{P\{X > t\}} \\ &= \frac{e^{-\lambda(s+t)}}{e^{-\lambda t}} \\ &= e^{-\lambda s} \\ &= P\{X > s\} \end{aligned} P{X>s+t∣X>t}=P{X>t}P{X>s+t}=e−λte−λ(s+t)=e−λs=P{X>s}

所以5.2成立

对于指数随机变量：
P{X>x}=1−F(x)=e−λx P\{X > x\} = 1 - F(x) = e^{-\lambda x} P{X>x}=1−F(x)=e−λx

验证式 (5.2)：
P{X>s+t}=e−λ(s+t)=e−λse−λt=P{X>s}P{X>t} P\{X > s+t\} = e^{-\lambda(s+t)} = e^{-\lambda s} e^{-\lambda t} = P\{X > s\}P\{X > t\} P{X>s+t}=e−λ(s+t)=e−λse−λt=P{X>s}P{X>t}

因此，指数随机变量是无记忆的。

例题

例 5b：电话通话时长

假设电话通话时长 XXX 是参数为 λ=110\lambda = \frac{1}{10}λ=101 的指数随机变量（即平均通话时长为 10 分钟）。

(a) 等待时间超过 10 分钟的概率 ：
P{X>10}=1−F(10)=e−λ⋅10=e−1≈0.368 P\{X > 10\} = 1 - F(10) = e^{-\lambda \cdot 10} = e^{-1} \approx 0.368 P{X>10}=1−F(10)=e−λ⋅10=e−1≈0.368

(b) 等待时间在 10 到 20 分钟之间的概率 ：
P{10<X<20}=F(20)−F(10)=(1−e−λ⋅20)−(1−e−λ⋅10)=e−1−e−2≈0.233 \begin{aligned} P\{10 < X < 20\} &= F(20) - F(10) \\ &= (1 - e^{-\lambda \cdot 20}) - (1 - e^{-\lambda \cdot 10}) \\ &= e^{-1} - e^{-2} \approx 0.233 \end{aligned} P{10<X<20}=F(20)−F(10)=(1−e−λ⋅20)−(1−e−λ⋅10)=e−1−e−2≈0.233

例 5c：邮局问题

史密斯先生走进邮局时，发现两个职员正在接待琼斯女士和布朗先生。史密斯先生被告知，一旦处理完琼斯或布朗的事情，就开始接待他。如果职员给每位顾客服务的时间都服从参数为 λ\lambdaλ 的指数分布，求史密斯先生是最后一个办完事情的概率。

解：

当史密斯开始接受服务时，琼斯女士和布朗先生中有一个已经离开，另一个仍在继续接受服务
由于指数分布的无记忆性，仍在接受服务的顾客（琼斯女士或布朗先生）的剩余服务时间 服从参数为 λ\lambdaλ 的指数分布，与刚开始接受服务时相同
由对称性可知，剩下的一个人在史密斯先生之前完成服务的概率为 12\frac{1}{2}21

因此，史密斯先生是最后一个办完事情的概率为 12\boxed{\frac{1}{2}}21。

例 5d：汽车电池问题

汽车在电池电量用完之前跑的英里数服从均值为 10,000 英里的指数分布。某人计划开始一个 5,000 英里的旅行，求不用更换电池就能跑完全程的概率。

解：

服从指数分布的情况：
- 由于无记忆性，电池剩余寿命服从参数为 λ=110\lambda = \frac{1}{10}λ=101（单位：千英里）的指数分布
- 所求概率：
  P{电池能跑完 5,000 英里}=P{X>5}=e−λ⋅5=e−0.5≈0.6065 P\{\text{电池能跑完 5,000 英里}\} = P\{X > 5\} = e^{-\lambda \cdot 5} = e^{-0.5} \approx 0.6065 P{电池能跑完 5,000 英里}=P{X>5}=e−λ⋅5=e−0.5≈0.6065
不服从指数分布的情况：
- 设 ttt 表示旅行前电池已跑过的里程数（单位：千英里）
- 所求概率：
  P{X>t+5∣X>t}=1−F(t+5)1−F(t) P\{X > t+5 \mid X > t\} = \frac{1-F(t+5)}{1-F(t)} P{X>t+5∣X>t}=1−F(t)1−F(t+5)
- 需要知道 ttt 的值才能计算

结论：

服从指数分布时：概率为 e−0.5≈0.6065e^{-0.5} \approx 0.6065e−0.5≈0.6065
不服从指数分布时：需要额外信息（已跑里程 ttt）

拉普拉斯分布

拉普拉斯分布（也称为双指数分布）是指数分布的扩展。

定义

拉普拉斯随机变量的密度函数 为：
f(x)=12λe−λ∣x∣−∞<x<∞ f(x) = \frac{1}{2}\lambda e^{-\lambda|x|} \qquad -\infty < x < \infty f(x)=21λe−λ∣x∣−∞<x<∞

分布函数
F(x)={12eλxx≤01−12e−λxx>0 F(x) = \begin{cases} \frac{1}{2} e^{\lambda x} & x \le 0\\ 1 - \frac{1}{2} e^{-\lambda x} & x > 0 \end{cases} F(x)={21eλx1−21e−λxx≤0x>0

例 5e：电信信号传输

传输机制 ：
- 当传输信息为 1 时，发送值为 2
- 当传输信息为 0 时，发送值为 -2
- 接收到的信号为 R=x+NR = x + NR=x+N，其中 xxx 是发送值，NNN 是噪声
解码规则 ：
- 如果 R≥0.5R \geq 0.5R≥0.5，则解码为 1
- 如果 R<0.5R < 0.5R<0.5，则解码为 0

当噪声为参数 λ=1\lambda = 1λ=1 的拉普拉斯随机变量时：

信息 1 被错误认为 0 的概率 （当 R<0.5R < 0.5R<0.5）：
P{N<−1.5}=12e−1.5≈0.1116 P\{N < -1.5\} = \frac{1}{2} e^{-1.5} \approx 0.1116 P{N<−1.5}=21e−1.5≈0.1116
信息 0 被错误认为 1 的概率 （当 R≥0.5R \geq 0.5R≥0.5）：
P{N≥2.5}=12e−2.5≈0.041 P\{N \geq 2.5\} = \frac{1}{2} e^{-2.5} \approx 0.041 P{N≥2.5}=21e−2.5≈0.041

危险率函数

危险率函数（hazard rate function）是可靠性工程中的重要概念。

定义

对于正值连续型随机变量 XXX（表示寿命），危险率函数定义为：
λ(t)=f(t)F‾(t),where F‾(t)=1−F(t) \boxed{\lambda(t) = \frac{f(t)}{\overline{F}(t)}, \qquad \text{where } \overline{F}(t) = 1 - F(t)} λ(t)=F(t)f(t),where F(t)=1−F(t)

考虑零件已经使用了 ttt 小时，不能继续使用 dtdtdt 小时的条件概率：
P{X∈(t,t+dt)∣X>t}=P{X∈(t,t+dt),X>t}P{X>t}=P{X∈(t,t+dt)}P{X>t}≈f(t) dtF‾(t)=λ(t) dt \begin{aligned} P\{X \in (t, t+dt) \mid X > t\} &= \frac{P\{X \in (t, t+dt), X > t\}}{P\{X > t\}} \\ &= \frac{P\{X \in (t, t+dt)\}}{P\{X > t\}} \\ &\approx \frac{f(t) \, dt}{\overline{F}(t)} \\ &= \lambda(t) \, dt \end{aligned} P{X∈(t,t+dt)∣X>t}=P{X>t}P{X∈(t,t+dt),X>t}=P{X>t}P{X∈(t,t+dt)}≈F(t)f(t)dt=λ(t)dt

因此，λ(t)\lambda(t)λ(t) 表示使用时间为 ttt 的零件不能再继续使用的条件概率强度。

对于指数分布：
λ(t)=f(t)F‾(t)=λe−λte−λt=λ \lambda(t) = \frac{f(t)}{\overline{F}(t)} = \frac{\lambda e^{-\lambda t}}{e^{-\lambda t}} = \lambda λ(t)=F(t)f(t)=e−λtλe−λt=λ

结论：指数分布的危险率函数是常数 λ\lambdaλ。

$!TIP$
指数分布是唯一具有常数危险率的分布。如果 λ(t)=λ\lambda(t) = \lambdaλ(t)=λ（常数），则 F(t)=1−e−λtF(t) = 1 - e^{-\lambda t}F(t)=1−e−λt。

危险率函数 λ(s)\lambda(s)λ(s) 可以唯一确定分布函数 FFF：
∫0tλ(s) ds=∫0tf(s)1−F(s) ds=−ln⁡(1−F(s))∣0t=−ln⁡(1−F(t))+ln⁡(1−F(0))=−ln⁡(1−F(t))(因为 F(0)=0) \begin{aligned} \int_{0}^{t} \lambda(s) \, \mathrm{d}s &= \int_{0}^{t} \frac{f(s)}{1 - F(s)} \, \mathrm{d}s \\ &= -\ln(1 - F(s)) \big|_{0}^{t} \\ &= -\ln(1 - F(t)) + \ln(1 - F(0)) \\ &= -\ln(1 - F(t)) \quad (\text{因为 } F(0) = 0) \end{aligned} ∫0tλ(s)ds=∫0t1−F(s)f(s)ds=−ln(1−F(s)) 0t=−ln(1−F(t))+ln(1−F(0))=−ln(1−F(t))(因为 F(0)=0)

解得：
F(t)=1−exp⁡{−∫0tλ(s) ds}(5.4) \boxed{F(t) = 1 - \exp\left\{-\int_0^t \lambda(s) \, \mathrm{d}s\right\}} \tag{5.4} F(t)=1−exp{−∫0tλ(s)ds}(5.4)

例 5f：吸烟者死亡率

问题：各个年龄段吸烟者的死亡率是非吸烟者死亡率的两倍，这意味着什么？

解：

设 λs(t)\lambda_s(t)λs(t) 为吸烟者的危险率函数
设 λn(t)\lambda_n(t)λn(t) 为非吸烟者的危险率函数
条件：λs(t)=2λn(t)\lambda_s(t) = 2\lambda_n(t)λs(t)=2λn(t)

年龄为 AAA 的非吸烟者能活到年龄 BBB (A<BA < BA<B) 的概率 ：
P{非吸烟者活到 B∣活到 A}=P{X>B}P{X>A}=exp⁡{−∫0Bλn(t) dt}exp⁡{−∫0Aλn(t) dt}=exp⁡{−∫ABλn(t) dt} \begin{aligned} P\{\text{非吸烟者活到 } B \mid \text{活到 } A\} &= \frac{P\{X > B\}}{P\{X > A\}} \\ &= \frac{\exp\left\{-\int_0^B \lambda_n(t) \, \mathrm{d}t\right\}}{\exp\left\{-\int_0^A \lambda_n(t) \, \mathrm{d}t\right\}} \\ &= \exp\left\{-\int_A^B \lambda_n(t) \, \mathrm{d}t\right\} \end{aligned} P{非吸烟者活到 B∣活到 A}=P{X>A}P{X>B}=exp{−∫0Aλn(t)dt}exp{−∫0Bλn(t)dt}=exp{−∫ABλn(t)dt}

年龄为 AAA 的吸烟者能活到年龄 BBB 的概率 ：
P{吸烟者活到 B∣活到 A}=exp⁡{−∫ABλs(t) dt}=exp⁡{−2∫ABλn(t) dt}=[exp⁡{−∫ABλn(t) dt}]2 \begin{aligned} P\{\text{吸烟者活到 } B \mid \text{活到 } A\} &= \exp\left\{-\int_A^B \lambda_s(t) \, \mathrm{d}t\right\} \\ &= \exp\left\{-2\int_A^B \lambda_n(t) \, \mathrm{d}t\right\} \\ &= \left[\exp\left\{-\int_A^B \lambda_n(t) \, \mathrm{d}t\right\}\right]^2 \end{aligned} P{吸烟者活到 B∣活到 A}=exp{−∫ABλs(t)dt}=exp{−2∫ABλn(t)dt}=[exp{−∫ABλn(t)dt}]2

结论：

吸烟者能存活到给定年龄的概率是非吸烟者的相应概率的平方
而不是"非吸烟者概率的一半"

具体例子：

如果 λn(t)=120\lambda_n(t) = \frac{1}{20}λn(t)=201（50≤t≤6050 \leq t \leq 6050≤t≤60）
50 岁非吸烟者活到 60 岁的概率：e−1/2≈0.6065e^{-1/2} \approx 0.6065e−1/2≈0.6065
50 岁吸烟者活到 60 岁的概率：e−1≈0.3679e^{-1} \approx 0.3679e−1≈0.3679

5.6 Γ分布

定义

如果随机变量的密度函数为：
f(x)={λe−λx(λx)α−1Γ(α)x≥00x<0 f(x) = \begin{cases} \frac{\lambda e^{-\lambda x} (\lambda x)^{\alpha - 1}}{\Gamma(\alpha)} & x \geq 0\\ 0 & x < 0 \end{cases} f(x)={Γ(α)λe−λx(λx)α−10x≥0x<0

其中 α>0\alpha > 0α>0，λ>0\lambda > 0λ>0，Γ(α)\Gamma(\alpha)Γ(α) 是 Γ 函数，则称该随机变量服从参数为 (α,λ)(\alpha, \lambda)(α,λ) 的 Γ 分布。

Γ 函数定义为：
Γ(α)=∫0∞e−yyα−1 dy \Gamma(\alpha) = \int_0^\infty e^{-y} y^{\alpha-1} \, \mathrm{d}y Γ(α)=∫0∞e−yyα−1dy

性质：

Γ(α)=(α−1)Γ(α−1)\Gamma(\alpha) = (\alpha-1)\Gamma(\alpha-1)Γ(α)=(α−1)Γ(α−1)

首先，回顾Γ函数的定义：
Γ(α)=∫0∞e−xxα−1 dx,α>0 \Gamma(\alpha) = \int_0^\infty e^{-x} x^{\alpha-1} \, \mathrm{d}x, \quad \alpha > 0 Γ(α)=∫0∞e−xxα−1dx,α>0

我们使用分部积分法来证明递推关系。令：

u=xα−1u = x^{\alpha-1}u=xα−1，则 du=(α−1)xα−2 dx\mathrm{d}u = (\alpha-1)x^{\alpha-2} \, \mathrm{d}xdu=(α−1)xα−2dx
dv=e−x dx\mathrm{d}v = e^{-x} \, \mathrm{d}xdv=e−xdx，则 v=−e−xv = -e^{-x}v=−e−x

应用分部积分公式 ∫u dv=uv−∫v du\int u \, \mathrm{d}v = uv - \int v \, \mathrm{d}u∫udv=uv−∫vdu：

Γ(α)=∫0∞e−xxα−1 dx=[−xα−1e−x]0∞−∫0∞(−e−x)⋅(α−1)xα−2 dx=[−xα−1e−x]0∞+(α−1)∫0∞e−xxα−2 dx \begin{aligned} \Gamma(\alpha) &= \int_0^\infty e^{-x} x^{\alpha-1} \, \mathrm{d}x \\ &= \left[ -x^{\alpha-1} e^{-x} \right]_0^\infty - \int_0^\infty (-e^{-x}) \cdot (\alpha-1)x^{\alpha-2} \, \mathrm{d}x \\ &= \left[ -x^{\alpha-1} e^{-x} \right]_0^\infty + (\alpha-1) \int_0^\infty e^{-x} x^{\alpha-2} \, \mathrm{d}x \end{aligned} Γ(α)=∫0∞e−xxα−1dx=[−xα−1e−x]0∞−∫0∞(−e−x)⋅(α−1)xα−2dx=[−xα−1e−x]0∞+(α−1)∫0∞e−xxα−2dx

现在分析边界项 [−xα−1e−x]0∞\left[ -x^{\alpha-1} e^{-x} \right]_0^\infty[−xα−1e−x]0∞：

当 x→∞x \to \inftyx→∞ 时：
- xα−1x^{\alpha-1}xα−1 是多项式增长
- e−xe^{-x}e−x 是指数衰减
- 指数衰减比多项式增长更快，因此 xα−1e−x→0x^{\alpha-1} e^{-x} \to 0xα−1e−x→0
当 x→0+x \to 0^+x→0+ 时：
- 如果 α>1\alpha > 1α>1，则 xα−1→0x^{\alpha-1} \to 0xα−1→0
- 如果 0<α≤10 < \alpha \leq 10<α≤1，需要更仔细分析：
  - xα−1=1x1−αx^{\alpha-1} = \frac{1}{x^{1-\alpha}}xα−1=x1−α1
  - 由于 1−α≥01-\alpha \geq 01−α≥0，当 x→0+x \to 0^+x→0+ 时，x1−α→0x^{1-\alpha} \to 0x1−α→0，但 e−x→1e^{-x} \to 1e−x→1
  - 实际上，xα−1e−x∼xα−1x^{\alpha-1} e^{-x} \sim x^{\alpha-1}xα−1e−x∼xα−1，而 α−1>−1\alpha-1 > -1α−1>−1（因为 α>0\alpha > 0α>0）
  - 这保证了积分在 x=0x=0x=0 处收敛

因此，边界项为零：

−xα−1e−x\]0∞=0 \\left\[ -x\^{\\alpha-1} e\^{-x} \\right\]_0\^\\infty = 0 \[−xα−1e−x\]0∞=0 代入得： Γ(α)=0+(α−1)∫0∞e−xxα−2 dx=(α−1)Γ(α−1) \\begin{aligned} \\Gamma(\\alpha) \&= 0 + (\\alpha-1) \\int_0\^\\infty e\^{-x} x\^{\\alpha-2} \\, \\mathrm{d}x \\\\ \&= (\\alpha-1) \\Gamma(\\alpha-1) \\end{aligned} Γ(α)=0+(α−1)∫0∞e−xxα−2dx=(α−1)Γ(α−1) 这就证明了递推关系： Γ(α)=(α−1)Γ(α−1) \\boxed{\\Gamma(\\alpha) = (\\alpha-1)\\Gamma(\\alpha-1)} Γ(α)=(α−1)Γ(α−1) > \[!NOTE

这个递推关系对所有 α>1\alpha > 1α>1 成立，因为需要 α−1>0\alpha-1 > 0α−1>0 以保证 Γ(α−1)\Gamma(\alpha-1)Γ(α−1) 有定义。

Γ(n)=(n−1)!\Gamma(n) = (n-1)!Γ(n)=(n−1)!

我们使用数学归纳法来证明这个性质。

基础步骤：n=1n = 1n=1

计算 Γ(1)\Gamma(1)Γ(1)：
Γ(1)=∫0∞e−xx1−1 dx=∫0∞e−x dx=[−e−x]0∞=−(0−1)=1 \begin{aligned} \Gamma(1) &= \int_0^\infty e^{-x} x^{1-1} \, \mathrm{d}x \\ &= \int_0^\infty e^{-x} \, \mathrm{d}x \\ &= \left[ -e^{-x} \right]_0^\infty \\ &= -(0 - 1) \\ &= 1 \end{aligned} Γ(1)=∫0∞e−xx1−1dx=∫0∞e−xdx=[−e−x]0∞=−(0−1)=1

而 0!=10! = 10!=1，所以：
Γ(1)=0! \Gamma(1) = 0! Γ(1)=0!

基础步骤成立。

归纳假设

假设对某个正整数 kkk，有：
Γ(k)=(k−1)! \Gamma(k) = (k-1)! Γ(k)=(k−1)!

归纳步骤

我们需要证明：
Γ(k+1)=k! \Gamma(k+1) = k! Γ(k+1)=k!

根据已证明的递推关系：
Γ(k+1)=k⋅Γ(k) \Gamma(k+1) = k \cdot \Gamma(k) Γ(k+1)=k⋅Γ(k)

代入归纳假设：
Γ(k+1)=k⋅(k−1)!=k! \Gamma(k+1) = k \cdot (k-1)! = k! Γ(k+1)=k⋅(k−1)!=k!

因此，由数学归纳法，对所有正整数 nnn：
Γ(n)=(n−1)! \boxed{\Gamma(n) = (n-1)!} Γ(n)=(n−1)!

Γ 分布常用于表示某个事件总共发生 nnn 次的等待时间。

证明：设 TnT_nTn 为第 nnn 个事件发生的时间，则：
P{Tn⩽t}=P{N(t)⩾n}=∑j=n∞e−λt(λt)jj! P\{T_n \leqslant t\} = P\{N(t) \geqslant n\} = \sum_{j=n}^{\infty} \frac{e^{-\lambda t} (\lambda t)^j}{j!} P{Tn⩽t}=P{N(t)⩾n}=j=n∑∞j!e−λt(λt)j

其中 N(t)N(t)N(t) 是 [0,t][0, t][0,t] 内发生的事件数，服从参数为 λt\lambda tλt 的泊松分布。

对上式求导得 TnT_nTn 的密度函数：

fTn(t)=ddtP{Tn≤t}=ddt∑j=n∞e−λt(λt)jj! f_{T_n}(t) = \frac{d}{dt} P\{T_n \leq t\} = \frac{d}{dt} \sum_{j=n}^{\infty} \frac{e^{-\lambda t} (\lambda t)^j}{j!} fTn(t)=dtdP{Tn≤t}=dtdj=n∑∞j!e−λt(λt)j

由于级数在 $t \\geq 0$ 上一致收敛（因为泊松分布的概率和为1），我们可以交换导数与求和顺序：

fTn(t)=∑j=n∞ddt(e−λt(λt)jj!) f_{T_n}(t) = \sum_{j=n}^{\infty} \frac{d}{dt} \left( \frac{e^{-\lambda t} (\lambda t)^j}{j!} \right) fTn(t)=j=n∑∞dtd(j!e−λt(λt)j)

我们对通项求导：

ddt(e−λt(λt)jj!)=1j!⋅ddt(e−λt(λt)j) \frac{d}{dt} \left( \frac{e^{-\lambda t} (\lambda t)^j}{j!} \right) = \frac{1}{j!} \cdot \frac{d}{dt} \left( e^{-\lambda t} (\lambda t)^j \right) dtd(j!e−λt(λt)j)=j!1⋅dtd(e−λt(λt)j)

ddt(e−λt(λt)j)=−λe−λt(λt)j+e−λt⋅jλ(λt)j−1=λe−λt(λt)j−1(−λt+j) \frac{d}{dt} \left( e^{-\lambda t} (\lambda t)^j \right) = -\lambda e^{-\lambda t} (\lambda t)^j + e^{-\lambda t} \cdot j \lambda (\lambda t)^{j-1} = \lambda e^{-\lambda t} (\lambda t)^{j-1} \left( -\lambda t + j \right) dtd(e−λt(λt)j)=−λe−λt(λt)j+e−λt⋅jλ(λt)j−1=λe−λt(λt)j−1(−λt+j)

代入原式：

fTn(t)=∑j=n∞λe−λt(λt)j−1j!(j−λt) f_{T_n}(t) = \sum_{j=n}^{\infty} \frac{\lambda e^{-\lambda t} (\lambda t)^{j-1}}{j!} (j - \lambda t) fTn(t)=j=n∑∞j!λe−λt(λt)j−1(j−λt)

我们将求和拆成两部分：

fTn(t)=λe−λt∑j=n∞(λt)j−1j!(j−λt)=λe−λt[∑j=n∞j(λt)j−1j!−λt∑j=n∞(λt)j−1j!] f_{T_n}(t) = \lambda e^{-\lambda t} \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} (j - \lambda t) = \lambda e^{-\lambda t} \left[ \sum_{j=n}^{\infty} \frac{j (\lambda t)^{j-1}}{j!} - \lambda t \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} \right] fTn(t)=λe−λtj=n∑∞j!(λt)j−1(j−λt)=λe−λt[j=n∑∞j!j(λt)j−1−λtj=n∑∞j!(λt)j−1]

简化：

处理第一项：
∑j=n∞(λt)j−1(j−1)!=∑k=n−1∞(λt)kk!令 k=j−1 \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{(j-1)!} = \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} \quad \text{令 } k = j-1 j=n∑∞(j−1)!(λt)j−1=k=n−1∑∞k!(λt)k令 k=j−1

处理第二项：
∑j=n∞(λt)j−1j!=∑j=n∞(λt)j−1j⋅(j−1)!=∑k=n−1∞(λt)k(k+1)!令 k=j−1 \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j!} = \sum_{j=n}^{\infty} \frac{(\lambda t)^{j-1}}{j \cdot (j-1)!} = \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} \quad \text{令 } k = j-1 j=n∑∞j!(λt)j−1=j=n∑∞j⋅(j−1)!(λt)j−1=k=n−1∑∞(k+1)!(λt)k令 k=j−1

所以：

fTn(t)=λe−λt[∑k=n−1∞(λt)kk!−λt∑k=n−1∞(λt)k(k+1)!] f_{T_n}(t) = \lambda e^{-\lambda t} \left[ \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} - \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} \right] fTn(t)=λe−λt[k=n−1∑∞k!(λt)k−λtk=n−1∑∞(k+1)!(λt)k]

考虑第二项中的 $\\lambda t \\sum_{k=n-1}\^{\\infty} \\frac{(\\lambda t)\^k}{(k+1)!}$

令 $m = k+1$ ，则当 $k = n-1$ 时， $m = n$ ，所以：

∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)m−1m!⇒λt∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)mm! \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^{m-1}}{m!} \Rightarrow \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} k=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m−1⇒λtk=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m

因此第二项变为：

λt∑k=n−1∞(λt)k(k+1)!=∑m=n∞(λt)mm! \lambda t \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{(k+1)!} = \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} λtk=n−1∑∞(k+1)!(λt)k=m=n∑∞m!(λt)m

而第一项是：

∑k=n−1∞(λt)kk!=(λt)n−1(n−1)!+∑k=n∞(λt)kk! \sum_{k=n-1}^{\infty} \frac{(\lambda t)^k}{k!} = \frac{(\lambda t)^{n-1}}{(n-1)!} + \sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!} k=n−1∑∞k!(λt)k=(n−1)!(λt)n−1+k=n∑∞k!(λt)k

所以代入回原式：

fTn(t)=λe−λt[((λt)n−1(n−1)!+∑k=n∞(λt)kk!)−∑m=n∞(λt)mm!] f_{T_n}(t) = \lambda e^{-\lambda t} \left[ \left( \frac{(\lambda t)^{n-1}}{(n-1)!} + \sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!} \right) - \sum_{m=n}^{\infty} \frac{(\lambda t)^m}{m!} \right] fTn(t)=λe−λt[((n−1)!(λt)n−1+k=n∑∞k!(λt)k)−m=n∑∞m!(λt)m]

注意到两个无穷级数相同，相减为零，剩下：

fTn(t)=λe−λt⋅(λt)n−1(n−1)! f_{T_n}(t) = \lambda e^{-\lambda t} \cdot \frac{(\lambda t)^{n-1}}{(n-1)!} fTn(t)=λe−λt⋅(n−1)!(λt)n−1

即：

fTn(t)=λe−λt(λt)n−1(n−1)! f_{T_n}(t) = \frac{\lambda e^{-\lambda t} (\lambda t)^{n-1}}{(n-1)!} fTn(t)=(n−1)!λe−λt(λt)n−1

可证:

fTn(t)=ddtP(Tn≤t)=λe−λt(λt)n−1(n−1)! \boxed{ f_{T_n}(t) = \frac{d}{dt} P(T_n \leq t) = \frac{\lambda e^{-\lambda t} (\lambda t)^{n-1}}{(n-1)!} } fTn(t)=dtdP(Tn≤t)=(n−1)!λe−λt(λt)n−1

这正是参数为 (n,λ)(n, \lambda)(n,λ) 的 Γ 分布。

$!NOTE$

当 n=1n=1n=1 时，Γ 分布退化为指数分布

当 λ=12\lambda = \frac{1}{2}λ=21，α=n2\alpha = \frac{n}{2}α=2n 时，称为自由度为 nnn 的 χ2\chi^2χ2 分布

期望和方差

期望：E[X]=αλ\boxed{E[X] = \frac{\alpha}{\lambda}}E[X]=λα
方差：Var(X)=αλ2\boxed{Var(X) = \frac{\alpha}{\lambda^2}}Var(X)=λ2α

我们计算：

E[X]=∫0∞x⋅fX(x) dx=∫0∞x⋅λαxα−1e−λxΓ(α) dx=λαΓ(α)∫0∞xαe−λx dx \mathbb{E}[X] = \int_0^{\infty} x \cdot f_X(x) \, dx = \int_0^{\infty} x \cdot \frac{\lambda^\alpha x^{\alpha - 1} e^{-\lambda x}}{\Gamma(\alpha)} \, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha} e^{-\lambda x} \, dx E[X]=∫0∞x⋅fX(x)dx=∫0∞x⋅Γ(α)λαxα−1e−λxdx=Γ(α)λα∫0∞xαe−λxdx

令 $u = \\lambda x$ ，则 $x = u / \\lambda ，，， dx = du / \\lambda$

代入：

∫0∞xαe−λx dx=∫0∞(uλ)αe−u⋅duλ=1λα+1∫0∞uαe−u du=Γ(α+1)λα+1 \int_0^{\infty} x^{\alpha} e^{-\lambda x} \, dx = \int_0^{\infty} \left( \frac{u}{\lambda} \right)^{\alpha} e^{-u} \cdot \frac{du}{\lambda} = \frac{1}{\lambda^{\alpha + 1}} \int_0^{\infty} u^{\alpha} e^{-u} \, du = \frac{\Gamma(\alpha + 1)}{\lambda^{\alpha + 1}} ∫0∞xαe−λxdx=∫0∞(λu)αe−u⋅λdu=λα+11∫0∞uαe−udu=λα+1Γ(α+1)

因此：

E[X]=λαΓ(α)⋅Γ(α+1)λα+1=Γ(α+1)λΓ(α) \mathbb{E}[X] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha + 1)}{\lambda^{\alpha + 1}} = \frac{\Gamma(\alpha + 1)}{\lambda \Gamma(\alpha)} E[X]=Γ(α)λα⋅λα+1Γ(α+1)=λΓ(α)Γ(α+1)

利用伽马函数的性质： $\\Gamma(\\alpha + 1) = \\alpha \\Gamma(\\alpha)$ ，所以：

E[X]=αΓ(α)λΓ(α)=αλ \mathbb{E}[X] = \frac{\alpha \Gamma(\alpha)}{\lambda \Gamma(\alpha)} = \frac{\alpha}{\lambda} E[X]=λΓ(α)αΓ(α)=λα

E[X2]=∫0∞x2fX(x) dx=λαΓ(α)∫0∞xα+1e−λx dx \mathbb{E}[X^2] = \int_0^{\infty} x^2 f_X(x) \, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha + 1} e^{-\lambda x} \, dx E[X2]=∫0∞x2fX(x)dx=Γ(α)λα∫0∞xα+1e−λxdx

同样令 $u = \\lambda x$ ，则 $x = u / \\lambda ，，， dx = du / \\lambda$ ，代入：

∫0∞xα+1e−λx dx=∫0∞(uλ)α+1e−u⋅duλ=1λα+2∫0∞uα+1e−u du=Γ(α+2)λα+2 \int_0^{\infty} x^{\alpha + 1} e^{-\lambda x} \, dx = \int_0^{\infty} \left( \frac{u}{\lambda} \right)^{\alpha + 1} e^{-u} \cdot \frac{du}{\lambda} = \frac{1}{\lambda^{\alpha + 2}} \int_0^{\infty} u^{\alpha + 1} e^{-u} \, du = \frac{\Gamma(\alpha + 2)}{\lambda^{\alpha + 2}} ∫0∞xα+1e−λxdx=∫0∞(λu)α+1e−u⋅λdu=λα+21∫0∞uα+1e−udu=λα+2Γ(α+2)

所以：

E[X2]=λαΓ(α)⋅Γ(α+2)λα+2=Γ(α+2)λ2Γ(α) \mathbb{E}[X^2] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha + 2)}{\lambda^{\alpha + 2}} = \frac{\Gamma(\alpha + 2)}{\lambda^2 \Gamma(\alpha)} E[X2]=Γ(α)λα⋅λα+2Γ(α+2)=λ2Γ(α)Γ(α+2)

利用递推关系：

$\\Gamma(\\alpha + 2) = (\\alpha + 1)\\Gamma(\\alpha + 1) = (\\alpha + 1)\\alpha \\Gamma(\\alpha)$

因此：

E[X2]=(α+1)αΓ(α)λ2Γ(α)=α(α+1)λ2 \mathbb{E}[X^2] = \frac{(\alpha + 1)\alpha \Gamma(\alpha)}{\lambda^2 \Gamma(\alpha)} = \frac{\alpha(\alpha + 1)}{\lambda^2} E[X2]=λ2Γ(α)(α+1)αΓ(α)=λ2α(α+1)

Var(X)=E[X2]−(E[X])2=α(α+1)λ2−(αλ)2=α(α+1)−α2λ2=αλ2 \mathrm{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = \frac{\alpha(\alpha + 1)}{\lambda^2} - \left( \frac{\alpha}{\lambda} \right)^2 = \frac{\alpha(\alpha + 1) - \alpha^2}{\lambda^2} = \frac{\alpha}{\lambda^2} Var(X)=E[X2]−(E[X])2=λ2α(α+1)−(λα)2=λ2α(α+1)−α2=λ2α

5.7 韦布尔分布

定义

韦布尔分布的分布函数为：
F(x)={0x≤ν1−exp⁡{−(x−να)β}x>ν F(x) = \begin{cases} 0 & x \leq \nu \\ 1 - \exp\left\{-\left(\frac{x-\nu}{\alpha}\right)^{\beta}\right\} & x > \nu \end{cases} F(x)={01−exp{−(αx−ν)β}x≤νx>ν

密度函数为：
f(x)={0x⩽νβα(x−να)β−1exp⁡{−(x−να)β}x>ν f(x) = \begin{cases} 0 & x \leqslant \nu \\ \frac{\beta}{\alpha} \left( \frac{x - \nu}{\alpha} \right)^{\beta - 1} \exp \left\{ - \left( \frac{x - \nu}{\alpha} \right)^{\beta} \right\} & x > \nu \end{cases} f(x)={0αβ(αx−ν)β−1exp{−(αx−ν)β}x⩽νx>ν

应用

韦布尔分布广泛应用于：

疲劳数据分析
生命现象研究
"最弱链"模型（当对象的任何一部分毁坏时，对象寿命终止）

5.8 柯西分布

定义

柯西分布的密度函数为：
f(x)=1π11+(x−θ)2−∞<x<+∞ f(x) = \frac{1}{\pi} \frac{1}{1 + (x - \theta)^2} \qquad -\infty < x < +\infty f(x)=π11+(x−θ)21−∞<x<+∞

例题

问题：一束光线围绕 y 轴上距离 x 轴一个单位的中心旋转，求光线指向 x 轴上点 XXX 的分布。

解：

光线与 y 轴夹角 θ\thetaθ 服从 (−π/2,π/2)(-\pi/2, \pi/2)(−π/2,π/2) 上的均匀分布
X=tan⁡θX = \tan\thetaX=tanθ
分布函数：
F(x)=P{X≤x}=P{tan⁡θ≤x}=P{θ≤arctan⁡x}=12+1πarctan⁡x F(x) = P\{X \leq x\} = P\{\tan\theta \leq x\} = P\{\theta \leq \arctan x\} = \frac{1}{2} + \frac{1}{\pi}\arctan x F(x)=P{X≤x}=P{tanθ≤x}=P{θ≤arctanx}=21+π1arctanx
密度函数：
f(x)=ddxF(x)=1π(1+x2) f(x) = \frac{\mathrm{d}}{\mathrm{d}x}F(x) = \frac{1}{\pi(1+x^2)} f(x)=dxdF(x)=π(1+x2)1

因此，XXX 服从柯西分布。

5.9 β分布

定义

β分布的密度函数为：
f(x)={1B(a,b)xa−1(1−x)b−10<x<10其他 f(x) = \begin{cases} \frac{1}{B(a,b)} x^{a-1} (1-x)^{b-1} & 0 < x < 1 \\ 0 & \text{其他} \end{cases} f(x)={B(a,b)1xa−1(1−x)b−100<x<1其他

其中 B(a,b)B(a,b)B(a,b) 是 β 函数：
B(a,b)=∫01xa−1(1−x)b−1 dx B(a,b) = \int_0^1 x^{a-1} (1-x)^{b-1} \, \mathrm{d}x B(a,b)=∫01xa−1(1−x)b−1dx

β 函数与 Γ 函数的关系

B(a,b)=Γ(a)Γ(b)Γ(a+b) B(a,b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)} B(a,b)=Γ(a+b)Γ(a)Γ(b)

期望和方差

期望：E[X]=aa+b\boxed{E[X] = \frac{a}{a+b}}E[X]=a+ba
方差：Var(X)=ab(a+b)2(a+b+1)\boxed{Var(X) = \frac{ab}{(a+b)^2(a+b+1)}}Var(X)=(a+b)2(a+b+1)ab

特性

当 a=ba = ba=b 时，密度函数关于 x=12x = \frac{1}{2}x=21 对称
当 a=b=1a = b = 1a=b=1 时，退化为 (0,1)(0,1)(0,1) 上的均匀分布
当 b>ab > ab>a 时，密度函数向左偏斜
当 a>ba > ba>b 时，密度函数向右偏斜

5.10 随机变量函数的分布

定理 7.1

设 XXX 为连续型随机变量，密度函数为 fXf_XfX。设 g(x)g(x)g(x) 为严格单调（递增或递减）且可微的函数，则随机变量 Y=g(X)Y = g(X)Y=g(X) 的密度函数为：
fY(y)={fX[g−1(y)]∣ddyg−1(y)∣if y=g(x) for some x0if y≠g(x) for any x \boxed{f_Y(y) = \begin{cases} f_X[g^{-1}(y)] \left| \frac{d}{dy} g^{-1}(y) \right| & \text{if } y = g(x) \text{ for some } x \\ 0 & \text{if } y \neq g(x) \text{ for any } x \end{cases}} fY(y)={fX[g−1(y)] dydg−1(y) 0if y=g(x) for some xif y=g(x) for any x

其中 g−1(y)g^{-1}(y)g−1(y) 是满足 g(x)=yg(x) = yg(x)=y 的 xxx 值。

证明（g(x)g(x)g(x) 递增的情况）
FY(y)=P{g(X)≤y}=P{X≤g−1(y)}=FX(g−1(y)) \begin{aligned} F_Y(y) &= P\{g(X) \leq y\} \\ &= P\{X \leq g^{-1}(y)\} \\ &= F_X(g^{-1}(y)) \end{aligned} FY(y)=P{g(X)≤y}=P{X≤g−1(y)}=FX(g−1(y))

求导得：
fY(y)=fX(g−1(y))ddyg−1(y) f_Y(y) = f_X(g^{-1}(y)) \frac{d}{dy} g^{-1}(y) fY(y)=fX(g−1(y))dydg−1(y)

由于 g−1(y)g^{-1}(y)g−1(y) 单调非降，导数非负，因此：
fY(y)=fX(g−1(y))∣ddyg−1(y)∣ f_Y(y) = f_X(g^{-1}(y)) \left| \frac{d}{dy} g^{-1}(y) \right| fY(y)=fX(g−1(y)) dydg−1(y)

例题

例 7a ：Y=XnY = X^nY=Xn，其中 XXX 服从 (0,1)(0, 1)(0,1) 上的均匀分布

分布函数：
FY(y)=P{Y≤y}=P{Xn≤y}=P{X≤y1/n}=y1/n(0≤y≤1) F_Y(y) = P\{Y \leq y\} = P\{X^n \leq y\} = P\{X \leq y^{1/n}\} = y^{1/n} \quad (0 \leq y \leq 1) FY(y)=P{Y≤y}=P{Xn≤y}=P{X≤y1/n}=y1/n(0≤y≤1)
密度函数：
fY(y)=1ny1/n−1(0≤y≤1) f_Y(y) = \frac{1}{n} y^{1/n - 1} \quad (0 \leq y \leq 1) fY(y)=n1y1/n−1(0≤y≤1)

例 7b ：Y=X2Y = X^2Y=X2

分布函数：
FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y) F_Y(y) = P\{Y \leq y\} = P\{-\sqrt{y} \leq X \leq \sqrt{y}\} = F_X(\sqrt{y}) - F_X(-\sqrt{y}) FY(y)=P{Y≤y}=P{−y ≤X≤y }=FX(y )−FX(−y )
密度函数：
fY(y)=12y[fX(y)+fX(−y)] f_Y(y) = \frac{1}{2\sqrt{y}} [f_X(\sqrt{y}) + f_X(-\sqrt{y})] fY(y)=2y 1[fX(y )+fX(−y )]

例 7c ：Y=∣X∣Y = |X|Y=∣X∣

分布函数：
FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y) F_Y(y) = P\{Y \leq y\} = P\{-y \leq X \leq y\} = F_X(y) - F_X(-y) FY(y)=P{Y≤y}=P{−y≤X≤y}=FX(y)−FX(−y)
密度函数：
fY(y)=fX(y)+fX(−y)(y≥0) f_Y(y) = f_X(y) + f_X(-y) \quad (y \geq 0) fY(y)=fX(y)+fX(−y)(y≥0)

例 7d ：Y=XnY = X^nY=Xn，其中 XXX 是非负连续型随机变量

g(x)=xng(x) = x^ng(x)=xn，g−1(y)=y1/ng^{-1}(y) = y^{1/n}g−1(y)=y1/n
ddyg−1(y)=1ny1/n−1\frac{d}{dy} g^{-1}(y) = \frac{1}{n} y^{1/n-1}dydg−1(y)=n1y1/n−1
密度函数：
fY(y)=1ny1/n−1f(y1/n)(y≥0) f_Y(y) = \frac{1}{n} y^{1/n-1} f(y^{1/n}) \quad (y \geq 0) fY(y)=n1y1/n−1f(y1/n)(y≥0)

例 7e：对数正态分布

如果 XXX 服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)，则 Y=eXY = e^XY=eX 服从对数正态分布。

g(x)=exg(x) = e^xg(x)=ex，g−1(y)=ln⁡(y)g^{-1}(y) = \ln(y)g−1(y)=ln(y)
ddyg−1(y)=1y\frac{d}{dy} g^{-1}(y) = \frac{1}{y}dydg−1(y)=y1
密度函数：
fY(y)=12πσyexp⁡{−(ln⁡(y)−μ)22σ2}(y>0) f_Y(y) = \frac{1}{\sqrt{2\pi}\sigma y} \exp\left\{-\frac{(\ln(y) - \mu)^2}{2\sigma^2}\right\} \quad (y > 0) fY(y)=2π σy1exp{−2σ2(ln(y)−μ)2}(y>0)

本节小结

指数随机变量

特性	公式
密度函数	f(x)={λe−λxx≥00x<0f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}f(x)={λe−λx0x≥0x<0
分布函数	F(x)={1−e−λxx≥00x<0F(x) = \begin{cases} 1 - e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}F(x)={1−e−λx0x≥0x<0
期望	E[X]=1λE[X] = \frac{1}{\lambda}E[X]=λ1
方差	Var(X)=1λ2Var(X) = \frac{1}{\lambda^2}Var(X)=λ21
无记忆性	P{X>s+t∣X>t}=P{X>s}P\{X > s+t \mid X > t\} = P\{X > s\}P{X>s+t∣X>t}=P{X>s}
危险率函数	λ(t)=λ\lambda(t) = \lambdaλ(t)=λ（常数）

其他连续分布

分布	密度函数	期望	方差
Γ分布	f(x)={λe−λx(λx)α−1Γ(α)x≥00x<0f(x) = \begin{cases} \frac{\lambda e^{-\lambda x} (\lambda x)^{\alpha - 1}}{\Gamma(\alpha)} & x \geq 0 \\ 0 & x < 0 \end{cases}f(x)={Γ(α)λe−λx(λx)α−10x≥0x<0	αλ\frac{\alpha}{\lambda}λα	αλ2\frac{\alpha}{\lambda^2}λ2α
韦布尔分布	f(x)={βα(x−να)β−1e−(x−να)βx>ν0x≤νf(x) = \begin{cases} \frac{\beta}{\alpha} \left( \frac{x - \nu}{\alpha} \right)^{\beta - 1} e^{-\left( \frac{x - \nu}{\alpha} \right)^{\beta}} & x > \nu \\ 0 & x \leq \nu \end{cases}f(x)={αβ(αx−ν)β−1e−(αx−ν)β0x>νx≤ν	-	-
柯西分布	f(x)=1π11+(x−θ)2f(x) = \frac{1}{\pi} \frac{1}{1 + (x - \theta)^2}f(x)=π11+(x−θ)21	不存在	不存在
β分布	f(x)={1B(a,b)xa−1(1−x)b−10<x<10其他f(x) = \begin{cases} \frac{1}{B(a,b)} x^{a-1} (1-x)^{b-1} & 0 < x < 1 \\ 0 & \text{其他} \end{cases}f(x)={B(a,b)1xa−1(1−x)b−100<x<1其他	aa+b\frac{a}{a+b}a+ba	ab(a+b)2(a+b+1)\frac{ab}{(a+b)^2(a+b+1)}(a+b)2(a+b+1)ab

随机变量函数的分布

定理 7.1 ：fY(y)=fX[g−1(y)]∣ddyg−1(y)∣f_Y(y) = f_X[g^{-1}(y)] \left| \frac{d}{dy} g^{-1}(y) \right|fY(y)=fX[g−1(y)] dydg−1(y)
应用：
- Y=XnY = X^nY=Xn：fY(y)=1ny1/n−1f(y1/n)f_Y(y) = \frac{1}{n} y^{1/n-1} f(y^{1/n})fY(y)=n1y1/n−1f(y1/n)
- Y=∣X∣Y = |X|Y=∣X∣：fY(y)=fX(y)+fX(−y)f_Y(y) = f_X(y) + f_X(-y)fY(y)=fX(y)+fX(−y)
- 对数正态分布：fY(y)=12πσyexp⁡{−(ln⁡(y)−μ)22σ2}f_Y(y) = \frac{1}{\sqrt{2\pi}\sigma y} \exp\left\{-\frac{(\ln(y) - \mu)^2}{2\sigma^2}\right\}fY(y)=2π σy1exp{−2σ2(ln(y)−μ)2}

概率论基础教程第5章 连续型随机变量(三)

5.5 指数随机变量

定义

期望与方差

无记忆性

例题

拉普拉斯分布

定义

危险率函数

定义

5.6 Γ分布

定义

期望和方差

5.7 韦布尔分布

定义

应用

5.8 柯西分布

定义

例题

5.9 β分布

定义

β 函数与 Γ 函数的关系

期望和方差

特性

5.10 随机变量函数的分布

定理 7.1

例题

本节小结

指数随机变量

其他连续分布

随机变量函数的分布

概率论基础教程第5章连续型随机变量(三)