概率论基础教程第5章连续型随机变量(二)

5.3 均匀随机变量

定义与性质

均匀随机变量是最简单的连续型随机变量，其概率密度函数在整个定义区间内为常数。

(0,1)区间

如果随机变量 XXX 的密度函数为：
f(x)={10<x<10其他(3.1) f(x) = \begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases} \tag{3.1} f(x)={100<x<1其他(3.1)

则称 XXX 在 (0,1)(0,1)(0,1) 区间上均匀分布。

验证：

f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
∫−∞∞f(x) dx=∫011 dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = \int_{0}^{1} 1 \, \mathrm{d}x = 1∫−∞∞f(x)dx=∫011dx=1

一般区间

更一般地，如果随机变量 XXX 的密度函数为：
f(x)={1β−αα<x<β0其他(3.2) f(x) = \begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases} \tag{3.2} f(x)={β−α10α<x<β其他(3.2)

则称 XXX 在区间 (α,β)(\alpha, \beta)(α,β) 上均匀分布。

直观理解：

由于 f(x)f(x)f(x) 在 (α,β)(\alpha, \beta)(α,β) 内为常数，XXX 在区间内任何位置取值的概率密度相同
对任意 a,ba, ba,b 满足 α≤a<b≤β\alpha \leq a < b \leq \betaα≤a<b≤β：
P{a⩽X⩽b}=∫abf(x) dx=b−aβ−α P\{a \leqslant X \leqslant b\} = \int_a^b f(x) \, \mathrm{d}x = \frac{b-a}{\beta-\alpha} P{a⩽X⩽b}=∫abf(x)dx=β−αb−a
这表明 XXX 属于 (α,β)(\alpha, \beta)(α,β) 的任一子区间的概率等于该子区间长度与总区间长度的比值

分布函数

区间 (α,β)(\alpha, \beta)(α,β) 上均匀随机变量的分布函数为：
F(a)={0a≤αa−αβ−αα<a<β1a≥β F(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases} F(a)=⎩ ⎨ ⎧0β−αa−α1a≤αα<a<βa≥β

期望

E[X]=∫−∞∞xf(x) dx=∫αβxβ−α dx=1β−α[x22]αβ=β2−α22(β−α)=(β−α)(β+α)2(β−α)=β+α2 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{\alpha}^{\beta} \frac{x}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^2}{2} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^2 - \alpha^2}{2(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta + \alpha)}{2(\beta - \alpha)} \\ &= \frac{\beta + \alpha}{2} \end{aligned} E[X]=∫−∞∞xf(x)dx=∫αββ−αxdx=β−α1[2x2]αβ=2(β−α)β2−α2=2(β−α)(β−α)(β+α)=2β+α

方差

首先计算 E[X2]E[X^2]E[X2]：
E[X2]=∫αβx2β−α dx=1β−α[x33]αβ=β3−α33(β−α)=(β−α)(β2+αβ+α2)3(β−α)=β2+αβ+α23 \begin{aligned} E[X^2] &= \int_{\alpha}^{\beta} \frac{x^2}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^3}{3} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^3 - \alpha^3}{3(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta^2 + \alpha\beta + \alpha^2)}{3(\beta - \alpha)} \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} \end{aligned} E[X2]=∫αββ−αx2dx=β−α1[3x3]αβ=3(β−α)β3−α3=3(β−α)(β−α)(β2+αβ+α2)=3β2+αβ+α2

然后计算方差：
Var(X)=E[X2]−(E[X])2=β2+αβ+α23−(β+α2)2=4(β2+αβ+α2)−3(β2+2αβ+α2)12=4β2+4αβ+4α2−3β2−6αβ−3α212=β2−2αβ+α212=(β−α)212 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} - \left(\frac{\beta + \alpha}{2}\right)^2 \\ &= \frac{4(\beta^2 + \alpha\beta + \alpha^2) - 3(\beta^2 + 2\alpha\beta + \alpha^2)}{12} \\ &= \frac{4\beta^2 + 4\alpha\beta + 4\alpha^2 - 3\beta^2 - 6\alpha\beta - 3\alpha^2}{12} \\ &= \frac{\beta^2 - 2\alpha\beta + \alpha^2}{12} \\ &= \frac{(\beta - \alpha)^2}{12} \end{aligned} Var(X)=E[X2]−(E[X])2=3β2+αβ+α2−(2β+α)2=124(β2+αβ+α2)−3(β2+2αβ+α2)=124β2+4αβ+4α2−3β2−6αβ−3α2=12β2−2αβ+α2=12(β−α)2

例题

例 3b ：如果 XXX 服从 (0,10)(0, 10)(0,10) 上的均匀分布，计算：

(a) P{X<3}P\{X < 3\}P{X<3} ：
P{X<3}=∫03110 dx=310 P\{X < 3\} = \int_{0}^{3} \frac{1}{10} \, \mathrm{d}x = \frac{3}{10} P{X<3}=∫03101dx=103
(b) P{X>6}P\{X > 6\}P{X>6} ：
P{X>6}=∫610110 dx=410 P\{X > 6\} = \int_{6}^{10} \frac{1}{10} \, \mathrm{d}x = \frac{4}{10} P{X>6}=∫610101dx=104
© P{3<X<8}P\{3 < X < 8\}P{3<X<8} ：
P{3<X<8}=∫38110 dx=510=12 P\{3 < X < 8\} = \int_{3}^{8} \frac{1}{10} \, \mathrm{d}x = \frac{5}{10} = \frac{1}{2} P{3<X<8}=∫38101dx=105=21

例 3c：某乘客在 7:00 到 7:30 之间到达车站的时间服从均匀分布，求：

(a) 等车时间不超过 5 分钟的概率

假设公交车在 7:00, 7:15, 7:30 等时间点发车，等车时间不超过 5 分钟意味着乘客在 7:10-7:15 或 7:25-7:30 之间到达：
P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015130 dx+∫2530130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} \leq 5\} &= P\{10 < X < 15\} + P\{25 < X < 30\} \\ &= \int_{10}^{15} \frac{1}{30} \, \mathrm{d}x + \int_{25}^{30} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015301dx+∫2530301dx=305+305=31
(b) 等车时间超过 10 分钟的概率

等车时间超过 10 分钟意味着乘客在 7:00-7:05 或 7:15-7:20 之间到达：
P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05130 dx+∫1520130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} > 10\} &= P\{0 < X < 5\} + P\{15 < X < 20\} \\ &= \int_{0}^{5} \frac{1}{30} \, \mathrm{d}x + \int_{15}^{20} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05301dx+∫1520301dx=305+305=31

例 3d：贝特朗悖论

考虑随机地从圆中取一根弦，该弦的长度大于该圆内接正三角形的边长的概率是多大？

问题：这个概率取决于"随机"的定义方式。

方法一：按弦到圆心的距离

弦的位置由它到圆心的距离 DDD 决定，D∈[0,r]D \in [0, r]D∈[0,r]
当 D<r/2D < r/2D<r/2 时，弦长 > 内接正三角形边长
假设 DDD 在 [0,r][0, r][0,r] 上均匀分布：
P{D<r2}=r/2r=12 P\left\{D < \frac{r}{2}\right\} = \frac{r/2}{r} = \frac{1}{2} P{D<2r}=rr/2=21

方法二：按弦与切线的夹角

弦的位置由它与切线的夹角 θ\thetaθ 决定，θ∈[0∘,180∘]\theta \in [0^\circ, 180^\circ]θ∈[0∘,180∘]
当 θ∈[60∘,120∘]\theta \in [60^\circ, 120^\circ]θ∈[60∘,120∘] 时，弦长 > 内接正三角形边长
假设 θ\thetaθ 在 [0∘,180∘][0^\circ, 180^\circ][0∘,180∘] 上均匀分布：
P{60<θ<120}=120−60180=13 P\{60 < \theta < 120\} = \frac{120 - 60}{180} = \frac{1}{3} P{60<θ<120}=180120−60=31

$!TIP$
贝特朗悖论说明：在概率论中，"随机"的定义必须明确。不同的随机机制可能导致不同的概率结果。

5.4 正态随机变量

定义

如果随机变量 XXX 的密度函数为：
f(x)=12πσe−(x−μ)2/2σ2−∞<x<∞ f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2} \qquad -\infty < x < \infty f(x)=2π σ1e−(x−μ)2/2σ2−∞<x<∞

则称 XXX 是服从参数为 μ\muμ 和 σ2\sigma^2σ2 的正态分布 的随机变量，简称为正态随机变量。

特性：

密度函数是一条关于 μ\muμ 对称的钟形曲线
μ\muμ 是分布的均值（期望）
σ2\sigma^2σ2 是分布的方差
σ\sigmaσ 是标准差

密度函数

需要验证：
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=1 \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = 1 2π σ1∫−∞∞e−(x−μ)2/2σ2dx=1

令 y=(x−μ)/σy = (x-\mu)/\sigmay=(x−μ)/σ，则：
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=12π∫−∞∞e−y2/2 dy \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y 2π σ1∫−∞∞e−(x−μ)2/2σ2dx=2π 1∫−∞∞e−y2/2dy

计算：
I=∫−∞∞e−y2/2 dyI2=∫−∞∞e−y2/2 dy∫−∞∞e−x2/2 dx=∫−∞∞∫−∞∞e−(x2+y2)/2 dx dy \begin{aligned} I &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \\ I^2 &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \int_{-\infty}^{\infty} e^{-x^2/2} \, \mathrm{d}x \\ &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(x^2+y^2)/2} \, \mathrm{d}x \, \mathrm{d}y \end{aligned} II2=∫−∞∞e−y2/2dy=∫−∞∞e−y2/2dy∫−∞∞e−x2/2dx=∫−∞∞∫−∞∞e−(x2+y2)/2dxdy

$!IMPORTANT$
极坐标变换技巧复习

坐标变换公式

笛卡尔坐标极坐标关系

xxx rcos⁡θr\cos\thetarcosθ x=rcos⁡θx = r\cos\thetax=rcosθ

yyy rsin⁡θr\sin\thetarsinθ y=rsin⁡θy = r\sin\thetay=rsinθ

x2+y2x^2 + y^2x2+y2 r2r^2r2 r=x2+y2r = \sqrt{x^2 + y^2}r=x2+y2

- θ\thetaθ θ=arctan⁡(y/x)\theta = \arctan(y/x)θ=arctan(y/x)（需考虑象限）

面积元素变换（关键！）

在极坐标下，面积元素发生变化：
dx dy=r dr dθ \boxed{dx\,dy = r\,dr\,d\theta} dxdy=rdrdθ

几何解释：在极坐标中，一个小区域的面积近似为扇形，其面积 = 半径 × 弧长 = r⋅(rdθ)⋅dr=r dr dθr \cdot (r d\theta) \cdot dr = r\,dr\,d\thetar⋅(rdθ)⋅dr=rdrdθ

数学解释：通过雅可比行列式 计算：
J=∂(x,y)∂(r,θ)=∣∂x∂r∂x∂θ∂y∂r∂y∂θ∣=∣cos⁡θ−rsin⁡θsin⁡θrcos⁡θ∣=r(cos⁡2θ+sin⁡2θ)=r J = \frac{\partial(x,y)}{\partial(r,\theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r(\cos^2\theta + \sin^2\theta) = r J=∂(r,θ)∂(x,y)= ∂r∂x∂r∂y∂θ∂x∂θ∂y = cosθsinθ−rsinθrcosθ =r(cos2θ+sin2θ)=r

因此 dx dy=∣J∣ dr dθ=r dr dθdx\,dy = |J|\,dr\,d\theta = r\,dr\,d\thetadxdy=∣J∣drdθ=rdrdθ

积分区域转换

笛卡尔区域极坐标区域

整个平面 R2\mathbb{R}^2R2 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π

上半平面 y≥0y \geq 0y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π0 \leq \theta \leq \pi0≤θ≤π

第一象限 x≥0,y≥0x \geq 0, y \geq 0x≥0,y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π20 \leq \theta \leq \frac{\pi}{2}0≤θ≤2π

圆盘 x2+y2≤a2x^2 + y^2 \leq a^2x2+y2≤a2 0≤r≤a0 \leq r \leq a0≤r≤a, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π

笛卡尔坐标	极坐标	关系
xxx	rcos⁡θr\cos\thetarcosθ	x=rcos⁡θx = r\cos\thetax=rcosθ
yyy	rsin⁡θr\sin\thetarsinθ	y=rsin⁡θy = r\sin\thetay=rsinθ
x2+y2x^2 + y^2x2+y2	r2r^2r2	r=x2+y2r = \sqrt{x^2 + y^2}r=x2+y2
-	θ\thetaθ	θ=arctan⁡(y/x)\theta = \arctan(y/x)θ=arctan(y/x)（需考虑象限）

笛卡尔区域	极坐标区域
整个平面 R2\mathbb{R}^2R2	0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π
上半平面 y≥0y \geq 0y≥0	0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π0 \leq \theta \leq \pi0≤θ≤π
第一象限 x≥0,y≥0x \geq 0, y \geq 0x≥0,y≥0	0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π20 \leq \theta \leq \frac{\pi}{2}0≤θ≤2π
圆盘 x2+y2≤a2x^2 + y^2 \leq a^2x2+y2≤a2	0≤r≤a0 \leq r \leq a0≤r≤a, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π

使用极坐标变换 x=rcos⁡θx = r\cos\thetax=rcosθ，y=rsin⁡θy = r\sin\thetay=rsinθ：
I2=∫0∞∫02πe−r2/2r dθ dr=2π∫0∞re−r2/2 dr=−2πe−r2/2∣0∞=2π \begin{aligned} I^2 &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-r^2/2} r \, \mathrm{d}\theta \, \mathrm{d}r \\ &= 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, \mathrm{d}r \\ &= -2\pi e^{-r^2/2} \Big|_{0}^{\infty} \\ &= 2\pi \end{aligned} I2=∫0∞∫02πe−r2/2rdθdr=2π∫0∞re−r2/2dr=−2πe−r2/2 0∞=2π

$!NOTE$
计算角度积分：
∫02πdθ=θ∣02π=2π−0=2π \int_{0}^{2\pi} d\theta = \theta \Big|_{0}^{2\pi} = 2\pi - 0 = 2\pi ∫02πdθ=θ 02π=2π−0=2π

所以：
I2=2π∫0∞re−r2/2 dr I^2 = 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, dr I2=2π∫0∞re−r2/2dr

现在需要计算：
∫0∞re−r2/2 dr \int_{0}^{\infty} r e^{-r^2/2} \, dr ∫0∞re−r2/2dr

这是一个典型的可以通过变量替换解决的积分。

令 u=r22u = \frac{r^2}{2}u=2r2，则：

du=r drdu = r \, drdu=rdr（因为 dudr=r\frac{du}{dr} = rdrdu=r）

当 r=0r = 0r=0 时，u=0u = 0u=0

当 r→∞r \to \inftyr→∞ 时，u→∞u \to \inftyu→∞

代入得：
∫0∞re−r2/2 dr=∫0∞e−u du \int_{0}^{\infty} r e^{-r^2/2} \, dr = \int_{0}^{\infty} e^{-u} \, du ∫0∞re−r2/2dr=∫0∞e−udu

这个积分很简单：
∫0∞e−u du=−e−u∣0∞=−(e−∞−e0)=−(0−1)=1 \int_{0}^{\infty} e^{-u} \, du = -e^{-u} \Big|_{0}^{\infty} = -(e^{-\infty} - e^{0}) = -(0 - 1) = 1 ∫0∞e−udu=−e−u 0∞=−(e−∞−e0)=−(0−1)=1

I2=2π⋅1=2π I^2 = 2\pi \cdot 1 = 2\pi I2=2π⋅1=2π

因此：
I=2π I = \sqrt{2\pi} I=2π

这意味着：
∫−∞∞e−x2/2 dx=2π \int_{-\infty}^{\infty} e^{-x^2/2} \, dx = \sqrt{2\pi} ∫−∞∞e−x2/2dx=2π

因此 I=2πI = \sqrt{2\pi}I=2π ，证明了：
12π∫−∞∞e−y2/2 dy=1 \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y = 1 2π 1∫−∞∞e−y2/2dy=1

性质

线性变换

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2)，则 aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2)。

证明：

令 Y=aX+bY = aX + bY=aX+b，a>0a > 0a>0（a<0a < 0a<0 时证明类似）
YYY 的分布函数：
FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤x−ba}=FX(x−ba) F_Y(x) = P\{Y \leq x\} = P\{aX + b \leq x\} = P\left\{X \leq \frac{x-b}{a}\right\} = F_X\left(\frac{x-b}{a}\right) FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤ax−b}=FX(ax−b)
求导得密度函数：
fY(x)=1afX(x−ba)=12πaσexp⁡{−(x−ba−μ)2/2σ2}=12πaσexp⁡{−(x−b−aμ)2/2(aσ)2} \begin{aligned} f_Y(x) &= \frac{1}{a} f_X\left(\frac{x-b}{a}\right) \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(\frac{x-b}{a} - \mu\right)^2 / 2\sigma^2\right\} \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(x - b - a\mu\right)^2 / 2(a\sigma)^2\right\} \end{aligned} fY(x)=a1fX(ax−b)=2πaσ 1exp{−(ax−b−μ)2/2σ2}=2πaσ 1exp{−(x−b−aμ)2/2(aσ)2}
这表明 Y∼N(aμ+b,a2σ2)Y \sim N(a\mu + b, a^2\sigma^2)Y∼N(aμ+b,a2σ2)

标准正态分布

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2)，则 Z=(X−μ)/σ∼N(0,1)Z = (X - \mu)/\sigma \sim N(0, 1)Z=(X−μ)/σ∼N(0,1)。

标准正态分布的密度函数为：
fZ(z)=12πe−z2/2 f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2} fZ(z)=2π 1e−z2/2
分布函数记为 Φ(z)\Phi(z)Φ(z)：
Φ(z)=12π∫−∞ze−y2/2 dy \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y Φ(z)=2π 1∫−∞ze−y2/2dy
对称性：Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z)

期望与方差

例 4a ：设 XXX 是参数为 μ\muμ 和 σ2\sigma^2σ2 的正态随机变量，求 E[X]E[X]E[X] 和 Var(X)Var(X)Var(X)。

先计算标准正态变量 ZZZ 的期望：
E[Z]=12π∫−∞∞ze−z2/2 dz=0 E[Z] = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-z^2/2} \, \mathrm{d}z = 0 E[Z]=2π 1∫−∞∞ze−z2/2dz=0

（奇函数在对称区间上的积分）
计算 Var(Z)=E[Z2]Var(Z) = E[Z^2]Var(Z)=E[Z2]：
Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π[−ze−z2/2∣−∞∞+∫−∞∞e−z2/2 dz]=12π∫−∞∞e−z2/2 dz=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, \mathrm{d}z \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2/2} \Big|{-\infty}^{\infty} + \int{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z \right] \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z = 1 \end{aligned} Var(Z)=2π 1∫−∞∞z2e−z2/2dz=2π 1[−ze−z2/2 −∞∞+∫−∞∞e−z2/2dz]=2π 1∫−∞∞e−z2/2dz=1
由于 X=μ+σZX = \mu + \sigma ZX=μ+σZ：
E[X]=μ+σE[Z]=μVar(X)=σ2Var(Z)=σ2 \begin{aligned} E[X] &= \mu + \sigma E[Z] = \mu \\ Var(X) &= \sigma^2 Var(Z) = \sigma^2 \end{aligned} E[X]Var(X)=μ+σE[Z]=μ=σ2Var(Z)=σ2

$!IMPORTANT$
标准正态分布方差的详细计算

步骤 1：设置积分
Var(Z)=12π∫−∞∞z2e−z2/2 dz Var(Z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz Var(Z)=2π 1∫−∞∞z2e−z2/2dz

步骤 2：应用分部积分法

我们需要计算 ∫−∞∞z2e−z2/2 dz\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz∫−∞∞z2e−z2/2dz，使用分部积分法：

回忆分部积分公式：
∫u dv=uv−∫v du \int u \, dv = uv - \int v \, du ∫udv=uv−∫vdu

选择：

令 u=zu = zu=z，则 du=dzdu = dzdu=dz

令 dv=ze−z2/2 dzdv = z e^{-z^2/2} \, dzdv=ze−z2/2dz，则 v=−e−z2/2v = -e^{-z^2/2}v=−e−z2/2（因为 ddz(−e−z2/2)=ze−z2/2\frac{d}{dz}(-e^{-z^2/2}) = z e^{-z^2/2}dzd(−e−z2/2)=ze−z2/2）

应用公式：
∫z2e−z2/2 dz=∫u dv=uv−∫v du=z⋅(−e−z2/2)−∫(−e−z2/2) dz=−ze−z2/2+∫e−z2/2 dz \begin{aligned} \int z^2 e^{-z^2/2} \, dz &= \int u \, dv \\ &= uv - \int v \, du \\ &= z \cdot (-e^{-z^2/2}) - \int (-e^{-z^2/2}) \, dz \\ &= -z e^{-z^2/2} + \int e^{-z^2/2} \, dz \end{aligned} ∫z2e−z2/2dz=∫udv=uv−∫vdu=z⋅(−e−z2/2)−∫(−e−z2/2)dz=−ze−z2/2+∫e−z2/2dz

步骤 3：计算定积分

将上述结果应用于定积分：
∫−∞∞z2e−z2/2 dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = \left[ -z e^{-z^2/2} \right]{-\infty}^{\infty} + \int{-\infty}^{\infty} e^{-z^2/2} \, dz ∫−∞∞z2e−z2/2dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2dz

分析边界项 [−ze−z2/2]−∞∞\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty}[−ze−z2/2]−∞∞：

当 z→∞z \to \inftyz→∞ 时：
lim⁡z→∞(−ze−z2/2)=lim⁡z→∞−zez2/2 \lim_{z \to \infty} (-z e^{-z^2/2}) = \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} z→∞lim(−ze−z2/2)=z→∞limez2/2−z

这是一个 ∞∞\frac{\infty}{\infty}∞∞ 型不定式，应用洛必达法则：
lim⁡z→∞−zez2/2=lim⁡z→∞−1zez2/2=0 \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} = \lim_{z \to \infty} \frac{-1}{z e^{z^2/2}} = 0 z→∞limez2/2−z=z→∞limzez2/2−1=0

（分子是常数，分母趋向无穷大）

当 z→−∞z \to -\inftyz→−∞ 时：
lim⁡z→−∞(−ze−z2/2)=lim⁡z→−∞−zez2/2 \lim_{z \to -\infty} (-z e^{-z^2/2}) = \lim_{z \to -\infty} \frac{-z}{e^{z^2/2}} z→−∞lim(−ze−z2/2)=z→−∞limez2/2−z

令 w=−zw = -zw=−z，则 w→∞w \to \inftyw→∞：
lim⁡w→∞wew2/2=0 \lim_{w \to \infty} \frac{w}{e^{w^2/2}} = 0 w→∞limew2/2w=0

（同样应用洛必达法则）

因此：
$−ze−z2/2\]−∞∞=0−0=0 \\left\[ -z e\^{-z\^2/2} \\right\]_{-\\infty}\^{\\infty} = 0 - 0 = 0 \[−ze−z2/2\]−∞∞=0−0=0 步骤 4：简化表达式代入边界项的结果： ∫−∞∞z2e−z2/2 dz=0+∫−∞∞e−z2/2 dz=∫−∞∞e−z2/2 dz \\int_{-\\infty}\^{\\infty} z\^2 e\^{-z\^2/2} \\, dz = 0 + \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz = \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz ∫−∞∞z2e−z2/2dz=0+∫−∞∞e−z2/2dz=∫−∞∞e−z2/2dz 步骤 5：应用高斯积分结果从之前的讨论（极坐标变换）我们知道： ∫−∞∞e−z2/2 dz=2π \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz = \\sqrt{2\\pi} ∫−∞∞e−z2/2dz=2π 将结果代入方差公式： Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π∫−∞∞e−z2/2 dz=12π⋅2π=1 \\begin{aligned} Var(Z) \&= \\frac{1}{\\sqrt{2\\pi}} \\int_{-\\infty}\^{\\infty} z\^2 e\^{-z\^2/2} \\, dz \\\\ \&= \\frac{1}{\\sqrt{2\\pi}} \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz \\\\ \&= \\frac{1}{\\sqrt{2\\pi}} \\cdot \\sqrt{2\\pi} \\\\ \&= 1 \\end{aligned} Var(Z)=2π 1∫−∞∞z2e−z2/2dz=2π 1∫−∞∞e−z2/2dz=2π 1⋅2π =1$

例题

例 4b ：如果 XXX 服从正态分布，参数为 μ=3\mu=3μ=3 和 σ2=9\sigma^2 = 9σ2=9（即 σ=3\sigma = 3σ=3），求：

(a) P{2≤X≤5}P\{2 \leq X \leq 5\}P{2≤X≤5} ：
P{2<X<5}=P{2−33<X−33<5−33}=P{−13<Z<23}=Φ(23)−Φ(−13)=Φ(23)−[1−Φ(13)]≈0.7486−(1−0.6293)=0.3779 \begin{aligned} P\{2 < X < 5\} &= P\left\{\frac{2-3}{3} < \frac{X-3}{3} < \frac{5-3}{3}\right\} \\ &= P\left\{-\frac{1}{3} < Z < \frac{2}{3}\right\} \\ &= \Phi\left(\frac{2}{3}\right) - \Phi\left(-\frac{1}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right) - \left[1 - \Phi\left(\frac{1}{3}\right)\right] \\ &\approx 0.7486 - (1 - 0.6293) = 0.3779 \end{aligned} P{2<X<5}=P{32−3<3X−3<35−3}=P{−31<Z<32}=Φ(32)−Φ(−31)=Φ(32)−[1−Φ(31)]≈0.7486−(1−0.6293)=0.3779
(b) P{X>0}P\{X > 0\}P{X>0} ：
P{X>0}=P{X−33>0−33}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413 \begin{aligned} P\{X > 0\} &= P\left\{\frac{X-3}{3} > \frac{0-3}{3}\right\} \\ &= P\{Z > -1\} \\ &= 1 - \Phi(-1) \\ &= \Phi(1) \approx 0.8413 \end{aligned} P{X>0}=P{3X−3>30−3}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413
© P{∣X−3∣>6}P\{|X-3| > 6\}P{∣X−3∣>6} ：
P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456 \begin{aligned} P\{|X-3| > 6\} &= P\{X > 9\} + P\{X < -3\} \\ &= P\{Z > 2\} + P\{Z < -2\} \\ &= [1 - \Phi(2)] + \Phi(-2) \\ &= 2[1 - \Phi(2)] \approx 2(1 - 0.9772) = 0.0456 \end{aligned} P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456

例 4c：考试分数的等级划分

如果考试分数服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)，则：

A等（超过 μ+σ\mu+\sigmaμ+σ）：P{X>μ+σ}=1−Φ(1)≈0.1587P\{X > \mu + \sigma\} = 1 - \Phi(1) \approx 0.1587P{X>μ+σ}=1−Φ(1)≈0.1587
B等（μ\muμ 到 μ+σ\mu+\sigmaμ+σ）：P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413P\{\mu < X < \mu + \sigma\} = \Phi(1) - \Phi(0) \approx 0.3413P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413
C等（μ−σ\mu-\sigmaμ−σ 到 μ\muμ）：P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413P\{\mu - \sigma < X < \mu\} = \Phi(0) - \Phi(-1) \approx 0.3413P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413
D等（μ−2σ\mu-2\sigmaμ−2σ 到 μ−σ\mu-\sigmaμ−σ）：P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359P\{\mu - 2\sigma < X < \mu - \sigma\} = \Phi(1) - \Phi(2) \approx 0.1359P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359
E等（低于 μ−2σ\mu-2\sigmaμ−2σ）：P{X<μ−2σ}=Φ(−2)≈0.0228P\{X < \mu - 2\sigma\} = \Phi(-2) \approx 0.0228P{X<μ−2σ}=Φ(−2)≈0.0228

因此，近似地：

A等：16%
B等：34%
C等：34%
D等：14%
E等：2%

例 4d：怀孕期问题

母亲的怀孕期 X∼N(270,100)X \sim N(270, 100)X∼N(270,100)（即 μ=270\mu = 270μ=270，σ=10\sigma = 10σ=10）。

如果被告是孩子的父亲，母亲在被告出国前或回国后怀孕的概率：
P{X>290 或 X<240}=P{X>290}+P{X<240}=P{X−27010>2}+P{X−27010<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241 \begin{aligned} P\{X > 290 \text{ 或 } X < 240\} &= P\{X > 290\} + P\{X < 240\} \\ &= P\left\{\frac{X-270}{10} > 2\right\} + P\left\{\frac{X-270}{10} < -3\right\} \\ &= [1 - \Phi(2)] + \Phi(-3) \\ &\approx (1 - 0.9772) + 0.0013 = 0.0241 \end{aligned} P{X>290 或 X<240}=P{X>290}+P{X<240}=P{10X−270>2}+P{10X−270<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241

例 4e：电信信号传输

当传送信息为 1 时发送值 2，为 0 时发送值 -2。接收值 R=x+NR = x + NR=x+N，其中 N∼N(0,1)N \sim N(0,1)N∼N(0,1)。

信息 1 被错误认为 0 的概率（当 R<0.5R < 0.5R<0.5）：
P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668 P\{2 + N < 0.5\} = P\{N < -1.5\} = 1 - \Phi(1.5) \approx 0.0668 P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668
信息 0 被错误认为 1 的概率（当 R≥0.5R \geq 0.5R≥0.5）：
P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062 P\{-2 + N \geq 0.5\} = P\{N \geq 2.5\} = 1 - \Phi(2.5) \approx 0.0062 P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062

正态近似

棣莫弗-拉普拉斯极限定理

在 nnn 次独立重复试验中，设每次成功的概率为 ppp，记成功总次数为 SnS_nSn，则对任意 a<ba < ba<b：

P{a⩽Sn−npnp(1−p)⩽b}→Φ(b)−Φ(a)当 n→∞ P\left\{a \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant b\right\} \to \Phi(b) - \Phi(a) \quad \text{当 } n \to \infty P{a⩽np(1−p) Sn−np⩽b}→Φ(b)−Φ(a)当 n→∞

使用条件：

当 np(1−p)≥10np(1-p) \geq 10np(1−p)≥10 时，正态近似效果很好
需要进行连续性修正（因为二项分布是离散的，而正态分布是连续的）

连续性修正：

P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5}，其中 XXX 为正态变量

例 4g：抛 40 次均匀硬币

设 XXX 为正面次数，X∼Binomial(40,0.5)X \sim \text{Binomial}(40, 0.5)X∼Binomial(40,0.5)。

正态近似：
P{X=20}=P{19.5<X<20.5}=P{19.5−2010<X−2010<20.5−2010}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272 \begin{aligned} P\{X = 20\} &= P\{19.5 < X < 20.5\} \\ &= P\left\{\frac{19.5 - 20}{\sqrt{10}} < \frac{X - 20}{\sqrt{10}} < \frac{20.5 - 20}{\sqrt{10}}\right\} \\ &\approx P\{-0.16 < Z < 0.16\} \\ &= \Phi(0.16) - \Phi(-0.16) \approx 0.1272 \end{aligned} P{X=20}=P{19.5<X<20.5}=P{10 19.5−20<10 X−20<10 20.5−20}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272
精确解：
P{X=20}=(4020)(12)40≈0.1254 P\{X = 20\} = \binom{40}{20} \left(\frac{1}{2}\right)^{40} \approx 0.1254 P{X=20}=(2040)(21)40≈0.1254

例 4h：学院招生问题

设 XXX 为入学新生人数，X∼Binomial(450,0.3)X \sim \text{Binomial}(450, 0.3)X∼Binomial(450,0.3)。

正态近似：
P{X≥150}≈P{X≥150.5}=P{X−450×0.3450×0.3×0.7≥150.5−13594.5}=P{Z≥15.59.72}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559 \begin{aligned} P\{X \geq 150\} &\approx P\{X \geq 150.5\} \\ &= P\left\{\frac{X - 450 \times 0.3}{\sqrt{450 \times 0.3 \times 0.7}} \geq \frac{150.5 - 135}{\sqrt{94.5}}\right\} \\ &= P\left\{Z \geq \frac{15.5}{9.72}\right\} \\ &= P\{Z \geq 1.59\} \\ &\approx 1 - \Phi(1.59) \approx 0.0559 \end{aligned} P{X≥150}≈P{X≥150.5}=P{450×0.3×0.7 X−450×0.3≥94.5 150.5−135}=P{Z≥9.7215.5}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559

因此，入学新生超过 150 名的概率约为 5.59%。

例 4i：胆固醇试验

设 XXX 为胆固醇降低的人数，X∼Binomial(100,0.5)X \sim \text{Binomial}(100, 0.5)X∼Binomial(100,0.5)（假设食品无效）。

正态近似：
P{X≥65}≈P{X≥64.5}=P{X−505≥64.5−505}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019 \begin{aligned} P\{X \geq 65\} &\approx P\{X \geq 64.5\} \\ &= P\left\{\frac{X - 50}{5} \geq \frac{64.5 - 50}{5}\right\} \\ &= P\{Z \geq 2.9\} \\ &\approx 1 - \Phi(2.9) \approx 0.0019 \end{aligned} P{X≥65}≈P{X≥64.5}=P{5X−50≥564.5−50}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019

因此，即使食品无效，营养学家仍承认它有效的概率约为 0.19%。

例 4j：纽约市民支持率

设 SnS_nSn 为支持禁令的人数，Sn∼Binomial(n,0.52)S_n \sim \text{Binomial}(n, 0.52)Sn∼Binomial(n,0.52)。

正态近似：
P{Sn>0.5n}=P{Sn−0.52nn×0.52×0.48>0.5n−0.52nn×0.52×0.48}=P{Z>−0.04n}=Φ(0.04n) \begin{aligned} P\{S_n > 0.5n\} &= P\left\{\frac{S_n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}} > \frac{0.5n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}}\right\} \\ &= P\left\{Z > -0.04\sqrt{n}\right\} \\ &= \Phi(0.04\sqrt{n}) \end{aligned} P{Sn>0.5n}=P{n×0.52×0.48 Sn−0.52n>n×0.52×0.48 0.5n−0.52n}=P{Z>−0.04n }=Φ(0.04n )
计算：
- n=11n = 11n=11：Φ(0.1328)≈0.5528\Phi(0.1328) \approx 0.5528Φ(0.1328)≈0.5528
- n=101n = 101n=101：Φ(0.4020)≈0.6562\Phi(0.4020) \approx 0.6562Φ(0.4020)≈0.6562
- n=1001n = 1001n=1001：Φ(1.2665)≈0.8973\Phi(1.2665) \approx 0.8973Φ(1.2665)≈0.8973
为使概率 > 0.95：
Φ(0.04n)>0.95⇒0.04n>1.645⇒n≥1692 \Phi(0.04\sqrt{n}) > 0.95 \Rightarrow 0.04\sqrt{n} > 1.645 \Rightarrow n \geq 1692 Φ(0.04n )>0.95⇒0.04n >1.645⇒n≥1692

本节小结

特性	公式
密度函数	f(x)={1β−αα<x<β0其他f(x) = \begin{cases} \frac{1}{\beta-\alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases}f(x)={β−α10α<x<β其他
分布函数	F(a)={0a≤αa−αβ−αα<a<β1a≥βF(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}F(a)=⎩ ⎨ ⎧0β−αa−α1a≤αα<a<βa≥β
期望	E[X]=α+β2E[X] = \frac{\alpha + \beta}{2}E[X]=2α+β
方差	Var(X)=(β−α)212Var(X) = \frac{(\beta - \alpha)^2}{12}Var(X)=12(β−α)2

正态随机变量

特性	公式
密度函数	f(x)=12πσe−(x−μ)2/2σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}f(x)=2π σ1e−(x−μ)2/2σ2
标准正态分布	Z=X−μσ∼N(0,1)Z = \frac{X-\mu}{\sigma} \sim N(0,1)Z=σX−μ∼N(0,1)
分布函数	Φ(z)=12π∫−∞ze−y2/2 dy\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}yΦ(z)=2π 1∫−∞ze−y2/2dy
对称性	Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z)
期望	E[X]=μE[X] = \muE[X]=μ
方差	Var(X)=σ2Var(X) = \sigma^2Var(X)=σ2
线性变换	aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2)

二项分布的正态近似

条件：np(1−p)≥10np(1-p) \geq 10np(1−p)≥10
连续性修正 ：P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5}
标准化 ：Sn−npnp(1−p)≈N(0,1)\frac{S_n - np}{\sqrt{np(1-p)}} \approx N(0,1)np(1−p) Sn−np≈N(0,1)概率论基础教程第5章连续型随机变量(一)

概率论基础教程第5章 连续型随机变量(二)