概率论基础教程第5章 连续型随机变量(二)

5.3 均匀随机变量

定义与性质

均匀随机变量是最简单的连续型随机变量,其概率密度函数在整个定义区间内为常数。

(0,1)区间

如果随机变量 XXX 的密度函数为:
f(x)={10<x<10其他(3.1) f(x) = \begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases} \tag{3.1} f(x)={100<x<1其他(3.1)

则称 XXX 在 (0,1)(0,1)(0,1) 区间上均匀分布

验证

  • f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
  • ∫−∞∞f(x) dx=∫011 dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = \int_{0}^{1} 1 \, \mathrm{d}x = 1∫−∞∞f(x)dx=∫011dx=1

一般区间

更一般地,如果随机变量 XXX 的密度函数为:
f(x)={1β−αα<x<β0其他(3.2) f(x) = \begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases} \tag{3.2} f(x)={β−α10α<x<β其他(3.2)

则称 XXX 在区间 (α,β)(\alpha, \beta)(α,β) 上均匀分布

直观理解

  • 由于 f(x)f(x)f(x) 在 (α,β)(\alpha, \beta)(α,β) 内为常数,XXX 在区间内任何位置取值的概率密度相同

  • 对任意 a,ba, ba,b 满足 α≤a<b≤β\alpha \leq a < b \leq \betaα≤a<b≤β:
    P{a⩽X⩽b}=∫abf(x) dx=b−aβ−α P\{a \leqslant X \leqslant b\} = \int_a^b f(x) \, \mathrm{d}x = \frac{b-a}{\beta-\alpha} P{a⩽X⩽b}=∫abf(x)dx=β−αb−a

  • 这表明 XXX 属于 (α,β)(\alpha, \beta)(α,β) 的任一子区间的概率等于该子区间长度与总区间长度的比值

分布函数

区间 (α,β)(\alpha, \beta)(α,β) 上均匀随机变量的分布函数为:
F(a)={0a≤αa−αβ−αα<a<β1a≥β F(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases} F(a)=⎩ ⎨ ⎧0β−αa−α1a≤αα<a<βa≥β

期望

E[X]=∫−∞∞xf(x) dx=∫αβxβ−α dx=1β−α[x22]αβ=β2−α22(β−α)=(β−α)(β+α)2(β−α)=β+α2 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{\alpha}^{\beta} \frac{x}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^2}{2} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^2 - \alpha^2}{2(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta + \alpha)}{2(\beta - \alpha)} \\ &= \frac{\beta + \alpha}{2} \end{aligned} E[X]=∫−∞∞xf(x)dx=∫αββ−αxdx=β−α1[2x2]αβ=2(β−α)β2−α2=2(β−α)(β−α)(β+α)=2β+α

方差

首先计算 E[X2]E[X^2]E[X2]:
E[X2]=∫αβx2β−α dx=1β−α[x33]αβ=β3−α33(β−α)=(β−α)(β2+αβ+α2)3(β−α)=β2+αβ+α23 \begin{aligned} E[X^2] &= \int_{\alpha}^{\beta} \frac{x^2}{\beta - \alpha} \, \mathrm{d}x \\ &= \frac{1}{\beta - \alpha} \left[ \frac{x^3}{3} \right]_{\alpha}^{\beta} \\ &= \frac{\beta^3 - \alpha^3}{3(\beta - \alpha)} \\ &= \frac{(\beta - \alpha)(\beta^2 + \alpha\beta + \alpha^2)}{3(\beta - \alpha)} \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} \end{aligned} E[X2]=∫αββ−αx2dx=β−α1[3x3]αβ=3(β−α)β3−α3=3(β−α)(β−α)(β2+αβ+α2)=3β2+αβ+α2

然后计算方差:
Var(X)=E[X2]−(E[X])2=β2+αβ+α23−(β+α2)2=4(β2+αβ+α2)−3(β2+2αβ+α2)12=4β2+4αβ+4α2−3β2−6αβ−3α212=β2−2αβ+α212=(β−α)212 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{\beta^2 + \alpha\beta + \alpha^2}{3} - \left(\frac{\beta + \alpha}{2}\right)^2 \\ &= \frac{4(\beta^2 + \alpha\beta + \alpha^2) - 3(\beta^2 + 2\alpha\beta + \alpha^2)}{12} \\ &= \frac{4\beta^2 + 4\alpha\beta + 4\alpha^2 - 3\beta^2 - 6\alpha\beta - 3\alpha^2}{12} \\ &= \frac{\beta^2 - 2\alpha\beta + \alpha^2}{12} \\ &= \frac{(\beta - \alpha)^2}{12} \end{aligned} Var(X)=E[X2]−(E[X])2=3β2+αβ+α2−(2β+α)2=124(β2+αβ+α2)−3(β2+2αβ+α2)=124β2+4αβ+4α2−3β2−6αβ−3α2=12β2−2αβ+α2=12(β−α)2

例题

例 3b :如果 XXX 服从 (0,10)(0, 10)(0,10) 上的均匀分布,计算:

  • (a) P{X<3}P\{X < 3\}P{X<3}
    P{X<3}=∫03110 dx=310 P\{X < 3\} = \int_{0}^{3} \frac{1}{10} \, \mathrm{d}x = \frac{3}{10} P{X<3}=∫03101dx=103

  • (b) P{X>6}P\{X > 6\}P{X>6}
    P{X>6}=∫610110 dx=410 P\{X > 6\} = \int_{6}^{10} \frac{1}{10} \, \mathrm{d}x = \frac{4}{10} P{X>6}=∫610101dx=104

  • © P{3<X<8}P\{3 < X < 8\}P{3<X<8}
    P{3<X<8}=∫38110 dx=510=12 P\{3 < X < 8\} = \int_{3}^{8} \frac{1}{10} \, \mathrm{d}x = \frac{5}{10} = \frac{1}{2} P{3<X<8}=∫38101dx=105=21


例 3c:某乘客在 7:00 到 7:30 之间到达车站的时间服从均匀分布,求:

  • (a) 等车时间不超过 5 分钟的概率

    假设公交车在 7:00, 7:15, 7:30 等时间点发车,等车时间不超过 5 分钟意味着乘客在 7:10-7:15 或 7:25-7:30 之间到达:
    P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015130 dx+∫2530130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} \leq 5\} &= P\{10 < X < 15\} + P\{25 < X < 30\} \\ &= \int_{10}^{15} \frac{1}{30} \, \mathrm{d}x + \int_{25}^{30} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间≤5}=P{10<X<15}+P{25<X<30}=∫1015301dx+∫2530301dx=305+305=31

  • (b) 等车时间超过 10 分钟的概率

    等车时间超过 10 分钟意味着乘客在 7:00-7:05 或 7:15-7:20 之间到达:
    P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05130 dx+∫1520130 dx=530+530=13 \begin{aligned} P\{\text{等车时间} > 10\} &= P\{0 < X < 5\} + P\{15 < X < 20\} \\ &= \int_{0}^{5} \frac{1}{30} \, \mathrm{d}x + \int_{15}^{20} \frac{1}{30} \, \mathrm{d}x \\ &= \frac{5}{30} + \frac{5}{30} = \frac{1}{3} \end{aligned} P{等车时间>10}=P{0<X<5}+P{15<X<20}=∫05301dx+∫1520301dx=305+305=31


例 3d:贝特朗悖论

考虑随机地从圆中取一根弦,该弦的长度大于该圆内接正三角形的边长的概率是多大?

问题:这个概率取决于"随机"的定义方式。

方法一:按弦到圆心的距离

  • 弦的位置由它到圆心的距离 DDD 决定,D∈[0,r]D \in [0, r]D∈[0,r]

  • 当 D<r/2D < r/2D<r/2 时,弦长 > 内接正三角形边长

  • 假设 DDD 在 [0,r][0, r][0,r] 上均匀分布:
    P{D<r2}=r/2r=12 P\left\{D < \frac{r}{2}\right\} = \frac{r/2}{r} = \frac{1}{2} P{D<2r}=rr/2=21

方法二:按弦与切线的夹角

  • 弦的位置由它与切线的夹角 θ\thetaθ 决定,θ∈[0∘,180∘]\theta \in [0^\circ, 180^\circ]θ∈[0∘,180∘]

  • 当 θ∈[60∘,120∘]\theta \in [60^\circ, 120^\circ]θ∈[60∘,120∘] 时,弦长 > 内接正三角形边长

  • 假设 θ\thetaθ 在 [0∘,180∘][0^\circ, 180^\circ][0∘,180∘] 上均匀分布:
    P{60<θ<120}=120−60180=13 P\{60 < \theta < 120\} = \frac{120 - 60}{180} = \frac{1}{3} P{60<θ<120}=180120−60=31

!TIP

贝特朗悖论说明:在概率论中,"随机"的定义必须明确。不同的随机机制可能导致不同的概率结果。


5.4 正态随机变量

定义

如果随机变量 XXX 的密度函数为:
f(x)=12πσe−(x−μ)2/2σ2−∞<x<∞ f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2} \qquad -\infty < x < \infty f(x)=2π σ1e−(x−μ)2/2σ2−∞<x<∞

则称 XXX 是服从参数为 μ\muμ 和 σ2\sigma^2σ2 的正态分布 的随机变量,简称为正态随机变量

特性

  • 密度函数是一条关于 μ\muμ 对称的钟形曲线
  • μ\muμ 是分布的均值(期望)
  • σ2\sigma^2σ2 是分布的方差
  • σ\sigmaσ 是标准差

密度函数

需要验证:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=1 \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = 1 2π σ1∫−∞∞e−(x−μ)2/2σ2dx=1

令 y=(x−μ)/σy = (x-\mu)/\sigmay=(x−μ)/σ,则:
12πσ∫−∞∞e−(x−μ)2/2σ2 dx=12π∫−∞∞e−y2/2 dy \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} e^{-(x-\mu)^2/2\sigma^2} \, \mathrm{d}x = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y 2π σ1∫−∞∞e−(x−μ)2/2σ2dx=2π 1∫−∞∞e−y2/2dy

计算:
I=∫−∞∞e−y2/2 dyI2=∫−∞∞e−y2/2 dy∫−∞∞e−x2/2 dx=∫−∞∞∫−∞∞e−(x2+y2)/2 dx dy \begin{aligned} I &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \\ I^2 &= \int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y \int_{-\infty}^{\infty} e^{-x^2/2} \, \mathrm{d}x \\ &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(x^2+y^2)/2} \, \mathrm{d}x \, \mathrm{d}y \end{aligned} II2=∫−∞∞e−y2/2dy=∫−∞∞e−y2/2dy∫−∞∞e−x2/2dx=∫−∞∞∫−∞∞e−(x2+y2)/2dxdy

!IMPORTANT

极坐标变换技巧复习

  1. 坐标变换公式
笛卡尔坐标 极坐标 关系
xxx rcos⁡θr\cos\thetarcosθ x=rcos⁡θx = r\cos\thetax=rcosθ
yyy rsin⁡θr\sin\thetarsinθ y=rsin⁡θy = r\sin\thetay=rsinθ
x2+y2x^2 + y^2x2+y2 r2r^2r2 r=x2+y2r = \sqrt{x^2 + y^2}r=x2+y2
- θ\thetaθ θ=arctan⁡(y/x)\theta = \arctan(y/x)θ=arctan(y/x)(需考虑象限)
  1. 面积元素变换(关键!)

在极坐标下,面积元素发生变化:
dx dy=r dr dθ \boxed{dx\,dy = r\,dr\,d\theta} dxdy=rdrdθ

  • 几何解释:在极坐标中,一个小区域的面积近似为扇形,其面积 = 半径 × 弧长 = r⋅(rdθ)⋅dr=r dr dθr \cdot (r d\theta) \cdot dr = r\,dr\,d\thetar⋅(rdθ)⋅dr=rdrdθ

  • 数学解释:通过雅可比行列式 计算:
    J=∂(x,y)∂(r,θ)=∣∂x∂r∂x∂θ∂y∂r∂y∂θ∣=∣cos⁡θ−rsin⁡θsin⁡θrcos⁡θ∣=r(cos⁡2θ+sin⁡2θ)=r J = \frac{\partial(x,y)}{\partial(r,\theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r(\cos^2\theta + \sin^2\theta) = r J=∂(r,θ)∂(x,y)= ∂r∂x∂r∂y∂θ∂x∂θ∂y = cosθsinθ−rsinθrcosθ =r(cos2θ+sin2θ)=r

    因此 dx dy=∣J∣ dr dθ=r dr dθdx\,dy = |J|\,dr\,d\theta = r\,dr\,d\thetadxdy=∣J∣drdθ=rdrdθ


积分区域转换

笛卡尔区域 极坐标区域
整个平面 R2\mathbb{R}^2R2 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π
上半平面 y≥0y \geq 0y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π0 \leq \theta \leq \pi0≤θ≤π
第一象限 x≥0,y≥0x \geq 0, y \geq 0x≥0,y≥0 0≤r<∞0 \leq r < \infty0≤r<∞, 0≤θ≤π20 \leq \theta \leq \frac{\pi}{2}0≤θ≤2π
圆盘 x2+y2≤a2x^2 + y^2 \leq a^2x2+y2≤a2 0≤r≤a0 \leq r \leq a0≤r≤a, 0≤θ<2π0 \leq \theta < 2\pi0≤θ<2π

使用极坐标变换 x=rcos⁡θx = r\cos\thetax=rcosθ,y=rsin⁡θy = r\sin\thetay=rsinθ:
I2=∫0∞∫02πe−r2/2r dθ dr=2π∫0∞re−r2/2 dr=−2πe−r2/2∣0∞=2π \begin{aligned} I^2 &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-r^2/2} r \, \mathrm{d}\theta \, \mathrm{d}r \\ &= 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, \mathrm{d}r \\ &= -2\pi e^{-r^2/2} \Big|_{0}^{\infty} \\ &= 2\pi \end{aligned} I2=∫0∞∫02πe−r2/2rdθdr=2π∫0∞re−r2/2dr=−2πe−r2/2 0∞=2π

!NOTE

计算角度积分:
∫02πdθ=θ∣02π=2π−0=2π \int_{0}^{2\pi} d\theta = \theta \Big|_{0}^{2\pi} = 2\pi - 0 = 2\pi ∫02πdθ=θ 02π=2π−0=2π

所以:
I2=2π∫0∞re−r2/2 dr I^2 = 2\pi \int_{0}^{\infty} r e^{-r^2/2} \, dr I2=2π∫0∞re−r2/2dr

现在需要计算:
∫0∞re−r2/2 dr \int_{0}^{\infty} r e^{-r^2/2} \, dr ∫0∞re−r2/2dr

这是一个典型的可以通过变量替换解决的积分。

令 u=r22u = \frac{r^2}{2}u=2r2,则:

  • du=r drdu = r \, drdu=rdr(因为 dudr=r\frac{du}{dr} = rdrdu=r)
  • 当 r=0r = 0r=0 时,u=0u = 0u=0
  • 当 r→∞r \to \inftyr→∞ 时,u→∞u \to \inftyu→∞

代入得:
∫0∞re−r2/2 dr=∫0∞e−u du \int_{0}^{\infty} r e^{-r^2/2} \, dr = \int_{0}^{\infty} e^{-u} \, du ∫0∞re−r2/2dr=∫0∞e−udu

这个积分很简单:
∫0∞e−u du=−e−u∣0∞=−(e−∞−e0)=−(0−1)=1 \int_{0}^{\infty} e^{-u} \, du = -e^{-u} \Big|_{0}^{\infty} = -(e^{-\infty} - e^{0}) = -(0 - 1) = 1 ∫0∞e−udu=−e−u 0∞=−(e−∞−e0)=−(0−1)=1

I2=2π⋅1=2π I^2 = 2\pi \cdot 1 = 2\pi I2=2π⋅1=2π

因此:
I=2π I = \sqrt{2\pi} I=2π

这意味着:
∫−∞∞e−x2/2 dx=2π \int_{-\infty}^{\infty} e^{-x^2/2} \, dx = \sqrt{2\pi} ∫−∞∞e−x2/2dx=2π

因此 I=2πI = \sqrt{2\pi}I=2π ,证明了:
12π∫−∞∞e−y2/2 dy=1 \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty} e^{-y^2/2} \, \mathrm{d}y = 1 2π 1∫−∞∞e−y2/2dy=1


性质

线性变换

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2),则 aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2)。

证明

  • 令 Y=aX+bY = aX + bY=aX+b,a>0a > 0a>0(a<0a < 0a<0 时证明类似)

  • YYY 的分布函数:
    FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤x−ba}=FX(x−ba) F_Y(x) = P\{Y \leq x\} = P\{aX + b \leq x\} = P\left\{X \leq \frac{x-b}{a}\right\} = F_X\left(\frac{x-b}{a}\right) FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤ax−b}=FX(ax−b)

  • 求导得密度函数:
    fY(x)=1afX(x−ba)=12πaσexp⁡{−(x−ba−μ)2/2σ2}=12πaσexp⁡{−(x−b−aμ)2/2(aσ)2} \begin{aligned} f_Y(x) &= \frac{1}{a} f_X\left(\frac{x-b}{a}\right) \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(\frac{x-b}{a} - \mu\right)^2 / 2\sigma^2\right\} \\ &= \frac{1}{\sqrt{2\pi a\sigma}} \exp\left\{-\left(x - b - a\mu\right)^2 / 2(a\sigma)^2\right\} \end{aligned} fY(x)=a1fX(ax−b)=2πaσ 1exp{−(ax−b−μ)2/2σ2}=2πaσ 1exp{−(x−b−aμ)2/2(aσ)2}

  • 这表明 Y∼N(aμ+b,a2σ2)Y \sim N(a\mu + b, a^2\sigma^2)Y∼N(aμ+b,a2σ2)

标准正态分布

如果 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2),则 Z=(X−μ)/σ∼N(0,1)Z = (X - \mu)/\sigma \sim N(0, 1)Z=(X−μ)/σ∼N(0,1)。

  • 标准正态分布的密度函数为:
    fZ(z)=12πe−z2/2 f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2} fZ(z)=2π 1e−z2/2

  • 分布函数记为 Φ(z)\Phi(z)Φ(z):
    Φ(z)=12π∫−∞ze−y2/2 dy \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}y Φ(z)=2π 1∫−∞ze−y2/2dy

  • 对称性:Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z)

期望与方差

例 4a :设 XXX 是参数为 μ\muμ 和 σ2\sigma^2σ2 的正态随机变量,求 E[X]E[X]E[X] 和 Var(X)Var(X)Var(X)。

  • 先计算标准正态变量 ZZZ 的期望:
    E[Z]=12π∫−∞∞ze−z2/2 dz=0 E[Z] = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-z^2/2} \, \mathrm{d}z = 0 E[Z]=2π 1∫−∞∞ze−z2/2dz=0

    (奇函数在对称区间上的积分)

  • 计算 Var(Z)=E[Z2]Var(Z) = E[Z^2]Var(Z)=E[Z2]:
    Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π[−ze−z2/2∣−∞∞+∫−∞∞e−z2/2 dz]=12π∫−∞∞e−z2/2 dz=1 \begin{aligned} Var(Z) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, \mathrm{d}z \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2/2} \Big|{-\infty}^{\infty} + \int{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z \right] \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2/2} \, \mathrm{d}z = 1 \end{aligned} Var(Z)=2π 1∫−∞∞z2e−z2/2dz=2π 1[−ze−z2/2 −∞∞+∫−∞∞e−z2/2dz]=2π 1∫−∞∞e−z2/2dz=1

  • 由于 X=μ+σZX = \mu + \sigma ZX=μ+σZ:
    E[X]=μ+σE[Z]=μVar(X)=σ2Var(Z)=σ2 \begin{aligned} E[X] &= \mu + \sigma E[Z] = \mu \\ Var(X) &= \sigma^2 Var(Z) = \sigma^2 \end{aligned} E[X]Var(X)=μ+σE[Z]=μ=σ2Var(Z)=σ2

!IMPORTANT

标准正态分布方差的详细计算

步骤 1:设置积分
Var(Z)=12π∫−∞∞z2e−z2/2 dz Var(Z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz Var(Z)=2π 1∫−∞∞z2e−z2/2dz

步骤 2:应用分部积分法

我们需要计算 ∫−∞∞z2e−z2/2 dz\int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz∫−∞∞z2e−z2/2dz,使用分部积分法

回忆分部积分公式:
∫u dv=uv−∫v du \int u \, dv = uv - \int v \, du ∫udv=uv−∫vdu

选择:

  • 令 u=zu = zu=z,则 du=dzdu = dzdu=dz
  • 令 dv=ze−z2/2 dzdv = z e^{-z^2/2} \, dzdv=ze−z2/2dz,则 v=−e−z2/2v = -e^{-z^2/2}v=−e−z2/2(因为 ddz(−e−z2/2)=ze−z2/2\frac{d}{dz}(-e^{-z^2/2}) = z e^{-z^2/2}dzd(−e−z2/2)=ze−z2/2)

应用公式:
∫z2e−z2/2 dz=∫u dv=uv−∫v du=z⋅(−e−z2/2)−∫(−e−z2/2) dz=−ze−z2/2+∫e−z2/2 dz \begin{aligned} \int z^2 e^{-z^2/2} \, dz &= \int u \, dv \\ &= uv - \int v \, du \\ &= z \cdot (-e^{-z^2/2}) - \int (-e^{-z^2/2}) \, dz \\ &= -z e^{-z^2/2} + \int e^{-z^2/2} \, dz \end{aligned} ∫z2e−z2/2dz=∫udv=uv−∫vdu=z⋅(−e−z2/2)−∫(−e−z2/2)dz=−ze−z2/2+∫e−z2/2dz

步骤 3:计算定积分

将上述结果应用于定积分:
∫−∞∞z2e−z2/2 dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2 dz \int_{-\infty}^{\infty} z^2 e^{-z^2/2} \, dz = \left[ -z e^{-z^2/2} \right]{-\infty}^{\infty} + \int{-\infty}^{\infty} e^{-z^2/2} \, dz ∫−∞∞z2e−z2/2dz=[−ze−z2/2]−∞∞+∫−∞∞e−z2/2dz

分析边界项 [−ze−z2/2]−∞∞\left[ -z e^{-z^2/2} \right]_{-\infty}^{\infty}[−ze−z2/2]−∞∞:

  • 当 z→∞z \to \inftyz→∞ 时:
    lim⁡z→∞(−ze−z2/2)=lim⁡z→∞−zez2/2 \lim_{z \to \infty} (-z e^{-z^2/2}) = \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} z→∞lim(−ze−z2/2)=z→∞limez2/2−z

    这是一个 ∞∞\frac{\infty}{\infty}∞∞ 型不定式,应用洛必达法则:
    lim⁡z→∞−zez2/2=lim⁡z→∞−1zez2/2=0 \lim_{z \to \infty} \frac{-z}{e^{z^2/2}} = \lim_{z \to \infty} \frac{-1}{z e^{z^2/2}} = 0 z→∞limez2/2−z=z→∞limzez2/2−1=0

    (分子是常数,分母趋向无穷大)

  • 当 z→−∞z \to -\inftyz→−∞ 时:
    lim⁡z→−∞(−ze−z2/2)=lim⁡z→−∞−zez2/2 \lim_{z \to -\infty} (-z e^{-z^2/2}) = \lim_{z \to -\infty} \frac{-z}{e^{z^2/2}} z→−∞lim(−ze−z2/2)=z→−∞limez2/2−z

    令 w=−zw = -zw=−z,则 w→∞w \to \inftyw→∞:
    lim⁡w→∞wew2/2=0 \lim_{w \to \infty} \frac{w}{e^{w^2/2}} = 0 w→∞limew2/2w=0

    (同样应用洛必达法则)

因此:

−ze−z2/2\]−∞∞=0−0=0 \\left\[ -z e\^{-z\^2/2} \\right\]_{-\\infty}\^{\\infty} = 0 - 0 = 0 \[−ze−z2/2\]−∞∞=0−0=0 步骤 4:简化表达式 代入边界项的结果: ∫−∞∞z2e−z2/2 dz=0+∫−∞∞e−z2/2 dz=∫−∞∞e−z2/2 dz \\int_{-\\infty}\^{\\infty} z\^2 e\^{-z\^2/2} \\, dz = 0 + \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz = \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz ∫−∞∞z2e−z2/2dz=0+∫−∞∞e−z2/2dz=∫−∞∞e−z2/2dz 步骤 5:应用高斯积分结果 从之前的讨论(极坐标变换)我们知道: ∫−∞∞e−z2/2 dz=2π \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz = \\sqrt{2\\pi} ∫−∞∞e−z2/2dz=2π 将结果代入方差公式: Var(Z)=12π∫−∞∞z2e−z2/2 dz=12π∫−∞∞e−z2/2 dz=12π⋅2π=1 \\begin{aligned} Var(Z) \&= \\frac{1}{\\sqrt{2\\pi}} \\int_{-\\infty}\^{\\infty} z\^2 e\^{-z\^2/2} \\, dz \\\\ \&= \\frac{1}{\\sqrt{2\\pi}} \\int_{-\\infty}\^{\\infty} e\^{-z\^2/2} \\, dz \\\\ \&= \\frac{1}{\\sqrt{2\\pi}} \\cdot \\sqrt{2\\pi} \\\\ \&= 1 \\end{aligned} Var(Z)=2π 1∫−∞∞z2e−z2/2dz=2π 1∫−∞∞e−z2/2dz=2π 1⋅2π =1

例题

例 4b :如果 XXX 服从正态分布,参数为 μ=3\mu=3μ=3 和 σ2=9\sigma^2 = 9σ2=9(即 σ=3\sigma = 3σ=3),求:

  • (a) P{2≤X≤5}P\{2 \leq X \leq 5\}P{2≤X≤5}
    P{2<X<5}=P{2−33<X−33<5−33}=P{−13<Z<23}=Φ(23)−Φ(−13)=Φ(23)−[1−Φ(13)]≈0.7486−(1−0.6293)=0.3779 \begin{aligned} P\{2 < X < 5\} &= P\left\{\frac{2-3}{3} < \frac{X-3}{3} < \frac{5-3}{3}\right\} \\ &= P\left\{-\frac{1}{3} < Z < \frac{2}{3}\right\} \\ &= \Phi\left(\frac{2}{3}\right) - \Phi\left(-\frac{1}{3}\right) \\ &= \Phi\left(\frac{2}{3}\right) - \left[1 - \Phi\left(\frac{1}{3}\right)\right] \\ &\approx 0.7486 - (1 - 0.6293) = 0.3779 \end{aligned} P{2<X<5}=P{32−3<3X−3<35−3}=P{−31<Z<32}=Φ(32)−Φ(−31)=Φ(32)−[1−Φ(31)]≈0.7486−(1−0.6293)=0.3779

  • (b) P{X>0}P\{X > 0\}P{X>0}
    P{X>0}=P{X−33>0−33}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413 \begin{aligned} P\{X > 0\} &= P\left\{\frac{X-3}{3} > \frac{0-3}{3}\right\} \\ &= P\{Z > -1\} \\ &= 1 - \Phi(-1) \\ &= \Phi(1) \approx 0.8413 \end{aligned} P{X>0}=P{3X−3>30−3}=P{Z>−1}=1−Φ(−1)=Φ(1)≈0.8413

  • © P{∣X−3∣>6}P\{|X-3| > 6\}P{∣X−3∣>6}
    P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456 \begin{aligned} P\{|X-3| > 6\} &= P\{X > 9\} + P\{X < -3\} \\ &= P\{Z > 2\} + P\{Z < -2\} \\ &= [1 - \Phi(2)] + \Phi(-2) \\ &= 2[1 - \Phi(2)] \approx 2(1 - 0.9772) = 0.0456 \end{aligned} P{∣X−3∣>6}=P{X>9}+P{X<−3}=P{Z>2}+P{Z<−2}=[1−Φ(2)]+Φ(−2)=2[1−Φ(2)]≈2(1−0.9772)=0.0456


例 4c:考试分数的等级划分

如果考试分数服从正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则:

  • A等(超过 μ+σ\mu+\sigmaμ+σ):P{X>μ+σ}=1−Φ(1)≈0.1587P\{X > \mu + \sigma\} = 1 - \Phi(1) \approx 0.1587P{X>μ+σ}=1−Φ(1)≈0.1587
  • B等(μ\muμ 到 μ+σ\mu+\sigmaμ+σ):P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413P\{\mu < X < \mu + \sigma\} = \Phi(1) - \Phi(0) \approx 0.3413P{μ<X<μ+σ}=Φ(1)−Φ(0)≈0.3413
  • C等(μ−σ\mu-\sigmaμ−σ 到 μ\muμ):P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413P\{\mu - \sigma < X < \mu\} = \Phi(0) - \Phi(-1) \approx 0.3413P{μ−σ<X<μ}=Φ(0)−Φ(−1)≈0.3413
  • D等(μ−2σ\mu-2\sigmaμ−2σ 到 μ−σ\mu-\sigmaμ−σ):P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359P\{\mu - 2\sigma < X < \mu - \sigma\} = \Phi(1) - \Phi(2) \approx 0.1359P{μ−2σ<X<μ−σ}=Φ(1)−Φ(2)≈0.1359
  • E等(低于 μ−2σ\mu-2\sigmaμ−2σ):P{X<μ−2σ}=Φ(−2)≈0.0228P\{X < \mu - 2\sigma\} = \Phi(-2) \approx 0.0228P{X<μ−2σ}=Φ(−2)≈0.0228

因此,近似地:

  • A等:16%
  • B等:34%
  • C等:34%
  • D等:14%
  • E等:2%

例 4d:怀孕期问题

母亲的怀孕期 X∼N(270,100)X \sim N(270, 100)X∼N(270,100)(即 μ=270\mu = 270μ=270,σ=10\sigma = 10σ=10)。

如果被告是孩子的父亲,母亲在被告出国前或回国后怀孕的概率:
P{X>290 或 X<240}=P{X>290}+P{X<240}=P{X−27010>2}+P{X−27010<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241 \begin{aligned} P\{X > 290 \text{ 或 } X < 240\} &= P\{X > 290\} + P\{X < 240\} \\ &= P\left\{\frac{X-270}{10} > 2\right\} + P\left\{\frac{X-270}{10} < -3\right\} \\ &= [1 - \Phi(2)] + \Phi(-3) \\ &\approx (1 - 0.9772) + 0.0013 = 0.0241 \end{aligned} P{X>290 或 X<240}=P{X>290}+P{X<240}=P{10X−270>2}+P{10X−270<−3}=[1−Φ(2)]+Φ(−3)≈(1−0.9772)+0.0013=0.0241


例 4e:电信信号传输

当传送信息为 1 时发送值 2,为 0 时发送值 -2。接收值 R=x+NR = x + NR=x+N,其中 N∼N(0,1)N \sim N(0,1)N∼N(0,1)。

  • 信息 1 被错误认为 0 的概率(当 R<0.5R < 0.5R<0.5):
    P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668 P\{2 + N < 0.5\} = P\{N < -1.5\} = 1 - \Phi(1.5) \approx 0.0668 P{2+N<0.5}=P{N<−1.5}=1−Φ(1.5)≈0.0668

  • 信息 0 被错误认为 1 的概率(当 R≥0.5R \geq 0.5R≥0.5):
    P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062 P\{-2 + N \geq 0.5\} = P\{N \geq 2.5\} = 1 - \Phi(2.5) \approx 0.0062 P{−2+N≥0.5}=P{N≥2.5}=1−Φ(2.5)≈0.0062


正态近似

棣莫弗-拉普拉斯极限定理

在 nnn 次独立重复试验中,设每次成功的概率为 ppp,记成功总次数为 SnS_nSn,则对任意 a<ba < ba<b:

P{a⩽Sn−npnp(1−p)⩽b}→Φ(b)−Φ(a)当 n→∞ P\left\{a \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant b\right\} \to \Phi(b) - \Phi(a) \quad \text{当 } n \to \infty P{a⩽np(1−p) Sn−np⩽b}→Φ(b)−Φ(a)当 n→∞

使用条件

  • 当 np(1−p)≥10np(1-p) \geq 10np(1−p)≥10 时,正态近似效果很好
  • 需要进行连续性修正(因为二项分布是离散的,而正态分布是连续的)

连续性修正

  • P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5},其中 XXX 为正态变量

例 4g:抛 40 次均匀硬币

设 XXX 为正面次数,X∼Binomial(40,0.5)X \sim \text{Binomial}(40, 0.5)X∼Binomial(40,0.5)。

  • 正态近似:
    P{X=20}=P{19.5<X<20.5}=P{19.5−2010<X−2010<20.5−2010}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272 \begin{aligned} P\{X = 20\} &= P\{19.5 < X < 20.5\} \\ &= P\left\{\frac{19.5 - 20}{\sqrt{10}} < \frac{X - 20}{\sqrt{10}} < \frac{20.5 - 20}{\sqrt{10}}\right\} \\ &\approx P\{-0.16 < Z < 0.16\} \\ &= \Phi(0.16) - \Phi(-0.16) \approx 0.1272 \end{aligned} P{X=20}=P{19.5<X<20.5}=P{10 19.5−20<10 X−20<10 20.5−20}≈P{−0.16<Z<0.16}=Φ(0.16)−Φ(−0.16)≈0.1272

  • 精确解:
    P{X=20}=(4020)(12)40≈0.1254 P\{X = 20\} = \binom{40}{20} \left(\frac{1}{2}\right)^{40} \approx 0.1254 P{X=20}=(2040)(21)40≈0.1254


例 4h:学院招生问题

设 XXX 为入学新生人数,X∼Binomial(450,0.3)X \sim \text{Binomial}(450, 0.3)X∼Binomial(450,0.3)。

  • 正态近似:
    P{X≥150}≈P{X≥150.5}=P{X−450×0.3450×0.3×0.7≥150.5−13594.5}=P{Z≥15.59.72}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559 \begin{aligned} P\{X \geq 150\} &\approx P\{X \geq 150.5\} \\ &= P\left\{\frac{X - 450 \times 0.3}{\sqrt{450 \times 0.3 \times 0.7}} \geq \frac{150.5 - 135}{\sqrt{94.5}}\right\} \\ &= P\left\{Z \geq \frac{15.5}{9.72}\right\} \\ &= P\{Z \geq 1.59\} \\ &\approx 1 - \Phi(1.59) \approx 0.0559 \end{aligned} P{X≥150}≈P{X≥150.5}=P{450×0.3×0.7 X−450×0.3≥94.5 150.5−135}=P{Z≥9.7215.5}=P{Z≥1.59}≈1−Φ(1.59)≈0.0559

因此,入学新生超过 150 名的概率约为 5.59%。


例 4i:胆固醇试验

设 XXX 为胆固醇降低的人数,X∼Binomial(100,0.5)X \sim \text{Binomial}(100, 0.5)X∼Binomial(100,0.5)(假设食品无效)。

  • 正态近似:
    P{X≥65}≈P{X≥64.5}=P{X−505≥64.5−505}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019 \begin{aligned} P\{X \geq 65\} &\approx P\{X \geq 64.5\} \\ &= P\left\{\frac{X - 50}{5} \geq \frac{64.5 - 50}{5}\right\} \\ &= P\{Z \geq 2.9\} \\ &\approx 1 - \Phi(2.9) \approx 0.0019 \end{aligned} P{X≥65}≈P{X≥64.5}=P{5X−50≥564.5−50}=P{Z≥2.9}≈1−Φ(2.9)≈0.0019

因此,即使食品无效,营养学家仍承认它有效的概率约为 0.19%。


例 4j:纽约市民支持率

设 SnS_nSn 为支持禁令的人数,Sn∼Binomial(n,0.52)S_n \sim \text{Binomial}(n, 0.52)Sn∼Binomial(n,0.52)。

  • 正态近似:
    P{Sn>0.5n}=P{Sn−0.52nn×0.52×0.48>0.5n−0.52nn×0.52×0.48}=P{Z>−0.04n}=Φ(0.04n) \begin{aligned} P\{S_n > 0.5n\} &= P\left\{\frac{S_n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}} > \frac{0.5n - 0.52n}{\sqrt{n \times 0.52 \times 0.48}}\right\} \\ &= P\left\{Z > -0.04\sqrt{n}\right\} \\ &= \Phi(0.04\sqrt{n}) \end{aligned} P{Sn>0.5n}=P{n×0.52×0.48 Sn−0.52n>n×0.52×0.48 0.5n−0.52n}=P{Z>−0.04n }=Φ(0.04n )

  • 计算:

    • n=11n = 11n=11:Φ(0.1328)≈0.5528\Phi(0.1328) \approx 0.5528Φ(0.1328)≈0.5528
    • n=101n = 101n=101:Φ(0.4020)≈0.6562\Phi(0.4020) \approx 0.6562Φ(0.4020)≈0.6562
    • n=1001n = 1001n=1001:Φ(1.2665)≈0.8973\Phi(1.2665) \approx 0.8973Φ(1.2665)≈0.8973
  • 为使概率 > 0.95:
    Φ(0.04n)>0.95⇒0.04n>1.645⇒n≥1692 \Phi(0.04\sqrt{n}) > 0.95 \Rightarrow 0.04\sqrt{n} > 1.645 \Rightarrow n \geq 1692 Φ(0.04n )>0.95⇒0.04n >1.645⇒n≥1692


本节小结

特性 公式
密度函数 f(x)={1β−αα<x<β0其他f(x) = \begin{cases} \frac{1}{\beta-\alpha} & \alpha < x < \beta \\ 0 & \text{其他} \end{cases}f(x)={β−α10α<x<β其他
分布函数 F(a)={0a≤αa−αβ−αα<a<β1a≥βF(a) = \begin{cases} 0 & a \leq \alpha \\ \frac{a-\alpha}{\beta-\alpha} & \alpha < a < \beta \\ 1 & a \geq \beta \end{cases}F(a)=⎩ ⎨ ⎧0β−αa−α1a≤αα<a<βa≥β
期望 E[X]=α+β2E[X] = \frac{\alpha + \beta}{2}E[X]=2α+β
方差 Var(X)=(β−α)212Var(X) = \frac{(\beta - \alpha)^2}{12}Var(X)=12(β−α)2

正态随机变量

特性 公式
密度函数 f(x)=12πσe−(x−μ)2/2σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}f(x)=2π σ1e−(x−μ)2/2σ2
标准正态分布 Z=X−μσ∼N(0,1)Z = \frac{X-\mu}{\sigma} \sim N(0,1)Z=σX−μ∼N(0,1)
分布函数 Φ(z)=12π∫−∞ze−y2/2 dy\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-y^2/2} \, \mathrm{d}yΦ(z)=2π 1∫−∞ze−y2/2dy
对称性 Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z)
期望 E[X]=μE[X] = \muE[X]=μ
方差 Var(X)=σ2Var(X) = \sigma^2Var(X)=σ2
线性变换 aX+b∼N(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)aX+b∼N(aμ+b,a2σ2)

二项分布的正态近似

  • 条件 :np(1−p)≥10np(1-p) \geq 10np(1−p)≥10
  • 连续性修正 :P{Sn=i}≈P{i−0.5<X<i+0.5}P\{S_n = i\} \approx P\{i-0.5 < X < i+0.5\}P{Sn=i}≈P{i−0.5<X<i+0.5}
  • 标准化 :Sn−npnp(1−p)≈N(0,1)\frac{S_n - np}{\sqrt{np(1-p)}} \approx N(0,1)np(1−p) Sn−np≈N(0,1)概率论基础教程第5章 连续型随机变量(一)
相关推荐
Zero3 小时前
机器学习概率论与统计学--(8)概率论:数字特征
机器学习·概率论·随机变量·统计学·方差·协方差·期望
Zero3 小时前
机器学习概率论与统计学--(9)统计学:参数估计
机器学习·概率论·统计学·矩估计·最大似然估计·点估计
R语言爱好者13 小时前
对比两点分布、二项分布和泊松分布,几何分布,超几何分布之间的区别
概率论·高中数学
bulingg2 天前
L1与L2正则化的差异
线性代数·矩阵·概率论
皮蛋瘦肉熬不成粥2 天前
MES(The Measures of Effect Size )工具箱的使用
matlab·概率论
我要学好英语3 天前
概率密度——分布、期望、方差和协方差
深度学习·概率论·概率密度·方差·协方差·期望·分布
我要学好英语3 天前
概率法则——贝叶斯定理
深度学习·概率论·贝叶斯定理
Eloudy3 天前
贝叶斯定律的内涵
概率论
Zero4 天前
机器学习概率论与统计学--(6)概率论:连续分布
机器学习·概率论·统计学·概率密度函数·连续分布
Zero5 天前
机器学习概率论与统计学--(7)概率论:多维随机变量
机器学习·概率论·随机变量·统计学·多维随机变量