概率论与数理统计第二章 随机变量及其分布

随机变量及其分布

一、随机变量及其分布函数

1. 随机变量的概念

随机变量是定义在样本空间 Ω\OmegaΩ 上的实值函数,记为 X(ω)X(\omega)X(ω),ω∈Ω\omega \in \Omegaω∈Ω。

随机变量将随机试验的结果数量化。

分类:离散型随机变量、连续型随机变量

2. 随机变量的分布函数

分布函数定义为:
F(x)=P(X≤x),x∈RF(x) = P(X \le x),x \in \mathbb{R}F(x)=P(X≤x),x∈R

性质

  1. 单调不减性 :若 x1<x2x_1 < x_2x1<x2,则 F(x1)≤F(x2)F(x_1) \le F(x_2)F(x1)≤F(x2)
  2. 右连续性 :lim⁡x→x0+F(x)=F(x0)\lim\limits_{x \to x_0^+} F(x) = F(x_0)x→x0+limF(x)=F(x0)
  3. 边界性
    • lim⁡x→−∞F(x)=0\lim\limits_{x \to -\infty} F(x) = 0x→−∞limF(x)=0
    • lim⁡x→+∞F(x)=1\lim\limits_{x \to +\infty} F(x) = 1x→+∞limF(x)=1

例题 :设随机变量 XXX 的分布函数为
F(x)={0,x<012,0≤x<11−e−x,x≥1F(x) = \begin{cases} 0, & x < 0 \\ \frac{1}{2}, & 0 \le x < 1 \\ 1 - e^{-x}, & x \ge 1 \end{cases}F(x)=⎩ ⎨ ⎧0,21,1−e−x,x<00≤x<1x≥1

求 P(0.5<X≤2)P(0.5 < X \le 2)P(0.5<X≤2)。


P(0.5<X≤2)=F(2)−F(0.5)=(1−e−2)−12=12−e−2P(0.5 < X \le 2) = F(2) - F(0.5) = (1 - e^{-2}) - \frac{1}{2} = \frac{1}{2} - e^{-2}P(0.5<X≤2)=F(2)−F(0.5)=(1−e−2)−21=21−e−2


二、离散型随机变量及其分布律

1. 离散型随机变量的概念

取值有限或可数的随机变量称为离散型随机变量。

2. 分布律

离散型随机变量 XXX 的分布律(概率分布)表示为:
P(X=xi)=pi,i=1,2,⋯P(X = x_i) = p_i, i = 1, 2, \cdotsP(X=xi)=pi,i=1,2,⋯

性质

  1. pi≥0p_i \ge 0pi≥0,i=1,2,⋯i = 1, 2, \cdotsi=1,2,⋯
  2. ∑ipi=1\sum\limits_i p_i = 1i∑pi=1

例题 :一袋中有5个球,其中2个红球,3个白球。从中任取3个球,求取到红球数 XXX 的分布律。


XXX 的可能取值为0, 1, 2。
P(X=0)=C33C53=110,P(X=1)=C21C32C53=610,P(X=2)=C22C31C53=310P(X = 0) = \frac{C_3^3}{C_5^3} = \frac{1}{10}, \quad P(X = 1) = \frac{C_2^1 C_3^2}{C_5^3} = \frac{6}{10}, \quad P(X = 2) = \frac{C_2^2 C_3^1}{C_5^3} = \frac{3}{10}P(X=0)=C53C33=101,P(X=1)=C53C21C32=106,P(X=2)=C53C22C31=103

分布律为:

XXX 0 1 2
PPP 110\frac{1}{10}101 610\frac{6}{10}106 310\frac{3}{10}103

三、常用的离散型随机变量

1. 0-1分布(两点分布)

若 XXX 只取0和1两个值,且 P(X=1)=pP(X = 1) = pP(X=1)=p,P(X=0)=1−pP(X = 0) = 1 - pP(X=0)=1−p,则称 XXX 服从参数为 ppp 的0-1分布。

分布律
P(X=k)=pk(1−p)1−k,k=0,1P(X = k) = p^k (1-p)^{1-k},k = 0, 1P(X=k)=pk(1−p)1−k,k=0,1

2. 二项分布

若 XXX 表示 nnn 重伯努利试验中事件 AAA 发生的次数,则 XXX 服从二项分布,记为 X∼B(n,p)X \sim B(n, p)X∼B(n,p)。

分布律
P(X=k)=Cnkpk(1−p)n−k,k=0,1,⋯ ,nP(X = k) = C_n^k p^k (1-p)^{n-k},k = 0, 1, \cdots, nP(X=k)=Cnkpk(1−p)n−k,k=0,1,⋯,n

例题:某射手命中率为0.8,独立射击5次,求恰好命中3次的概率。


X∼B(5,0.8)X \sim B(5, 0.8)X∼B(5,0.8)
P(X=3)=C53(0.8)3(0.2)2=10×0.512×0.04=0.2048P(X = 3) = C_5^3 (0.8)^3 (0.2)^2 = 10 \times 0.512 \times 0.04 = 0.2048P(X=3)=C53(0.8)3(0.2)2=10×0.512×0.04=0.2048

3. 几何分布

在伯努利试验中,事件 AAA 首次发生所需的试验次数 XXX 服从几何分布,记为 X∼G(p)X \sim G(p)X∼G(p)。

分布律
P(X=k)=(1−p)k−1p,k=1,2,⋯P(X = k) = (1-p)^{k-1} p,k = 1, 2, \cdotsP(X=k)=(1−p)k−1p,k=1,2,⋯

4. 泊松分布

若随机变量 XXX 的分布律为
P(X=k)=λke−λk!,k=0,1,2,⋯P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, k = 0, 1, 2, \cdotsP(X=k)=k!λke−λ,k=0,1,2,⋯

则称 XXX 服从参数为 λ\lambdaλ 的泊松分布,记为 X∼P(λ)X \sim P(\lambda)X∼P(λ)。

历年考题:某电话交换台每分钟接到的呼叫次数服从参数为4的泊松分布,求在一分钟内呼叫次数不超过2次的概率。


P(X≤2)=∑k=024ke−4k!=e−4(1+4+162)=e−4(1+4+8)=13e−4P(X \le 2) = \sum_{k=0}^{2} \frac{4^k e^{-4}}{k!} = e^{-4} \left( 1 + 4 + \frac{16}{2} \right) = e^{-4} (1 + 4 + 8) = 13e^{-4}P(X≤2)=k=0∑2k!4ke−4=e−4(1+4+216)=e−4(1+4+8)=13e−4


四、连续型随机变量及其概率密度

1. 连续型随机变量的概念

如果随机变量 XXX 的分布函数 F(x)F(x)F(x) 可以表示为
F(x)=∫−∞xf(t)dtF(x) = \int_{-\infty}^x f(t) dtF(x)=∫−∞xf(t)dt

其中 f(x)≥0f(x) \ge 0f(x)≥0,则称 XXX 为连续型随机变量,f(x)f(x)f(x) 称为 XXX 的概率密度函数。

2. 概率密度的性质

  1. f(x)≥0f(x) \ge 0f(x)≥0
  2. ∫−∞+∞f(x)dx=1\int_{-\infty}^{+\infty} f(x) dx = 1∫−∞+∞f(x)dx=1
  3. 在 f(x)f(x)f(x) 的连续点处,F′(x)=f(x)F'(x) = f(x)F′(x)=f(x)
  4. P(a<X≤b)=∫abf(x)dxP(a < X \le b) = \int_a^b f(x) dxP(a<X≤b)=∫abf(x)dx

例题 :设连续型随机变量 XXX 的概率密度为
f(x)={Acos⁡x,∣x∣<π20,其他f(x) = \begin{cases} A \cos x, & |x| < \frac{\pi}{2} \\ 0, & \text{其他} \end{cases}f(x)={Acosx,0,∣x∣<2π其他

求常数 AAA。

由 ∫−∞+∞f(x)dx=1\int_{-\infty}^{+\infty} f(x) dx = 1∫−∞+∞f(x)dx=1 得:
∫−π/2π/2Acos⁡xdx=A⋅2∫0π/2cos⁡xdx=2A⋅1=2A=1\int_{-\pi/2}^{\pi/2} A \cos x dx = A \cdot 2 \int_0^{\pi/2} \cos x dx = 2A \cdot 1 = 2A = 1∫−π/2π/2Acosxdx=A⋅2∫0π/2cosxdx=2A⋅1=2A=1

所以 A=12A = \frac{1}{2}A=21


五、常用的连续型随机变量

1. 均匀分布

若 XXX 的概率密度为
f(x)={1b−a,a<x<b0,其他f(x) = \begin{cases} \frac{1}{b-a}, & a < x < b \\ 0, & \text{其他} \end{cases}f(x)={b−a1,0,a<x<b其他

则称 XXX 在区间 (a,b)(a, b)(a,b) 上服从均匀分布,记为 X∼U(a,b)X \sim U(a, b)X∼U(a,b)。

分布函数
F(x)={0,x<ax−ab−a,a≤x<b1,x≥bF(x) = \begin{cases} 0, & x < a \\ \frac{x-a}{b-a}, & a \le x < b \\ 1, & x \ge b \end{cases}F(x)=⎩ ⎨ ⎧0,b−ax−a,1,x<aa≤x<bx≥b

2. 指数分布

若 XXX 的概率密度为
f(x)={λe−λx,x>00,x≤0f(x) = \begin{cases} \lambda e^{-\lambda x}, & x > 0 \\ 0, & x \le 0 \end{cases}f(x)={λe−λx,0,x>0x≤0

其中 λ>0\lambda > 0λ>0,则称 XXX 服从参数为 λ\lambdaλ 的指数分布,记为 X∼E(λ)X \sim E(\lambda)X∼E(λ)。

分布函数
F(x)={1−e−λx,x>00,x≤0F(x) = \begin{cases} 1 - e^{-\lambda x}, & x > 0 \\ 0, & x \le 0 \end{cases}F(x)={1−e−λx,0,x>0x≤0

3. Γ分布

若 XXX 的概率密度为
f(x)={βαΓ(α)xα−1e−βx,x>00,x≤0f(x) = \begin{cases} \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, & x > 0 \\ 0, & x \le 0 \end{cases}f(x)={Γ(α)βαxα−1e−βx,0,x>0x≤0

其中 α>0,β>0\alpha > 0, \beta > 0α>0,β>0,则称 XXX 服从参数为 α,β\alpha, \betaα,β 的Γ分布,记为 X∼Γ(α,β)X \sim \Gamma(\alpha, \beta)X∼Γ(α,β)。

4. 正态分布

若 XXX 的概率密度为
f(x)=12πσe−(x−μ)22σ2,x∈Rf(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}, x \in \mathbb{R}f(x)=2π σ1e−2σ2(x−μ)2,x∈R

其中 μ,σ>0\mu, \sigma > 0μ,σ>0 为常数,则称 XXX 服从参数为 μ,σ2\mu, \sigma^2μ,σ2 的正态分布,记为 X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2)。

特别地,当 μ=0,σ=1\mu = 0, \sigma = 1μ=0,σ=1 时,称为标准正态分布,记为 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),其概率密度为:
φ(x)=12πe−x22\varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}φ(x)=2π 1e−2x2

历年考题 :设 X∼N(1,4)X \sim N(1, 4)X∼N(1,4),求 P(0<X<1.6)P(0 < X < 1.6)P(0<X<1.6)。

:标准化:Z=X−12∼N(0,1)Z = \frac{X-1}{2} \sim N(0, 1)Z=2X−1∼N(0,1)
P(0<X<1.6)=P(0−12<Z<1.6−12)=P(−0.5<Z<0.3)=Φ(0.3)−Φ(−0.5)=Φ(0.3)−(1−Φ(0.5))P(0 < X < 1.6) = P\left( \frac{0-1}{2} < Z < \frac{1.6-1}{2} \right) = P(-0.5 < Z < 0.3) = \Phi(0.3) - \Phi(-0.5) = \Phi(0.3) - (1 - \Phi(0.5))P(0<X<1.6)=P(20−1<Z<21.6−1)=P(−0.5<Z<0.3)=Φ(0.3)−Φ(−0.5)=Φ(0.3)−(1−Φ(0.5))

查表得 Φ(0.3)=0.6179,Φ(0.5)=0.6915\Phi(0.3) = 0.6179, \Phi(0.5) = 0.6915Φ(0.3)=0.6179,Φ(0.5)=0.6915,所以
P(0<X<1.6)=0.6179−(1−0.6915)=0.3094P(0 < X < 1.6) = 0.6179 - (1 - 0.6915) = 0.3094P(0<X<1.6)=0.6179−(1−0.6915)=0.3094


六、随机变量的函数的分布

1. 离散型随机变量的函数的分布

设 XXX 是离散型随机变量,Y=g(X)Y = g(X)Y=g(X),则 YYY 也是离散型随机变量。其分布律可以通过 XXX 的分布律和函数关系求得。

例题 :设 XXX 的分布律为

XXX -1 0 1
PPP 0.2 0.3 0.5

求 Y=X2Y = X^2Y=X2 的分布律。


YYY 的可能取值为0, 1
P(Y=0)=P(X=0)=0.3,P(Y=1)=P(X=−1)+P(X=1)=0.2+0.5=0.7P(Y = 0) = P(X = 0) = 0.3, \quad P(Y = 1) = P(X = -1) + P(X = 1) = 0.2 + 0.5 = 0.7P(Y=0)=P(X=0)=0.3,P(Y=1)=P(X=−1)+P(X=1)=0.2+0.5=0.7

分布律为:

YYY 0 1
PPP 0.3 0.7

2. 连续型随机变量的函数的分布

公式法(严格单调函数)

设 XXX 是连续型随机变量,概率密度为 fX(x)f_X(x)fX(x),Y=g(X)Y = g(X)Y=g(X),且 ggg 是严格单调函数,则 YYY 的概率密度为:
fY(y)=fX(h(y))∣h′(y)∣f_Y(y) = f_X(h(y))|h'(y)|fY(y)=fX(h(y))∣h′(y)∣

其中 hhh 是 ggg 的反函数。

分布函数法

先求 YYY 的分布函数 FY(y)=P(Y≤y)=P(g(X)≤y)F_Y(y) = P(Y \le y) = P(g(X) \le y)FY(y)=P(Y≤y)=P(g(X)≤y),再求导得概率密度 fY(y)=FY′(y)f_Y(y) = F_Y'(y)fY(y)=FY′(y)。

例题 :设 X∼U(0,1)X \sim U(0, 1)X∼U(0,1),求 Y=−ln⁡XY = -\ln XY=−lnX 的概率密度。


XXX 的概率密度为 fX(x)=1,0<x<1f_X(x) = 1, 0 < x < 1fX(x)=1,0<x<1

函数 y=−ln⁡xy = -\ln xy=−lnx 是严格单调递减函数,反函数为 x=e−yx = e^{-y}x=e−y,导数为 dxdy=−e−y\frac{dx}{dy} = -e^{-y}dydx=−e−y

所以
fY(y)=fX(e−y)∣−e−y∣=1⋅e−y=e−y,y>0f_Y(y) = f_X(e^{-y}) \left| -e^{-y} \right| = 1 \cdot e^{-y} = e^{-y}, y > 0fY(y)=fX(e−y) −e−y =1⋅e−y=e−y,y>0

即 Y∼E(1)Y \sim E(1)Y∼E(1)

历年考题 :设 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),求 Y=X2Y = X^2Y=X2 的概率密度。

当 y≤0y \le 0y≤0 时,FY(y)=0F_Y(y) = 0FY(y)=0,fY(y)=0f_Y(y) = 0fY(y)=0

当 y>0y > 0y>0 时,
FY(y)=P(X2≤y)=P(−y≤X≤y)=Φ(y)−Φ(−y)=2Φ(y)−1F_Y(y) = P(X^2 \le y) = P(-\sqrt{y} \le X \le \sqrt{y}) = \Phi(\sqrt{y}) - \Phi(-\sqrt{y}) = 2\Phi(\sqrt{y}) - 1FY(y)=P(X2≤y)=P(−y ≤X≤y )=Φ(y )−Φ(−y )=2Φ(y )−1

求导得:
fY(y)=2φ(y)⋅12y=1y⋅12πe−y2=12πy−12e−y2,y>0f_Y(y) = 2\varphi(\sqrt{y}) \cdot \frac{1}{2\sqrt{y}} = \frac{1}{\sqrt{y}} \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{y}{2}} = \frac{1}{\sqrt{2\pi}} y^{-\frac{1}{2}} e^{-\frac{y}{2}}, y > 0fY(y)=2φ(y )⋅2y 1=y 1⋅2π 1e−2y=2π 1y−21e−2y,y>0

即 Y∼Γ(12,12)Y \sim \Gamma\left( \frac{1}{2}, \frac{1}{2} \right)Y∼Γ(21,21),也就是自由度为1的 χ2\chi^2χ2 分布。

相关推荐
雪不下3 小时前
编程中的数学:概率(6)
概率论
Cathy Bryant1 天前
信息论(11):链式法则-证明
笔记·算法·数学建模·概率论·信息与通信
大千AI助手2 天前
正态分布:机器学习中的统计基石与高斯遗产
人工智能·机器学习·概率论·高斯分布·正态分布·概率分布·大千ai助手
无水先生4 天前
矩母函数极其应用(1/2)
概率论
培风图南以星河揽胜8 天前
Java实习模拟面试|离散数学|概率论|金融英语|数据库实战|职业规划|期末冲刺|今日本科计科要闻速递:技术分享与学习指南
java·面试·概率论
雪不下11 天前
计算机中的数学:概率(3)
概率论
sensen_kiss12 天前
INT305 Machine Learning 机器学习 Pt.9 Probabilistic Models(概率模型)
人工智能·机器学习·概率论
AI大模型学徒12 天前
NLP基础(八)_马尔可夫模型
算法·机器学习·自然语言处理·nlp·概率论·马尔可夫模型
谅望者14 天前
数据分析笔记08:Python编程基础-数据类型与变量
数据库·笔记·python·数据分析·概率论