第二章 随机变量及其分布
4 随机变量函数的概率分布
4.1 离散型随机变量函数的概率分布
有时候我们所关心的随机变量不能直接测量得到,而他确是某个能直接测量的随机变量的函数。(可以某个简单函数的符合函数,大概就是这么个意思)
例如:我们能测量圆的直径 X X X,而关心的却是其面接 Y = π ( X 2 ) 2 = π 4 X 2 Y = \pi (\frac{X}{2})^2 = \frac{\pi}{4} X^2 Y=π(2X)2=4πX2;这里随机变量 Y Y Y就是随机变量 X X X的函数。
设 g ( x ) g(x) g(x)是一个给定的++连续函数++ ,称 Y = g ( X ) Y=g(X) Y=g(X)为随机变量 X X X的一个函数, Y Y Y也是一个随机变量;当 X X X取值 x x x时, Y Y Y取值为 Y = g ( x ) Y=g(x) Y=g(x)。
接下来我们将讨论如何由已知的随机变量 X X X的概率分布去求函数 Y = g ( X ) Y = g(X) Y=g(X)的概率分布。
首先,讨论 X X X为离散型随机变量,设其分布律为:
X | x 1 x_1 x1 | x 2 x_2 x2 | ... | x k x_k xk | ... |
---|---|---|---|---|---|
P | p 1 p_1 p1 | p 2 p_2 p2 | ... | p k p_k pk | ... |
由于 X X X的取值可能为 x 1 , x 2 , . . . , x k , . . . x_1,\ x_2,\ ...,\ x_k,\ ... x1, x2, ..., xk, ...;所以 Y Y Y的可能取值为 g ( x 1 ) , g ( x 2 ) , . . . , g ( x k ) , . . . g(x_1),\ g(x_2),\ ...,\ g(x_k),\ ... g(x1), g(x2), ..., g(xk), ...;可见 Y Y Y只取有限多个或者可列的无限多个值,++故 Y Y Y也是一个离散型随机变量++。
注意: g ( x 1 ) , g ( x 2 ) , . . . , g ( x k ) , . . . g(x_1),\ g(x_2),\ ...,\ g(x_k),\ ... g(x1), g(x2), ..., g(xk), ...之间可能存在相等的情况。
我们关注的是如何求 Y Y Y的分布律,先看一个例子:
例1:设随机变量 X X X的分布律为:
X | -1 | 0 | 1 | 2 |
---|---|---|---|---|
P | 0.2 | 0.1 | 0.3 | 0.4 |
求:(1) Y = X 3 Y=X^3 Y=X3的分布律; (2) Z = X 2 Z = X^2 Z=X2的分布律。
解:(1) Y Y Y可能的取值有: − 1 , 0 , 1 , 8 -1,\ 0,\ 1,\ 8 −1, 0, 1, 8;且由于:
P { Y = − 1 } = P { X 3 = − 1 } = P { X = − 1 } = 0.2 P\{Y = -1\} = P\{X^3 = -1\} = P\{X = -1\} = 0.2 P{Y=−1}=P{X3=−1}=P{X=−1}=0.2
P { Y = 0 } = P { X 3 = 0 } = P { X = 0 } = 0.1 P\{Y = 0\} = P\{X^3 = 0\} = P\{X = 0\} = 0.1 P{Y=0}=P{X3=0}=P{X=0}=0.1
P { Y = 1 } = P { X 3 = 1 } = P { X = 1 } = 0.3 P\{Y = 1\} = P\{X^3 = 1\} = P\{X = 1\} = 0.3 P{Y=1}=P{X3=1}=P{X=1}=0.3
P { Y = 8 } = P { X 3 = 8 } = P { X = 2 } = 0.4 P\{Y = 8\} = P\{X^3 = 8\} = P\{X = 2\} = 0.4 P{Y=8}=P{X3=8}=P{X=2}=0.4
从而, Y Y Y的分布律为:
X | -1 | 0 | 1 | 8 |
---|---|---|---|---|
P | 0.2 | 0.1 | 0.3 | 0.4 |
(2) Z Z Z可能的取值为: 0 , 1 , 4 0,1,4 0,1,4;且由于:
P { Z = 0 } = P { X 2 = 0 } = P { X = 0 } = 0.1 P\{Z = 0\} = P\{X^2 = 0\} = P\{X=0\} = 0.1 P{Z=0}=P{X2=0}=P{X=0}=0.1
P { Z = 1 } = P { X 2 = 1 } = P { X = − 1 } + P { X = 1 } = 0.2 + 0.3 = 0.5 P\{Z = 1\} = P\{X^2 = 1\} = P\{X=-1\} +P\{X=1\} = 0.2+0.3 = 0.5 P{Z=1}=P{X2=1}=P{X=−1}+P{X=1}=0.2+0.3=0.5
P { Z = 4 } = P { X 2 = 2 } = P { X = 2 } = 0.4 P\{Z = 4\} = P\{X^2 = 2\} = P\{X=2\} = 0.4 P{Z=4}=P{X2=2}=P{X=2}=0.4 # X = − 2 X=-2 X=−2的情况对于 X X X来说概率是 0 0 0
从而, Z Z Z的分布律为:
X | 0 | 1 | 4 |
---|---|---|---|
P | 0.1 | 0.5 | 0.4 |
★ ★ ★ \bigstar \bigstar \bigstar ★★★从此例可以看出, g ( x 1 ) , g ( x 2 ) , . . . , g ( x k ) , . . . g(x_1),\ g(x_2),\ ...,\ g(x_k),... g(x1), g(x2), ..., g(xk),...中的值可能互不相等,也可能有相等的情况,对于 g ( x k ) g(x_k) g(xk)相等的那些 x k x_k xk所对应的概率应改相加作为 g ( x k ) g(x_k) g(xk)的概率。
例2:设 X ∼ B ( 3 , 0.4 ) X \sim B(3,\ 0.4) X∼B(3, 0.4),令 Y = X ( 3 − X ) 2 Y = \frac{X(3-X)}{2} Y=2X(3−X),求 P { Y = 1 } P\{Y=1\} P{Y=1}。
解:有题目知:
P { Y = 1 } = P { X ( 3 − X ) 2 = 1 } = P { X = 1 } + P { X = 2 } = C 3 1 ( 0.4 ) 1 ( 0.6 ) 2 + C 3 2 ( 0.4 ) 2 ( 0.6 ) 1 = 0.72 \begin{align} P\{Y = 1\} &= P\{\frac{X(3-X)}{2} = 1\} \\ & = P\{X = 1\} + P\{X = 2\} &\\ & = C_3^1(0.4)^1(0.6)^2 + C_3^2(0.4)^2(0.6)^1 \\ & = 0.72 \\ \end{align} P{Y=1}=P{2X(3−X)=1}=P{X=1}+P{X=2}=C31(0.4)1(0.6)2+C32(0.4)2(0.6)1=0.72
4.2 连续型随机变量函数的概率分布
设 X X X为连续型随机变量,其概率密度为 f ( x ) f(x) f(x),要求 Y = g ( X ) Y=g(X) Y=g(X)的概率密度 f Y ( y ) f_Y(y) fY(y),我们可以利用如下定理的结论。
**定理1:**设 X X X为连续型随机变量,其概率密度为 f X ( x ) f_X(x) fX(x),设 g ( x ) g(x) g(x)是一个严格++单调可导的函数++ ,其值域为 ( α , β ) (\alpha,\ \beta) (α, β)且 g ′ ( x ) ≠ 0 g'(x) \ne 0 g′(x)=0;记 x = h ( y ) x=h(y) x=h(y)为 y = g ( x ) y=g(x) y=g(x)的反函数,则 Y = g ( X ) Y=g(X) Y=g(X)的概率密度为:
f Y ( y ) = { f X ( h ( y ) ) ∣ h ′ ( y ) ∣ , α < y < β 0 , 其他 f_Y(y) = \begin{cases} f_X(h(y))|h'(y)|,\ \ \ \ & \alpha \lt y \lt \beta \\ 0,\ \ \ \ & 其他 \end{cases} fY(y)={fX(h(y))∣h′(y)∣, 0, α<y<β其他
特别地,当 α = − ∞ , β = + ∞ \alpha =-\infty,\ \beta = +\infty α=−∞, β=+∞时:
f Y ( y ) = f X ( h ( y ) ) ∣ h ′ ( y ) ∣ , − ∞ < y < + ∞ f_Y(y) = f_X(h(y))|h'(y)|,\ \ \ \ \ -\infty \lt y \lt +\infty fY(y)=fX(h(y))∣h′(y)∣, −∞<y<+∞ 。
例3:设连续性随机变量 X X X的概率密度为 f X ( x ) f_X(x) fX(x),令 Y = a X + b Y = aX + b Y=aX+b,其中 a , b a,\ b a, b为常数 a ≠ 0 a \ne 0 a=0,求 Y Y Y的概率密度。
解:由题目知,设: y = g ( x ) = a x + b y = g(x) = ax+b y=g(x)=ax+b则:
x = h ( y ) = y − b a , h ′ ( y ) = 1 a x = h(y) = \frac{y-b}{a},\ \ h'(y) = \frac{1}{a} x=h(y)=ay−b, h′(y)=a1
f Y ( y ) = f X ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ = f X ( y − b a ) ⋅ ∣ 1 a ∣ f_Y(y) = f_X(h(y)) \cdot |h'(y)| = f_X(\frac{y-b}{a}) \cdot |\frac{1}{a}| fY(y)=fX(h(y))⋅∣h′(y)∣=fX(ay−b)⋅∣a1∣
例4: X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)求:(1) Y = X − μ σ Y = \frac{X-\mu}{\sigma} Y=σX−μ的概率密度;(2) Y = a X + b Y = aX+b Y=aX+b的概率密度。
解:由题目知 X X X的概率密度为: f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f_X(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} fX(x)=2π σ1e−2σ2(x−μ)2
(1) Y = X − μ σ = 1 a X + ( − μ a ) Y = \frac{X - \mu}{\sigma} = \frac{1}{a}X + (-\frac{\mu}{a}) Y=σX−μ=a1X+(−aμ)
x = h ( y ) = σ y + μ , h ′ ( y ) = σ x = h(y) = \sigma y+\mu,\ \ h'(y) = \sigma x=h(y)=σy+μ, h′(y)=σ
f Y ( y ) = f X ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ = f X ( σ y + μ ) ⋅ σ = 1 2 π σ e − ( σ y + μ − μ ) 2 2 σ 2 ⋅ σ = 1 2 π e − y 2 2 f_Y(y) = f_X(h(y)) \cdot |h'(y)| = f_X(\sigma y + \mu) \cdot \sigma = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(\sigma y + \mu -\mu)^2}{2\sigma^2}} \cdot \sigma = \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}} fY(y)=fX(h(y))⋅∣h′(y)∣=fX(σy+μ)⋅σ=2π σ1e−2σ2(σy+μ−μ)2⋅σ=2π 1e−2y2
即: Y ∼ N ( 0 , 1 ) Y \sim N(0,\ 1) Y∼N(0, 1)。
(2)由例3中的结论 f Y ( y ) = f X ( y − b a ) ⋅ ∣ 1 a ∣ = 1 ∣ a ∣ ⋅ 1 2 π σ e − ( y − b a − μ ) 2 2 σ 2 = 1 2 π σ ∣ a ∣ e − ( y − b − a μ ) 2 2 ( σ a ) 2 f_Y(y) = f_X(\frac{y-b}{a}) \cdot |\frac{1}{a}| = \frac{1}{|a|} \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(\frac{y-b}{a}-\mu)^2}{2\sigma^2}} = \frac{1}{\sqrt{2\pi} \sigma|a|} e^{-\frac{(y-b-a\mu)^2}{2(\sigma a)^2}} fY(y)=fX(ay−b)⋅∣a1∣=∣a∣1⋅2π σ1e−2σ2(ay−b−μ)2=2π σ∣a∣1e−2(σa)2(y−b−aμ)2
即: Y ∼ N ( b + a μ , a 2 σ 2 ) Y \sim N(b+a\mu, a^2\sigma^2) Y∼N(b+aμ,a2σ2)
\\bigstar \\bigstar \\bigstar 本示例说明了两个重要的结论:当 本示例说明了两个重要的结论:当 本示例说明了两个重要的结论:当X \\sim N(\\mu, \\sigma\^2) 时 时 时Y = \\frac{X-\\mu}{\\sigma} \\sim N(0,\\ 1) 且随机变量 且随机变量 且随机变量\\frac{X-\\mu}{\\sigma} 称为 称为 称为X 的标准化。另外,正态随机变量的线性变换 的标准化。另外,正态随机变量的线性变换 的标准化。另外,正态随机变量的线性变换Y=aX+b 仍旧是正态随机变量,即 仍旧是正态随机变量,即 仍旧是正态随机变量,即aX+b \\sim N(b+a\\mu,\\ a^2\\sigma^2)。
例5:设 X ∼ U ( − π 2 , π 2 ) X \sim U(-\frac{\pi}{2},\ \frac{\pi}{2}) X∼U(−2π, 2π),令 Y = tan X Y=\tan{X} Y=tanX,求 Y Y Y的概率密度 f Y ( y ) f_Y(y) fY(y)。
解:由题目知, X X X服从均匀分布,其概率密度为:
f X ( x ) = { 1 π , − π 2 ≤ x ≤ π 2 0 , 其他 f_X(x) = \begin{cases} \frac{1}{\pi},\ \ & -\frac{\pi}{2} \le x \le \frac{\pi}{2}\\ 0,\ \ &其他 \end{cases} fX(x)={π1, 0, −2π≤x≤2π其他
令 y = g ( x ) = tan x y = g(x) = \tan{x} y=g(x)=tanx,其值域为 ( − ∞ , + ∞ ) (-\infty, +\infty) (−∞,+∞);
其反函数: x = h ( y ) = arctan y x = h(y) = \arctan{y} x=h(y)=arctany;反函数的倒数: h ′ ( y ) = 1 1 + y 2 h'(y) = \frac{1}{1+y^2} h′(y)=1+y21
因此: f Y ( y ) = f X ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ , arctan y ∈ ( − π 2 , π 2 ) f_Y(y) = f_X(h(y)) \cdot |h'(y)|,\ \ \ \ \arctan{y} \in (-\frac{\pi}{2},\ \frac{\pi}{2}) fY(y)=fX(h(y))⋅∣h′(y)∣, arctany∈(−2π, 2π)
f X ( h ( y ) ) = 1 π ; 又因: ∣ 1 1 + y 2 ∣ = 1 1 + y 2 f_X(h(y)) = \frac{1}{\pi}; 又因:|\frac{1}{1+y^2}| = \frac{1}{1+y^2} fX(h(y))=π1;又因:∣1+y21∣=1+y21
∴ f Y ( y ) = 1 π ⋅ 1 1 + y 2 \therefore f_Y(y) = \frac{1}{\pi} \cdot \frac{1}{1+y^2} ∴fY(y)=π1⋅1+y21
++这一概率分布也称为柯西(cauthy)分布++。
tan x 、 cot x \tan{x}、\cot{x} tanx、cotx的图像:
① ( sin x ) ′ = cos x (\sin{x})'=\cos{x} (sinx)′=cosx;即正弦的导数是余弦.② ( cos x ) ′ = − sin x (\cos{x})'=-\sin{x} (cosx)′=−sinx;即余弦的导数是正弦的相反数.
③ ( tan x ) ′ = ( sec x ) 2 (\tan{x})'=(\sec{x})^2 (tanx)′=(secx)2;即正切的导数是正割的平方.
④ ( cot x ) ′ = − ( csc x ) 2 (\cot{x})'=-(\csc{x})^2 (cotx)′=−(cscx)2;即余切的导数是余割平方的相反数.
⑤ ( sec x ) ′ = sec x tan x (\sec{x})'=\sec{x}\tan{x} (secx)′=secxtanx;即正割的导数是正割和正切的积.
⑥ ( csc x ) ′ = − csc x cot x (\csc{x})'=-\csc{x}\cot{x} (cscx)′=−cscxcotx;即余割的导数是余割和余切的积的相反数.
⑦ ( arcsin x ) ′ = 1 ( 1 − x 2 ) (\arcsin{x})'=\frac{1}{\sqrt{(1-x^2)}} (arcsinx)′=(1−x2) 1
⑧ ( arccos x ) ′ = − 1 ( 1 − x 2 ) (\arccos{x})'=-\frac{1}{\sqrt{(1-x^2)}} (arccosx)′=−(1−x2) 1
⑨ ( arctan x ) ′ = 1 ( 1 + x 2 ) (\arctan{x})'=\frac{1}{(1+x^2)} (arctanx)′=(1+x2)1
⑩KaTeX parse error: Undefined control sequence: \arccot at position 2: (\̲a̲r̲c̲c̲o̲t̲{x})'=-\frac{1}...
例6:设 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2),求 Y = e X Y = e^X Y=eX的概率分布 f Y ( y ) f_Y(y) fY(y)。
解:令 y = g ( x ) = e x y = g(x) = e^x y=g(x)=ex;其值域为 ( 0 , + ∞ ) (0, +\infty) (0,+∞)
其反函数为: x = h ( y ) = ln y x = h(y) = \ln{y} x=h(y)=lny;反函数的倒数为: h ′ ( y ) = 1 y h'(y) = \frac{1}{y} h′(y)=y1则:
++此分布为"对数正态分布"++。
++以上例子中使用公式求解,因此也叫"公式"法;注意:公式要求 y = g ( x ) y = g(x) y=g(x)为单调函数,若不是单调函数则不能使用公式法求解++。
例7:设随机变量 X X X的概率密度为:
f X ( x ) = { x 8 , 0 < x < 4 0 , 其他 f_X(x)= \begin{cases} \frac{x}{8},\ \ &0 \lt x \lt 4 \\ 0,\ &其他 \end{cases} fX(x)={8x, 0, 0<x<4其他
求: Y = 2 X + 8 Y = 2X + 8 Y=2X+8的概率密度。
解:设 Y Y Y的分布函数为 F Y ( y ) F_Y(y) FY(y),则:
F Y ( y ) = P { Y ≤ y } = P { 2 X + 8 ≤ Y } = P { X ≤ y − 8 2 } = F X ( y − 8 2 ) F_Y(y) = P\{Y \le y\} = P\{2X + 8 \le Y\} = P\{X \le \frac{y-8}{2}\} = F_X(\frac{y-8}{2}) FY(y)=P{Y≤y}=P{2X+8≤Y}=P{X≤2y−8}=FX(2y−8) 其中 F X ( x ) F_X(x) FX(x)是 X X X的分布函数;故:
注意:这里的 F Y ′ ( y ) = [ F X ( y − 8 2 ) ] ′ = F X ′ ( y − 8 2 ) ⋅ ( y − 8 2 ) ′ = F X ′ ( y − 8 2 ) ⋅ 1 2 F'_Y(y) = [F_X(\frac{y-8}{2})]' = F'_X(\frac{y-8}{2}) \cdot (\frac{y-8}{2})'= F'_X(\frac{y-8}{2}) \cdot \frac{1}{2} FY′(y)=[FX(2y−8)]′=FX′(2y−8)⋅(2y−8)′=FX′(2y−8)⋅21是复合函数求导的方法!!
这种解法叫"直接变换法",它可以适用于非单调性随机变量的情况,但本例中 Y = 2 X + 8 Y = 2X+8 Y=2X+8是单调函数(切线的斜率或者导数不会更改正负号的函数),因此即可以使用前面的"公式法",也可以使用"直接变换法"。
例8:设 X X X的概率密度为 f X ( x ) f_X(x) fX(x),求 Y = X 2 Y = X^2 Y=X2的概率密度 f Y ( y ) f_Y(y) fY(y),特别地,当 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1)时,求 Y = X 2 Y = X^2 Y=X2的概率密度。
明显 Y = X 2 Y=X^2 Y=X2不是单调函数了。
解:当 y ≤ 0 y \le 0 y≤0时, Y Y Y的分布函数为: F Y ( y ) = P { Y ≤ y } = P { X 2 ≤ y } = 0 F_Y(y) = P\{Y \le y\} = P\{X^2 \le y\} = 0 FY(y)=P{Y≤y}=P{X2≤y}=0 #这是常识判断的,因为不存在实数的平方是负数的情况。
因此: f Y ( y ) = 0 f_Y(y) = 0 fY(y)=0
当 y > 0 y \gt 0 y>0时, Y Y Y的分布函数为: F Y ( y ) = P { Y ≤ y } = P { X 2 ≤ y } = P { − y ≤ x ≤ y } = F X ( y ) − F X ( − y ) F_Y(y) = P\{Y \le y\} = P\{X^2 \le y\} = P\{-\sqrt{y} \le x \le \sqrt{y}\} = F_X(\sqrt{y}) - F_X(-\sqrt{y}) FY(y)=P{Y≤y}=P{X2≤y}=P{−y ≤x≤y }=FX(y )−FX(−y )
其中, F X ( x ) F_X(x) FX(x)时 X X X的分布函数,则:
f Y ( y ) = F Y ′ ( y ) = ( F X ( y ) − F X ( − y ) ) ′ = 1 2 y ⋅ F X ′ ( y ) + 1 2 y ⋅ F X ′ ( − y ) = 1 2 y ( f X ( y ) + f X ( − y ) ) f_Y(y) = F'_Y(y) = (F_X(\sqrt{y}) - F_X(-\sqrt{y}))' = \frac{1}{2\sqrt{y}} \cdot F'_X(\sqrt{y}) + \frac{1}{2\sqrt{y}} \cdot F'_X(-\sqrt{y}) = \frac{1}{2\sqrt{y}} (f_X(\sqrt{y}) + f_X(-\sqrt{y}) ) fY(y)=FY′(y)=(FX(y )−FX(−y ))′=2y 1⋅FX′(y )+2y 1⋅FX′(−y )=2y 1(fX(y )+fX(−y )) # 注意 F F F和 f f f的变化。
根据题目知: X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1),则: f X ( x ) = 1 2 π e − x 2 2 f_X(x) = \frac{1}{\sqrt{2\pi}} e^{- \frac{x^2}{2}} fX(x)=2π 1e−2x2 可得:
f Y ( y ) = 1 2 y ( 1 2 π e − y 2 + 1 2 π e − y 2 ) = 1 2 π y e − y 2 f_Y(y) = \frac{1}{2\sqrt{y}} (\frac{1}{\sqrt{2\pi}} e^{-\frac{y}{2}} + \frac{1}{\sqrt{2\pi}} e^{-\frac{y}{2}}) = \frac{1}{\sqrt{2\pi y}} e^{- \frac{y}{2}} fY(y)=2y 1(2π 1e−2y+2π 1e−2y)=2πy 1e−2y
综上:
f Y ( y ) = { 1 2 π y e − y 2 , y > 0 0 , 其他 f_Y(y)= \begin{cases} \frac{1}{\sqrt{2\pi y}} e^{- \frac{y}{2}} , \ \ & y \gt 0\\ 0 , \ \ & 其他 \end{cases} fY(y)={2πy 1e−2y, 0, y>0其他
X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1)则 Y = X 2 Y = X^2 Y=X2为 χ 2 \chi^2 χ2分布,其自由度为 1 1 1,记作: Y ∼ χ 2 ( 1 ) Y \sim \chi^2(1) Y∼χ2(1)。将在后面的章节详细讲解。