概率多维随机变量与分布

一、二维

1、二维随机变量及其分布

假设E是随机试验，Ω是样本空间，X、Y是Ω的两个变量；(X,Y)就叫做二维随机变量或二维随机向量。X、Y来自同一个样本空间。

联合分布函数 F(x,y)=P(X≤x,Y≤y)，即F(x,y)表示求(x,y)左下方的面积。 F(x,y) 不减，例如：y固定，x1<x2，F(x1,y)<F(x2,y)；F(x,y)分别关于x和y右连续。

对于<，< 存在 P(< X ≤ ， <Y ≤ ) = F(,) - F(,)-F(,)+F(,)

P(< X ≤ ， <Y ≤ ) 如左下图表示，等号右边则是图中四块区域的代表。

2、二维离散型随机变量的联合分布和边缘分布

边缘分布 是表示在所有可能的一个变量值上，获取另一个变量的概率之和

X的边缘分布：(x) = P(X ≤ x) = F(x,+∞) = P(X≤x,Y<+∞)

Y的边缘分布：(y) = P(Y ≤ y) = F(+∞,y) = P(X<+∞,Y≤y)

联合概率质量函数 P(X=x,Y=y) 描述了随机变量 X 和 Y 同时取特定值 x 和y 的概率。所有可能的 x 和 y 值的概率之和等于1。

3、二维连续随机变量的联合密度和边缘密度函数

F(x,y) = P(X≤x,Y≤y) = f(s,t) ds dt 函数就是对所有的x,y进行积分求和。

例如：已知联合密度函数，求分布函数F(x,y)

解：带入分布函数公式： f(s,t) ds dt = dx dy = dx dy =(1-)(1-) ;因为联合密度函数定义域为x,y都大于0，所以积分时只需要大于0即可

边缘密度函数 直接将另一个变量积分部分等价于（x,+），则剩下部分为另一个变量的边缘密度函数。

二、条件分布

1、基础定义

已知另一个随机变量或事件的条件下，该随机变量的概率分布：F(x|A)=P(X x | A)

例如：概率密度函数如图，求在X>1的条件下f(x)的条件分布函数

解：F(x | X>1) = P(X x|X>1)=P(X x,X>1)/ P(X>1)

求分子：P(1 X x) = 1/ dx = 1/ * arctan(x) = arctan(x)/ - 1/4

求分母：P(X>1) = 1/ = 1/ * arctan(x) = 1/ * /2 - 1/ * /4 = 1/4

则整个结果为（arctan(x)/ - 1/4）/1/4=arctan(x)/ -1

2、离散型随机变量的条件分布

从分布表来理解

X\Y	0	1
0	0.1	0.3
1	0.3	0.3

P(Y=y) 是 Y 的边缘概率质量函数，Y 的边缘概率质量函数是对列求和：

Y	0	1
P	0.4	0.6

那么在Y=1的条件下，假设x=0，X=x的概率为： P(X=0∣Y=1)=03/0.6 =0.5；假设x=1，X=x的概率为 P(X=1∣Y=1)=0.3/0.6=0.5

3、连续型随机变量的条件分布

Y=y条件下，条件概率密度函数为： f(x∣y)=f(x,y) / (y)；同理X=x条件下：f(y∣x)=f(x,y) / (x)。其中(y) 、(x) 是边缘函数。

例如：假设

解：f(x|y) = f(x,y) / (y) = 1/(1+)(1+) / 1/(1+) = 1/(1+)

f(y|x) = f(x,y) / (x) = 1/(1+)(1+) / 1/(1+) = 1/(1+)

三、随机变量独立性

概率密度函数f(x,y)可以表示为各自边缘概率密度函数的乘积：

离散型 ：P(X=x,Y=y)=P(X=x)⋅P(Y=y)

连续型 ：f(x,y)=(x)⋅(y)

四、二维随机变量函数的分布

1、离散型

第一步：列出所有x与y结合的取值点 (例如：z=x+y)

第二步：根据联合概率质量函数 P(X=x,Y=y) 求z的值分布及其概率

第三步；全部z点相加验证是否等于1

例如：

假设有两个离散型随机变量 XX 和 YY，它们的联合PMF如下表所示：

X \ Y	1	2	3
1	0.1	0.2	0.0
2	0.0	0.3	0.0
3	0.1	0.1	0.2

第一步：列出所有z点（P(1,1) ,P(1,2),P(1,3),P(2,1),P(2,2),P(2,3),P(3,1),P(3,2),P(3,3)

第二步：根据点得到对应概率，并根据（z=x+y）的求得Z点数值

Z2=P(1,1) = 0.1

Z3=P(1,2)+P(2,1) = 0.2+0.0 = 0.2

Z4=P(1,3)+P(2,2)+P(3,1) =0.0+0.3+0.1=0.4

Z5=P(2,3)+P(3,2)=0.0+0.1=0.1

Z6=P(3,3)=0.2

第三步：根据得到所有点概率进行求和验证 Z2+Z3+Z4+Z5+Z6 =0.1+0.2+0.4+0.1+0.2=1

2、连续型

第一步：明确要求需要什么函数（分布函数、概率密度函数）

第二步：根据联合密度函数进行（x,y）积分得到分布函数，在进行求导得到z的概率密度函数

(z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy ; (z)=d/dz * (z)

例如：假设 (X,Y) 的联合概率密度函数为下图，求Z*=*X+Y的分布

解：

第一步：求分布函数，根据z=x+y 以及函数信息得到 z在(x,y)的分布 => 直角坐标系点（1，1）、（1，0）、（0，1）、（0，0），四个点所在的长方形，线条z=x+y 也就是点（2，0）、（0，2）、（0，0）三点的三角形区域，两块面积的区域交集部分就是z在直角坐标系的投影;根据x,y的值获得z的分布区间（0，2），由于z在（0，1）区间是符合x,y的区间随意落地，可以直接使用积分函数求解；z在（1，2）区间内只能在长方形减去右上三角面积的结果

第二步：对（0，1）进行积分：根据联合密度函数进行积分布函数 (z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy = dx 2 dy = 2y dx = 2(z-x) dx =2zx - =

对（1，2）：由于是得到面积，所以不需要积分为 1-/2

第三步：汇总结果形成分布函数

总结：连续型可直接根据图形面积汇总（x和y的随意分布形状与联合函数区域不一致），若在一致情况下可求面积也可以求积分得到分布函数，再根据分布函数求导得到概率密度函数。

概率 多维随机变量与分布