概率 多维随机变量与分布

一、二维

1、二维随机变量及其分布

假设E是随机试验,Ω是样本空间,X、Y是Ω的两个变量;(X,Y)就叫做二维随机变量或二维随机向量。X、Y来自同一个样本空间。

联合分布函数 F(x,y)=P(X≤x,Y≤y),即F(x,y)表示求(x,y)左下方的面积。 F(x,y) 不减,例如:y固定,x1<x2,F(x1,y)<F(x2,y);F(x,y)分别关于x和y右连续。

对于<< 存在 P(< X ≤ <Y ≤ ) = F(,) - F(,)-F(,)+F(,)

P(< X ≤ <Y ≤ ) 如左下图表示,等号右边则是图中四块区域的代表。

2、二维离散型随机变量的联合分布和边缘分布

边缘分布 是表示在所有可能的一个变量值上,获取另一个变量的概率之和

X的边缘分布:(x) = P(X ≤ x) = F(x,+∞) = P(X≤x,Y<+∞)

Y的边缘分布:(y) = P(Y ≤ y) = F(+∞,y) = P(X<+∞,Y≤y)

联合概率质量函数 P(X=x,Y=y) 描述了随机变量 X 和 Y 同时取特定值 x 和y 的概率。所有可能的 x 和 y 值的概率之和等于1。

3、二维连续随机变量的联合密度和边缘密度函数

F(x,y) = P(X≤x,Y≤y) = f(s,t) ds dt 函数就是对所有的x,y进行积分求和。

例如: 已知联合密度函数,求分布函数F(x,y)

解:带入分布函数公式: f(s,t) ds dt = dx dy = dx dy =(1-)(1-) ;因为联合密度函数定义域为x,y都大于0,所以积分时只需要大于0即可

边缘密度函数 直接将另一个变量积分部分等价于(x,+),则剩下部分为另一个变量的边缘密度函数。

二、条件分布

1、基础定义

已知另一个随机变量或事件的条件下,该随机变量的概率分布:F(x|A)=P(X x | A)

例如:概率密度函数如图,求在X>1的条件下f(x)的条件分布函数

解:F(x | X>1) = P(X x|X>1)=P(X x,X>1)/ P(X>1)

求分子:P(1 X x) = 1/ dx = 1/ * arctan(x) = arctan(x)/ - 1/4

求分母:P(X>1) = 1/ = 1/ * arctan(x) = 1/ * /2 - 1/ * /4 = 1/4

则整个结果为 (arctan(x)/ - 1/4)/1/4=arctan(x)/ -1

2、离散型随机变量的条件分布

从分布表来理解

X\Y 0 1
0 0.1 0.3
1 0.3 0.3

P(Y=y) 是 Y 的边缘概率质量函数,Y 的边缘概率质量函数是对列求和:

Y 0 1
P 0.4 0.6

那么在Y=1的条件下,假设x=0,X=x的概率为: P(X=0∣Y=1)=03/0.6 =0.5;假设x=1,X=x的概率为 P(X=1∣Y=1)=0.3/0.6=0.5

3、连续型随机变量的条件分布

Y=y条件下,条件概率密度函数为: f(x∣y)=f(x,y) / (y);同理X=x条件下:f(y∣x)=f(x,y) / (x)。其中(y) 、(x) 是边缘函数。

例如:假设

解:f(x|y) = f(x,y) / (y) = 1/(1+)(1+) / 1/(1+) = 1/(1+)

f(y|x) = f(x,y) / (x) = 1/(1+)(1+) / 1/(1+) = 1/(1+)

三、随机变量独立性

概率密度函数f(x,y)可以表示为各自边缘概率密度函数的乘积:

离散型 :P(X=x,Y=y)=P(X=x)⋅P(Y=y)

连续型 :f(x,y)=(x)⋅(y)

四、二维随机变量函数的分布

1、离散型

第一步:列出所有x与y结合的取值点 (例如:z=x+y)

第二步:根据联合概率质量 函数 P(X=x,Y=y) 求z的值分布及其概率

第三步;全部z点相加验证是否等于1

例如:

假设有两个离散型随机变量 XX 和 YY,它们的联合PMF如下表所示:

X \ Y 1 2 3
1 0.1 0.2 0.0
2 0.0 0.3 0.0
3 0.1 0.1 0.2

第一步:列出所有z点 (P(1,1) ,P(1,2),P(1,3),P(2,1),P(2,2),P(2,3),P(3,1),P(3,2),P(3,3)

第二步:根据点得到对应概率,并根据(z=x+y)的求得Z点数值

Z2=P(1,1) = 0.1

Z3=P(1,2)+P(2,1) = 0.2+0.0 = 0.2

Z4=P(1,3)+P(2,2)+P(3,1) =0.0+0.3+0.1=0.4

Z5=P(2,3)+P(3,2)=0.0+0.1=0.1

Z6=P(3,3)=0.2

第三步:根据得到所有点概率进行求和验证 Z2+Z3+Z4+Z5+Z6 =0.1+0.2+0.4+0.1+0.2=1

2、连续型

第一步:明确要求需要什么函数(分布函数、概率密度函数)

第二步:根据联合密度函数进行(x,y)积分得到 分布函数,在进行 求导得到z的概率密度函数

(z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy ; (z)=d/dz * (z)

例如:假设 (X,Y) 的联合概率密度函数为下图, 求Z*=*X+Y的分布

解:

第一步:求分布函数,根据z=x+y 以及函数信息得到 z在(x,y)的分布 => 直角坐标系 点(1,1)、(1,0)、(0,1)、(0,0),四个点所在的长方形,线条z=x+y 也就是点(2,0)、(0,2)、(0,0)三点的三角形区域,两块面积的区域交集部分就是z在直角坐标系的投影;根据x,y的值获得z的分布区间(0,2),由于z在(0,1)区间是符合x,y的区间随意落地,可以直接使用积分函数求解;z在(1,2)区间内只能在长方形减去右上三角面积的结果

第二步:对(0,1)进行积分 :根据 联合密度函数进行积分布函数 (z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy = dx 2 dy = 2y dx = 2(z-x) dx =2zx - =

对(1,2):由于是得到面积,所以不需要积分为 1-/2

第三步:汇总结果 形成分布函数

总结:连续型可直接根据图形面积汇总(x和y的随意分布形状与联合函数区域不一致),若在一致情况下可求面积也可以求积分得到分布函数,再根据分布函数求导得到概率密度函数。

相关推荐
HSunR2 天前
概率论 期末 笔记
笔记·概率论
2302_796984743 天前
概率论基础知识点公式汇总
概率论
项目申报小狂人3 天前
广义正态分布优化算法(GNDO)Generalized Normal Distribution Optimization
算法·概率论
2302_796984743 天前
概率论基础
概率论
感谢地心引力3 天前
【数据分析】层次贝叶斯
机器学习·数据分析·概率论
Mount2564 天前
【数理统计】极限定理及抽样分布
概率论
勤劳的进取家4 天前
多维高斯分布
人工智能·机器学习·概率论
公众号Codewar原创作者4 天前
R机器学习:朴素贝叶斯算法的理解与实操
人工智能·机器学习·概率论
orion-orion4 天前
概率论沉思录:初等假设检验
人工智能·概率论·科学哲学
Mount2565 天前
【数理统计】参数估计
概率论