X=x同时Y=y的概率可以表达为P(X=x,Y=y)或者缩写为P(x,y)。
事件B已经发生的情况下事件A发生的概率,称为给定B条件下A的条件概率。给定Y=y条件下X=x的条件概率,表示为P(X=x|Y=y)。和无条件概率类似,这个表达式也可以缩写为P(x|y)。
X=x在给定Y=y条件下的条件概率,与无条件的X=x的概率相比有较大的变化。一个直观的例子是,一般人患糖尿病的概率比较低,但是,在直系亲属患糖尿病的条件下,则患糖尿病的概率将大大增加。
P(A,B)=A条件和B条件同时成立(x<4000,x>2000)所有的x中 x<4000和x>2000
P(A|B)=基于B条件中A条件成立 (x<4000 | x>2000) 所有x>2000中x<4000的概率
显然有
一般地,通过过滤法计算条件概率P(A|B)的步骤是:
1)在总的样本数据集中计算各个样本类别的概率,得到总数据表;
2)根据条件概率式中的条件B,将总数据表中不符合条件B的数据样本类别删除,得到样本子表;
3)在样本子表中将符合条件A的样本类别筛选出来,将各个符合条件A的样本类别在样本子表中的概率加和,得到初步的条件概率P′(A|B);
4)样本子表中所有样本类别在总数据表中的概率的总和假设为θ,将初步的条件概率P′(A|B)除以θ,即为条件概率P(A|B)。
概率分布
离散变量概率分布简单
连续变量概率分布通过一个函数f------概率密度函数来表示。将变量X的概率密度函数画在坐标平面上,则变量X取值在a和b之间的概率为概率密度函数f的曲线与X轴之间在a和b之间的面积,也就是函数f在a和b之间的积分
函数f曲线与X轴之间的总面积
也就是变量X的所有取值的概率和应为1。
一组变量的概率分布是这组变量所有可能的取值组合的概率的集合,称为联合概率分布。假设这组变量有两个变量X和Y,都可以取值1和2,那么这组变量所有可能的变量取值的组合及其对应的概率数值可以为"P(X=1,Y=1)=0.2,P(X=1,Y=2)=0.1,P(X=2,Y=1)=0.4,P(X=2,Y=2)=0.3"。与单变量的概率分布类似,一组变量的联合概率分布的概率数值的总和也必须为1。
全概率计算公式
1.乘法公式如果已知事件B的概率和事件A基于事件B的条件概率,在式(2.2)的基础上,通过简单的变换可有事件A和B同时发生的概率:
式(2.3)称为概率的乘法公式。比如,一个学生聪明且成绩优秀的概率等于他在聪明的条件下成绩优秀的概率乘以他聪明的概率。P(A,B)也通常简写为P(AB)。
2.全概率公式对于任意两个互斥的事件A和B,有
P(A或B)=P(A)+P(B)
对于任意两个事件A和B,有
P(A)=P(A,B)+P(A,"非B")
(互斥的部分相互抵消?)
"A与B同时发生"和"A发生且B不发生"是互斥的,因为在A发生时,或者是"A与B同时发生",或者是"A发生且B不发生",但两者不可能同时发生。比如,"张三是个高个子男人"和"张三是个高个子女人"就是互斥的,因为在张三是个高个子时,张三是个高个子男人就不可能是个高个子女人。因此有
P(张三是个高个子)=P(张三是个高个子男人)+P(张三是个高个子女人)
更一般地,对于任意一组事件的集合B1,B2,...,Bn,若该集合中的事件有且只有一个为真、事件概率的和为1(完备、互斥的事件集合,称为一个"划分"),即
Bi∩Bj=Ø,i≠j B1∪B2∪...∪Bn=1
B1∪B2∪...∪Bn=1
在式(2.4)中,通过将事件A与事件集合B(一个"划分")中的各个事件Bi同时发生的概率P(ABi)加和,来计算事件A的概率,我们称之为对事件集合B进行边缘化,相应得到的概率P(A)称为事件A的边缘化概率。根据概率的乘法公式,可有
既
这就是全概率公式。下面用一个现实的例子来说明:如果我们从一副扑克中随机抽取一张牌,那么这张牌是J的概率等于下面四个概率之和:是J且是黑桃的概率,是J且是红桃的概率,是J且是梅花的概率,是J且是方块的概率。
从全概率公式(2.6)可见,借助于样本空间的一个划分B1,B2,...,Bn,可以将事件A分解成互不相容的部分A|B1,A|B2,...,A|Bn,从而将概率P(A)分解成若干部分,分别进行计算再求和。其用途在于,当直接计算P(A)较复杂时,可以通过适当的构造划分B1,B2,...,Bn,在计算P(Bi)和P(A|Bi)的基础上,来简化P(A)的计算。
例2.2 某系统中甲类元件占10%、乙类元件占40%、丙类元件占50%,t小时后各类元件的损坏率分别为30%、25%和10%,试求t小时后,任意抽取该系统中的一个元件,发现它已损坏的概率。
解:设事件A={抽出的元件已损坏}、事件B1={所抽取元件是甲类元件}、事件B2={所抽取元件是乙类元件}、事件B3={所抽取元件是丙类元件},则{B1,B2,B3}构成样本空间的一个划分,由全概率公式可有
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)=0.1×0.3+0.4×0.25+0.5×0.1=0.18
例2.3 10个人依次抽签,10张签中有5张是幸运签,幸运签可以换一张球票,另外5张是空白签,不能换球票,求第1个人、第2个人以及第10个人抽到幸运签的概率。解:设事件Ai={第i人抽到幸运签},i=1,2,...,10,则有
3.链式法则概率的乘法公式解决了两个变量的联合概率分布的计算问题,我们可以将其推广到更多的变量,比如n个变量(A1,A2,A3,...,An)的联合概率分布的计算,反复利用概率的乘法公式,则有
其中,当i=1时,P(Ai|A1,A2,...,Ai-1)=P(A1)。链式法则将多个变量的联合分布分解为多个条件概率的乘积形式,当变量之间存在相互独立性时,利用链式法则可以大大简化联合概率分布的计算,我们将在后面的内容中进行介绍。
4.条件概率展开式为便于分析,有时需要在条件概率表达式中增加条件变量,也称为将条件概率按一个变量展开,相应条件概率展开满足以下等式:
证明
上述推导中,第一个等号是对求和的表达式的分子、分母(分母为1)同乘以P(X=x);第二个等号和第三个等号是两次应用概率的乘法公式;第四个等号是因为对变量Z的所有取值z求和与分母无关,所以可以将求和符号只应用于分子;第五个等号是对变量Z做边缘化,相应地分子中消掉了变量Z;第六个等号利用了概率的乘法公式。