定义 设 P ( A ) > 0 P(A) > 0 P(A)>0,若在随机事件 A A A发生的条件下随机事件 B B B发生的概率记作 P ( B ∣ A ) P(B|A) P(B∣A),定义
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB)
则称 P ( B ∣ A ) P(B|A) P(B∣A)是事件 A A A发生的条件下事件 B B B发生的条件概率。
定理 设 A , B A, B A,B为两个随机事件且 P ( A ) > 0 P(A) > 0 P(A)>0,则
P ( A B ) = P ( B ∣ A ) P ( A ) (1.1) P(AB) = P(B|A)P(A) \tag{1.1} P(AB)=P(B∣A)P(A)(1.1)
或者,若 P ( B ) > 0 P(B) > 0 P(B)>0,则
P ( A B ) = P ( A ∣ B ) P ( B ) (1.2) P(AB) = P(A|B)P(B) \tag{1.2} P(AB)=P(A∣B)P(B)(1.2)
式 (1.1) 和式 (1.2) 都称为概率乘法公式。
概率乘法公式可以推广到多个事件的情形:设 A 1 , A 2 , ⋯ , A n A_1, A_2, \cdots, A_n A1,A2,⋯,An是先后相继的 n n n个随机事件,且满足 P ( A 1 A 2 ⋯ A n − 1 ) > 0 P(A_1 A_2 \cdots A_{n-1}) > 0 P(A1A2⋯An−1)>0,则
P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P(A_1 A_2 \cdots A_n) = P(A_1) P(A_2|A_1) P(A_3|A_1 A_2) \cdots P(A_n|A_1 A_2 \cdots A_{n-1}) P(A1A2⋯An)=P(A1)P(A2∣A1)P(A3∣A1A2)⋯P(An∣A1A2⋯An−1)
定义 设 Ω \varOmega Ω为随机试验 E E E的样本空间, B 1 , B 2 , ⋯ , B n B_1, B_2, \cdots, B_n B1,B2,⋯,Bn为 E E E的一组随机事件,若
(1) B i B j = ∅ , i ≠ j , i , j = 1 , 2 , ⋯ , n B_i B_j = \varnothing, i \neq j, i, j = 1, 2, \cdots, n BiBj=∅,i=j,i,j=1,2,⋯,n;
(2) B 1 ∪ B 2 ∪ ⋯ ∪ B n = Ω B_1 \cup B_2 \cup \cdots \cup B_n = \varOmega B1∪B2∪⋯∪Bn=Ω,
则称 B 1 , B 2 , ⋯ , B n B_1, B_2, \cdots, B_n B1,B2,⋯,Bn为样本空间 Ω \varOmega Ω的一个划分(或完备事件组)。
注: ∑ i = 1 n B i = Ω \sum\limits_{i=1}^{n} B_i = \varOmega i=1∑nBi=Ω也可以作为划分的定义。
定理 设 B 1 , B 2 , ⋯ , B n B_1, B_2, \cdots, B_n B1,B2,⋯,Bn为样本空间 Ω \varOmega Ω的一个划分且 P ( B i ) > 0 , i = 1 , 2 , ⋯ , n P(B_i) > 0, i = 1, 2, \cdots, n P(Bi)>0,i=1,2,⋯,n,则对于任意随机事件 A A A有
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) P ( B i ) , (1.3) P(A) = \sum_{i=1}^{n} P(A|B_i)P(B_i), \tag{1.3} P(A)=i=1∑nP(A∣Bi)P(Bi),(1.3)
式 (1.3) 称作全概率公式。
证明 因为 A = A Ω = A ∑ i = 1 n B i = ∑ i = 1 n A B i A = A \varOmega = A \sum_{i=1}^{n} B_i = \sum_{i=1}^{n} AB_i A=AΩ=A∑i=1nBi=∑i=1nABi,所以
P ( A ) = P ( ∑ i = 1 n A B i ) = ∑ i = 1 n P ( A B i ) = ∑ i = 1 n P ( A ∣ B i ) P ( B i ) P(A) = P\left( \sum_{i=1}^{n} AB_i \right) = \sum_{i=1}^{n} P(AB_i) = \sum_{i=1}^{n} P(A|B_i)P(B_i) P(A)=P(i=1∑nABi)=i=1∑nP(ABi)=i=1∑nP(A∣Bi)P(Bi)
全概率公式突出了一个"全",即任何随机事件 A A A发生的概率是其全部影响因素 B 1 , B 2 , ⋯ , B n B_1, B_2, \cdots, B_n B1,B2,⋯,Bn的综合作用效果,即其各个影响因素的加权平均,各自的权重是每个因素出现的概率 P ( B i ) , i = 1 , 2 , ⋯ , n P(B_i), i = 1, 2, \cdots, n P(Bi),i=1,2,⋯,n。
图片中的内容是关于全概率公式的最简单形式。具体如下:
全概率公式的最简单形式
假如 0 < P ( B ) < 1 0 < P(B) < 1 0<P(B)<1,则
P ( A ) = P ( B ) P ( A ∣ B ) + P ( B ‾ ) P ( A ∣ B ‾ ) P(A) = P(B)P(A|B) + P(\overline{B})P(A|\overline{B}) P(A)=P(B)P(A∣B)+P(B)P(A∣B)
这个公式表示事件 A A A发生的总概率可以通过在事件 B B B发生和不发生两种情况下的条件概率加权求和得到。
定理 设 B 1 , B 2 , ⋯ , B n B_1, B_2, \cdots, B_n B1,B2,⋯,Bn为样本空间 Ω \varOmega Ω的一个划分且 P ( B i ) > 0 , i = 1 , 2 , ⋯ , n P(B_i) > 0, i = 1, 2, \cdots, n P(Bi)>0,i=1,2,⋯,n,则对于任意随机事件 A A A且 P ( A ) > 0 P(A) > 0 P(A)>0有
P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) , i = 1 , 2 , ⋯ , n (1.4) P(B_i|A) = \frac{P(A|B_i)P(B_i)}{\sum\limits_{j=1}^{n} P(A|B_j)P(B_j)}, i = 1, 2, \cdots, n \tag{1.4} P(Bi∣A)=j=1∑nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi),i=1,2,⋯,n(1.4)
式 (1.4) 称作贝叶斯 (Bayes) 公式。
P ( B i ∣ A ) P(B_i|A) P(Bi∣A) :后验概率,表示在事件 A A A 发生的条件下,条件 B i B_i Bi 发生的概率。
P ( A ∣ B j ) P(A|B_j) P(A∣Bj) :类条件概率,表示在条件 B j B_j Bj 存在时,结果事件 A A A 发生的概率。
P ( B j ) P(B_j) P(Bj) :先验概率,表示各不相容的条件存在的概率,与结果 A A A 是否出现无关,仅表示根据先验知识或主观判断,认为总体上各条件出现的可能性有什么差别。
P ( A ) P(A) P(A) :结果 A A A 在各个条件下出现的总体概率。
贝叶斯公式是利用已有结论重新评估或修正各个条件出现的概率,公式中的 P ( B i ) P(B_i) P(Bi)和 P ( B i ∣ A ) P(B_i|A) P(Bi∣A)分别称作原因或条件的先验概率和后验概率。 P ( B i ) , i = 1 , 2 , ⋯ , n P(B_i), i = 1, 2, \cdots, n P(Bi),i=1,2,⋯,n是在没有进一步信息(不知道事件 A A A是否发生)的前提下认定的各条件发生的概率;在获得了新的信息(事件 A A A已经发生)后,对先前各条件发生概率的修正,即形成概率 P ( B i ∣ A ) P(B_i|A) P(Bi∣A)。
