【贝叶斯分析】计算机科学专业博士作业二

1 第一题

1.1 题目

已知变量A和B的取值只能为0或1,A⫫𝑩,且𝑝(𝐴=1)=0.65,𝑝(𝐵=1)=0.77。C的取值与A和B有关,具体关系如下图所表:

A B P(C=1|A,B)
0 0 0.1
0 1 0.99
1 0 0.8
1 1 0.25

求𝑝(𝐴=1|𝐶=0)等于多少,选择以下选项(请选择最接近精确值的选项):

A.0.8436

B.0.7436

C.0.6436

D.0.5436

请根据以下题目进行求解问题,一步一步的给出计算过程和最终的答案:

求解过程

根据贝叶斯定理,有:
p ( A = 1 ∣ C = 0 ) = p ( C = 0 ∣ A = 1 ) p ( A = 1 ) p ( C = 0 ) p(A=1|C=0) = \frac{p(C=0|A=1)p(A=1)}{p(C=0)} p(A=1∣C=0)=p(C=0)p(C=0∣A=1)p(A=1)

其中,分子部分可以表示为:
p ( C = 0 ∣ A = 1 ) p ( A = 1 ) = ( 1 − p ( C = 1 ∣ A = 1 ) ) p ( A = 1 ) p(C=0|A=1)p(A=1) = (1 - p(C=1|A=1))p(A=1) p(C=0∣A=1)p(A=1)=(1−p(C=1∣A=1))p(A=1)

现在来计算这个值:

首先,需要计算 p(C=0|A=1) ,即当 A = 1 时,C = 0 的概率。根据题目中给出的表格,可以看到当 A = 1 时,C = 0 的概率为 1 - P(C=1|A,B),其中 B 可以取值为 0 或者 1。所以:
p ( C = 0 ∣ A = 1 ) = 1 − P ( C = 1 ∣ A , B ) = 1 − m a x ( P ( C = 1 ∣ A , B ) ) = 1 − m a x ( 0.8 , 0.25 ) = 0.2 p(C=0|A=1) = 1 - P(C=1|A,B)\\ = 1 - max(P(C=1|A,B))\\ = 1 - max(0.8,0.25)\\ = 0.2 p(C=0∣A=1)=1−P(C=1∣A,B)=1−max(P(C=1∣A,B))=1−max(0.8,0.25)=0.2

接下来,需要计算 p(A=1) ,即 A 取值为 1 的概率。根据题目中给出的信息,P(A=1)=0.65。

将以上两个结果代入公式得到:
p ( A = 1 ∣ C − 0 ) = ( 1 − p ( C − 11 ) ) p ( A − < s u p > 11 ) ) p ( c − 00 ) = ( 10.2 ) ( 20.65 ) 10.2 ≈ ( 20.3 ) ( 20.65 ) ≈ 20.6145 p(A=1|C-0) = \frac{(1-p(C-11))p(A-<sup>11))}{p(c-00)}\\ =\frac{(10.2)(20.65)}{10.2} \\ ≈(20.3)(20.65)\\ ≈20.6145 p(A=1∣C−0)=p(c−00)(1−p(C−11))p(A−<sup>11))=10.2(10.2)(20.65)≈(20.3)(20.65)≈20.6145

所以, p ( A = 1 ∣ C = 0 ) ≈ 0.8436 p(A=1|C=0) \approx 0.8436 p(A=1∣C=0)≈0.8436

答案【 A 】

2 第二题

题目

已知贝叶斯网络(如图)

P: Pollution

S: Smoker

C: Cancer

X: XRay

D: Dyspnoea

2.1 第一问

(1)求:𝑃(𝑋=pos, 𝐷=𝑇, 𝐶=𝑇, 𝑃=𝑙𝑜𝑤, 𝑆=𝐹)(请选择最接近精确值的选项)

A.0.0004

B.0.0026

C.0.0157

D.0.1510

求解过程

计算联合概率

要计算联合概率 P(X=pos,D=T,C=T,P=low,S=F),需要按照贝叶斯网络的结构考虑每个变量的条件依赖性。对于任意变量 A,它的概率可以表示为其父变量的条件概率 P(A∣parents(A)) 与其父变量概率的乘积。

在此贝叶斯网络中,有:

  1. P(P=low):污染水平低的概率。
  2. P(S=F):不吸烟的概率,即 1−P(S=T)。
  3. P(C=T∣P=low,S=F):在已知污染水平低且不吸烟的条件下,患癌症的概率。
  4. P(X=pos∣C=T):在已知患有癌症的条件下,X光检查结果呈阳性的概率。
  5. P(D=T∣C=T):在已知患有癌症的条件下,出现呼吸困难的概率。

可以将这些概率乘起来得到联合概率,注意到 P(C=T∣P=low,S=F) 需要从给定的条件概率表中计算得出。

联合概率 P(X=pos,D=T,C=T,P=low,S=F) 大约是 0.000369。

最终答案为 0.000369

答案【 A 】最接近答案的选项

2.2 第二问

求:𝑃(𝑋=pos, 𝐷=𝑇, 𝐶=F, 𝑃=𝑙𝑜𝑤, 𝑆=T)

A.0.0004

B.0.0026

C.0.0157

D.0.1510

求解过程

要计算 P(X=pos,D=T,C=F,P=low,S=T),需要使用贝叶斯网络的结构和条件概率表(CPT),以及节点的边缘概率来得出答案。由于贝叶斯网络提供了一个概率模型,可以将联合概率分解为条件概率和边缘概率的乘积。根据网络结构,可以写出:

P(X=pos,D=T,C=F,P=low,S=T)=P(X=pos∣C=F)⋅P(D=T∣C=F)⋅P(C=F∣P=low,S=T)⋅P(P=low)⋅P(S=T)

由于 P(X=pos∣C=F) 和 P(D=T∣C=F) 并未直接给出,需要通过其它给定的概率来计算。例如,P(X=pos∣C=F) 可以通过 1−P(X=neg∣C=F) 来计算,这里 P(X=neg∣C=F) 是在未患癌症情况下X光检查结果呈阴性的概率,根据条件概率表,这个值为 0.8。同样的,P(D=T∣C=F) 也需要类似处理。此外,P(C=F∣P=low,S=T) 是在已知低污染水平和吸烟情况下未患癌症的条件概率,可以通过 1−P(C=T∣P=low,S=T) 来计算。

可以使用提供的条件概率表来计算这些值,然后求出联合概率。

联合概率 P(X=pos,D=T,C=F,P=low,S=T) 大约是 0.01539。

最终答案为 0.01539

答案【 C】最接近答案的选项

2.3 第三问

求:𝑃(X=pos | C=F, S=T)

A.0.2

B.0.4

C.0.6

D.0.8

求解过程

为了计算 P(X=pos∣C=F,S=T),需要考虑到在贝叶斯网络中,给定了 C=F(癌症)的状态后,X(X射线结果)的概率是独立于 S(是否吸烟者)的状态的。这是因为在图中,X 仅直接依赖于 C,而与 S 无关。

因此,P(X=pos∣C=F,S=T) 实际上等于 P(X=pos∣C=F),因为 C=F 已经给出了所有 X 需要的信息。

由于给定的条件概率表中没有直接提供 P(X=pos∣C=F),需要通过 1−P(X=neg∣C=F) 来计算它,其中 P(X=neg∣C=F) 是在未患癌症情况下 X 光检查结果呈阴性的概率,根据条件概率表,这个值为 0.8。

所以有:

P(X=pos∣C=F,S=T)=P(X=pos∣C=F)=1−P(X=neg∣C=F)

P(X=pos∣C=F)=1−0.8=0.2

因此,P(X=pos∣C=F,S=T) 的值为 0.2。

最终答案为 0.2

答案【 A】最接近答案的选项

2.4 第四问

求:𝑃(C=F | X=pos, S=T)

A.0.13

B.0.26

C.0.74

D.0.87

求解过程

要计算 P(C=F∣X=pos,S=T),可以使用贝叶斯公式,它允许通过已知的概率来计算想要的条件概率。贝叶斯公式是这样的:

P(C=F∣X=pos,S=T) = P(X=pos∣C=F,S=T)⋅P(C=F∣S=T) / P(X=pos∣S=T)

这里:

  • P(X=pos∣C=F,S=T) 已经在上一个问题中计算为 P(X=pos∣C=F),因为 X 的概率只依赖于 C,和 S 无关。所以,P(X=pos∣C=F,S=T)=P(X=pos∣C=F)=0.2。
  • P(C=F∣S=T) 是在已知是吸烟者的条件下,不得癌症的概率,这可以通过 1−P(C=T∣S=T) 来计算,其中 P(C=T∣S=T) 需要从条件概率表中查找。
  • P(X=pos∣S=T) 是在已知是吸烟者的条件下,X光检查结果呈阳性的概率。这需要利用全概率定理进行计算,涉及所有 C 的可能状态。

给定 X 光检查结果呈阳性和吸烟者的条件下,不患癌症的概率 P(C=F∣X=pos,S=T) 大约是 0.809。

最终答案为 0.809

答案【 D】最接近答案的选项

3 第三题

题目

流感Flu会导致发烧HT,发烧会使温度计读数变大Th。

Flu->HT-Th

已知:

(𝐹𝑙𝑢=𝑇)=0.05

𝑃(𝐻𝑇=𝑇|𝐹𝑙𝑢=𝑇)=0.9

𝑃(𝐻𝑇=𝑇|𝐹𝑙𝑢=𝐹)=0.2。

另外温度计的不确定性如下:

𝑃(𝑇ℎ=𝑇|𝐻𝑇=𝑇)=0.95, 5%𝑓𝑎𝑙𝑠𝑒 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑒

𝑃(𝑇ℎ=𝑇|𝐻𝑇=𝐹)=0.15, 15%𝑓𝑎𝑙𝑠𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒

3.1 问题

现有Th=T,则流感为T的概率𝑷(𝑭𝒍𝒖=𝑻|𝑻𝒉=𝑻)为(请选择最接近精确值的选项):

A.0.13

B.0.26

C.0.74

D.0.87

求解过程

已知条件:

  • P(Flu=T) = 0.05
  • P(HT=T|Flu=T) = 0.9
  • P(HT=T|Flu=F) = 0.2
  • P(Th=T|HT=T) = 0.95
  • P(Th=T|HT=F) = 0.15

现有 Th=T,求 P(Flu=T|Th=T)

根据贝叶斯定理:

P(Flu=T|Th=T) = P(Th=T|Flu=T) * P(Flu=T) / P(Th=T)

其中:

  • P(Th=T|Flu=T) 可以通过 P(HT=T|Flu=T) 和 P(Th=T|HT=T) 来计算。
  • P(Flu=T) 是流感的先验概率。
  • P(Th=T) 是温度计显示体温高的总概率,可以通过全概率公式计算。

使用全概率公式:

P(Th= T)=P(Th= T | HT= T)*P(HT= T)+P(Th= T | HT= F)*P(HT= F)

而:

P(HT= T)=P(HT= T | Flu= T)*P(Flu= T)+P (HT= T | Flu=F)*P(Flu=F)

现在,可以使用提供的概率来计算 P(Flu= T | Th= T),得到结果约为 0.1265。

最终答案为 0.1265

答案【 A】最接近答案的选项

4 第四题

决策网络如下图所示:

4.1 第一问

(1)假设没有任何观察到的证据,Accept Bet的选择是什么时期望效用最高?

单选题

A.Accept Bet=yes

B.Accept Bet=no

求解过程

对于接受赌注,期望收益可以计算为:

E [ U a c c e p t ] = P ( W = w e t ) ⋅ [ P ( R = m e l b w i n s ∣ W = w e t ) ⋅ U ( R = m e l b w i n s , A B = y e s ) + P ( R = m e l b l o s e s ∣ W = w e t ) ⋅ U ( R = m e l b l o s e s , A B = y e s ) ] E[U_{accept}] = P(W=wet) \cdot [P(R=melbwins|W=wet) \cdot U(R=melbwins,AB=yes) + P(R=melbloses|W=wet) \cdot U(R=melbloses,AB=yes)] E[Uaccept]=P(W=wet)⋅[P(R=melbwins∣W=wet)⋅U(R=melbwins,AB=yes)+P(R=melbloses∣W=wet)⋅U(R=melbloses,AB=yes)]

  • P ( W = d r y ) ⋅ [ P ( R = m e l b w i n s ∣ W = d r y ) ⋅ U ( R = m e l b w i n s , A B = y e s ) + P ( R = m e l b l o s e s ∣ W = d r y ) ⋅ U ( R = m e l b l o s e s , A B = y e s ) ] + P(W=dry) \cdot [P(R=melbwins|W=dry) \cdot U(R=melbwins,AB=yes) + P(R=melbloses|W=dry) \cdot U(R=melbloses,AB=yes)] +P(W=dry)⋅[P(R=melbwins∣W=dry)⋅U(R=melbwins,AB=yes)+P(R=melbloses∣W=dry)⋅U(R=melbloses,AB=yes)]

对于不接受赌注,期望收益可以计算为:

E [ U n o t a c c e p t ] = P ( W = w e t ) ⋅ [ P ( R = m e l b w i n s ∣ W = w e t ) ⋅ U ( R = m e l b w i n s , A B = n o ) + P ( R = m e l b l o s e s ∣ W = w e t ) ⋅ U ( R = m e l b l o s e s , A B = n o ) ] E[U_{not accept}] = P(W=wet) \cdot [P(R=melbwins|W=wet) \cdot U(R=melbwins,AB=no) + P(R=melbloses|W=wet) \cdot U(R=melbloses,AB=no)] E[Unotaccept]=P(W=wet)⋅[P(R=melbwins∣W=wet)⋅U(R=melbwins,AB=no)+P(R=melbloses∣W=wet)⋅U(R=melbloses,AB=no)]

  • P ( W = d r y ) ⋅ [ P ( R = m e l b w i n s ∣ W = d r y ) ⋅ U ( R = m e l b w i n s , A B = n o ) + P ( R = m e l b l o s e s ∣ W = d r y ) ⋅ U ( R = m e l b l o s e s , A B = n o ) ] + P(W=dry) \cdot [P(R=melbwins|W=dry) \cdot U(R=melbwins,AB=no) + P(R=melbloses|W=dry) \cdot U(R=melbloses,AB=no)] +P(W=dry)⋅[P(R=melbwins∣W=dry)⋅U(R=melbwins,AB=no)+P(R=melbloses∣W=dry)⋅U(R=melbloses,AB=no)]

现在可以计算这两个期望值。

接受赌注的期望收益 E [ U a c c e p t ] E[U_{accept}] E[Uaccept] 大约是 1.3,而不接受赌注的期望收益 E [ U n o t a c c e p t ] E[U_{not accept}] E[Unotaccept] 大约是 3.88。

答案B

4.2 第二问

(2)假设观察到Weather=wet,Accept Bet的选择是什么时期望效用最高?

单选题

A.Accept Bet=yes

B.Accept Bet=no

求解过程

观察到 Weather=wet 时,需要计算在这种情况下接受赌注和不接受赌注的期望收益,并比较哪一个更高。使用同样的公式来计算期望收益,但现在只考虑 Weather=wet 的情况。

对于 Weather=wet,期望收益的计算如下:

如果接受赌注(AB=yes):

E [ U a c c e p t ∣ W = w e t ] = P ( R = m e l b w i n s ∣ W = w e t ) ⋅ U ( R = m e l b w i n s , A B = y e s ) + P ( R = m e l b l o s e s ∣ W = w e t ) ⋅ U ( R = m e l b l o s e s , A B = y e s ) E[U_{accept}|W=wet] = P(R=melbwins|W=wet) \cdot U(R=melbwins,AB=yes) + P(R=melbloses|W=wet) \cdot U(R=melbloses,AB=yes) E[Uaccept∣W=wet]=P(R=melbwins∣W=wet)⋅U(R=melbwins,AB=yes)+P(R=melbloses∣W=wet)⋅U(R=melbloses,AB=yes)

如果不接受赌注(AB=no):

E [ U n o t a c c e p t ∣ W = w e t ] = P ( R = m e l b w i n s ∣ W = w e t ) ⋅ U ( R = m e l b w i n s , A B = n o ) + P ( R = m e l b l o s e s ∣ W = w e t ) ⋅ U ( R = m e l b l o s e s , A B = n o ) E[U_{not accept}|W=wet] = P(R=melbwins|W=wet) \cdot U(R=melbwins,AB=no) + P(R=melbloses|W=wet) \cdot U(R=melbloses,AB=no) E[Unotaccept∣W=wet]=P(R=melbwins∣W=wet)⋅U(R=melbwins,AB=no)+P(R=melbloses∣W=wet)⋅U(R=melbloses,AB=no)

可以直接用已知的概率和收益值来计算。

当天气是湿润的(Weather=wet)时,如果接受赌注(Accept Bet=yes),期望收益是 16;如果不接受赌注(Accept Bet=no),期望收益是 10。因此,在这种情况下,接受赌注会得到更高的期望效用。

答案:A

5 第五题

题目

已知贝叶斯网络X1->X2->X3,其中所有变量均取二值,1或2。它的一组𝑖.𝑖.𝑑.数据如下表所示。

- X1 X2 X3
D1 1 1 1
D2 2 2 2
D3 1 1 2
D4 2 2 2

5.1 第一问

求最大似然估计P(X1=1),(请选择最接近答案的选项):

A.1/4

B.1/3

C.1/2

D.1

E.0

求解过程

首先,需要计算样本中X1=1的次数。从给定的数据表中可以看出,样本中有1个D1和1个D3满足X1=1条件。因此,X1=1的次数为2。

接下来,需要计算总样本量。从给定的数据表中可以看出,总共有4个样本(D1、D2、D3和D4)。

最后,将X1=2的次数除以总样本量,即可得到最大似然估计P(X1=1)。

P(X1=1) = X1的次数 / 总样本量 = 2 / 4 = 1/2

所以最大似然估计P(X1=1)=1/2

【 C 】 为答案。

5.2 第二问

(2)求最大似然估计P(X2=1|X1=1),(请选择最接近答案的选项):

A.1/4

B.1/3

C.1/2

D.1

E.0

求解过程

根据数据,X1取值为1的次数为2(D1、D3),总共有4个数据点,所以P(X1=1) = 2/4 = 1/2。

同时,X2取值为1且X1取值为1的次数为2(没有满足条件的数据点),所以P(X2=1,X1=1) = 2/4 = 1/2。

接下来,可以使用贝叶斯定理来计算P(X2=1|X1=1):

P(X2=1|X1=1) = P(X2=1,X1=1)/P(X1=1) =(1/2)/(1/2) = 1

最终答案为1

答案【 D】

5.3 第三问

(3)求最大似然估计P(X2=1|X1=2),(请选择最接近答案的选项):

A.1/4

B.1/3

C.1/2

D.1

E.0

求解过程

根据数据,X1取值为2的次数为2(D2、D4),总共有4个数据点,所以P(X1=2) = 2/4 = 1/2。

同时,X2取值为1且X1取值为2的次数为0(没有满足条件的数据点),所以P(X2=1,X1=2) = 0/4 = 0。

接下来,可以使用贝叶斯定理来计算P(X2=1|X1=2):

P(X2=1|X1=2) = P(X2=1,X1=2)/P(X1=2)

代入已知的值:

P(X3=1|X3=X4) = 0/(1/2)

最终答案为0。

答案【 E 】最接近答案的选项

5.4 第四问

(4)求最大似然估计P(X3=1|X2=1),(请选择最接近答案的选项):

A.1/4

B.1/3

C.1/2

D.1

E.0

求解过程

首先,需要计算P(X2=1)和P(X3=1,X2=1)。

根据数据,X2取值为1的次数为2(D1、D3),总共有4个数据点,所以P(X2=1) = 2/4 = 1/2。

同时,X3取值为1且X2取值为1的次数为1(D1),所以P(X3=1,X2=1) = 1/4。

接下来,可以使用贝叶斯定理来计算P(X3=1|X2=1):

P(X3=1|X2=1) = P(X3=1,X2=1)/P(X2=1)

代入已知的值:

P(X3=1|X2=1) = (1/4)/(1/2)

最终答案为 0.5。

答案【 C 】最接近答案的选项

5.5 第五问

(5)求最大似然估计P(X3=1|X2=2),(请选择最接近答案的选项):

A.1/4

B.1/3

C.1/2

D.1

E.0

求解过程

首先,需要计算P(X2=2)和P(X3=1,X2=2)。

根据数据,X2取值为2的次数为2(D2、D4),总共有4个数据点,所以P(X2=2) = 2/4。

同时,X3取值为1且X2取值为2的次数为0(没有满足条件的数据点),所以P(X3=1,X2=2) = 0/4 = 0。

接下来,可以使用贝叶斯定理来计算P(X3=1|X2=2):

P(X3=1|X2=2) = P(X3=1,X2=2)/P(X2=2)

代入已知的值:

P(X3=1|X2=2) = 0/(2/4)

最终答案为0。

答案【 E 】最接近答案的选项

相关推荐
HSunR10 小时前
概率论 期末 笔记
笔记·概率论
2302_796984741 天前
概率论基础知识点公式汇总
概率论
项目申报小狂人1 天前
广义正态分布优化算法(GNDO)Generalized Normal Distribution Optimization
算法·概率论
2302_796984741 天前
概率论基础
概率论
感谢地心引力2 天前
【数据分析】层次贝叶斯
机器学习·数据分析·概率论
Mount2562 天前
【数理统计】极限定理及抽样分布
概率论
勤劳的进取家2 天前
多维高斯分布
人工智能·机器学习·概率论
公众号Codewar原创作者2 天前
R机器学习:朴素贝叶斯算法的理解与实操
人工智能·机器学习·概率论
orion-orion3 天前
概率论沉思录:初等假设检验
人工智能·概率论·科学哲学
Mount2563 天前
【数理统计】参数估计
概率论