AI基础 L21 Quantifying Uncertainty and Reasoning with Probabilities III

Bayesian Networks

1 Bayesian Networks

• A Bayesian Network (BN) represents the dependencies among variables and encodes

the full joint probability distribution concisely.

• A BN is a directed graph, where each node is annotated with probability information.

--- The set of random variables makes up the nodes of the network.

--- A set of directed links connects pairs of nodes, encoding a parent-child relationship.

--- Each node Xi has a conditional probability distribution P (Xi | P arents(Xi))

--- The graph has no directed cycles.

• Intuitively, an arrow from X to Y means that X has a direct influence on Y

• The conditional independence of Toothache from Catch given Cavity is indicated by

the absence of a link between them.

• The network indicates that Toothache is dependent on cavity (as is catch); weather is

independent of all other variables in the network.

• A BN also has a conditional probability table (CPT) indicating the conditional

probability for each node value for a conditioning case --- the possible combination

of values for its parent nodes.

• Since each row must sum to 1, if we are dealing with boolean variables, we need only

show the positive case.

• If a variable has k parents, the table should have 2k rows.

  • 贝叶斯网络(BN):

    • 依赖关系与联合概率分布: 贝叶斯网络捕捉了变量集合之间的条件依赖关系,并以一种紧凑的方式编码了这些变量的完整联合概率分布。
  • 有向图结构:

    • 节点: 网络中的每个节点代表一个随机变量。
    • 有向链接: 节点之间的有向链接表示因果关系,箭头的方向指示了影响力的流向。例如,如果从节点X到节点Y有一条箭头,这意味着X的值会影响Y的概率。
    • 条件概率分布: 网络中的每个节点Xi都有一个条件概率分布P(Xi | Parents(Xi)),它指定了在给定其父节点值的情况下,Xi取不同值的概率。
    • 无有向循环: 图是无环的,这意味着没有从任何节点出发通过一系列有向链接回到该节点的路径。
  • 条件独立性:

    • 在贝叶斯网络中,如果两个节点之间没有直接链接,给定第三个节点的情况下,这表明这两个节点在给定第三个节点的情况下是条件独立的。例如,如果"牙疼"和"探针检测"之间没有链接,在已知"蛀牙"的情况下,这意味着在蛀牙存在的情况下,牙疼的概率与探针是否检测到某物是独立的。
  • 网络依赖关系:

    • 网络结构表明"牙疼"依赖于"蛀牙",同样"探针检测"也依赖于"蛀牙"。这意味着牙疼的发生和探针检测到的情况都受到蛀牙存在的影响。
    • "天气"与其他网络中的所有变量都是独立的,如"天气"节点没有来自其他节点的传入箭头所示。
  • 条件概率表(CPT):

    • 与贝叶斯网络中的每个节点相关联的是一个CPT,它提供了在给定其父节点值的情况下,节点的每个可能值的条件概率。
    • 布尔变量: 对于布尔(二进制)变量,每个变量只能为真或假,CPT只需要显示变量为真的概率,因为变量为假的概率就是1减去变量为真的概率。
    • 行数: 如果一个变量有k个父节点,并且每个父节点可以取两个可能值(对于布尔变量来说就是真/假),那么CPT将会有2^k行,每一行对应父节点值的一种可能组合。
  1. P(T | Cav) 是在已知有蛀牙的情况下出现牙疼的条件概率,这里给出的值是 0.6。
  2. P(Cat | Cav) 是在已知有蛀牙的情况下,探针检测到某物的条件概率,这里给出的值是 0.9。
  3. P(Cav) 是蛀牙的先验概率,即在考虑任何其他信息之前,蛀牙存在的概率,这里给出的值是 0.2。
  4. 这个等式假设了探针检测到某物和牙疼这两个事件在给定蛀牙的情况下是条件独立的,也就是说,知道其中一个事件的发生不影响另一个事件发生的概率。这个假设使得我们可以将两个条件概率相乘,然后乘以蛀牙的先验概率来得到后验概率。
  • P(Cav | Cat) 是在已知探针检测到某物的情况下存在蛀牙的后验概率。

由于我们没有关于牙疼(T)的具体信息,我们需要考虑两种情况:牙疼发生(T)和牙疼不发生(¬T)。因此,后验概率可以表示为这两种情况的概率之和:

P(Cav∣Cat)=α(P(T∣Cav)P(Cat∣Cav)P(Cav)+P(¬T∣Cav)P(Cat∣Cav)P(Cav))P(Cav∣Cat)=α(P(T∣Cav)P(Cat∣Cav)P(Cav)+P(¬T∣Cav)P(Cat∣Cav)P(Cav))

这里的α是归一化常数,它确保了所有可能情况的概率总和为1。

现在,让我们代入给定的数值:

P(Cav∣Cat)=α(0.6×0.9×0.2+0.4×0.9×0.2)P(Cav∣Cat)=α(0.6×0.9×0.2+0.4×0.9×0.2)

P(Cav∣Cat)=α(0.108+0.072)P(Cav∣Cat)=α(0.108+0.072)

P(Cav∣Cat)=α×0.18P(Cav∣Cat)=α×0.18

α的计算需要使用归一化常数,它等于1除以P(Cat),即探针检测到某物的总概率。P(Cat)可以通过以下方式计算:

P(Cat)=P(Cat∣Cav)P(Cav)+P(Cat∣¬Cav)P(¬Cav)P(Cat)=P(Cat∣Cav)P(Cav)+P(Cat∣¬Cav)P(¬Cav)

其中,P(¬Cav)是蛀牙不存在的概率,它可以通过1减去P(Cav)来计算,即:

P(¬Cav)=1−P(Cav)

因此,α可以表示为:

α=1/P(Cat)α

综上所述,α是1除以探针检测到某物的总概率,它确保了后验概率P(Cav | Cat)在所有可能情况下的总和为1。具体的数值需要根据P(Cat | ¬Cav)和P(¬Cav)来计算。

Conditional Independence in BNs

• We just saw the numerical semantics of BNs, but we also have a "topological"

semantics:

• In a BN, each variable is conditionally independent of:

(a) Non-descendants given its parents

E.g. JohnCalls is independent of Burglary, Earthquake, and MaryCalls given Alarm

(b) All other nodes in the network given parents, children, and children's parents

(its Markov Blanket)

E.g. Burglary is independent of JohnCalls and MaryCalls, given Alarm and Earthquake

相关推荐
夜清寒风1 小时前
opencv学习:图像掩码处理和直方图分析及完整代码
人工智能·opencv·学习·算法·机器学习·计算机视觉
数业智能心大陆1 小时前
数业智能心大陆探索生成式AIGC创新前沿
人工智能
DisonTangor2 小时前
随着访问范围的扩大 OpenAI o1-mini 现已向免费用户开放
人工智能
越甲八千2 小时前
opencv彩色图像转灰度图原理
人工智能·opencv·计算机视觉
asd1_121282 小时前
AI创意引擎:优化Prompt提示词的高效提问技巧
人工智能·prompt
lizi888882 小时前
足球大小球及亚盘数据分析与机器学习实战详解:从数据清洗到模型优化
java·人工智能·机器学习·数据挖掘·数据分析
virtaitech2 小时前
OrionX GPU算力池助力AI OCR场景应用
人工智能·ai·ocr·gpu算力·ai算力资源池化
lalahappy2 小时前
文档智能:OCR+Rocketqa+layoutxlm
人工智能
大模型实战2 小时前
RAPIDS AI 加速制造业预测性维护效率
大数据·人工智能
zhangfeng11332 小时前
在 PyTorch 中,除了 pad_sequence 还有哪些其他处理序列数据的函数?时间序列数据 预处理
人工智能·pytorch·python·深度学习