概率论 - 贝叶斯定理

贝叶斯定理可广泛应用在数据分析、模式识别、统计决策、人工智能、心理学、博弈论等各种领域,可见了解和掌握贝叶斯定理是有必备要的。

贝叶斯公式1

举个例子:一次掷两颗骰子,共可能出现的结果有6x6=36种组合,这就是的样本空间 ,每个样本的概率均为1/36。
问题A: 至少有一个骰子点数是3 的概率是多少?
问题B: 两个骰子相加等于9 的概率是多少?
问题C: 至少有一个骰子点是3 并且 相加等于9的 概率是多少?

为了理解我们把36种结果列举出来如下

问题A 至少有一个骰子点数是3的概率是多少?

图解:11/36, 标记 P(A) = 11/36

问题B: 两个骰子之和为9的概率是多少?

图解:4/36, 标记 P(B) = 4/36

**问题C :**至少有一个骰子点数是3 并且 相加等于9的 概率是多少?

图解:2/36, 标记 P() = 2/36

以上问题应该好理解,它的**样本空间是36也就是分母固定是36,**再来看两个新问题

  1. 至少有一个骰子点数是3的情况下,两个骰子相加等于9的概率是多少?

图解: 至少一个骰子点数是3, 一共有11种组合,因为P(A B) = 2, 所以分子是2,它的样本空间是11 , 所以2/11 ,标记 P(B|A) = 2/11 , A 表示至少一个骰子点是3,B表示相加等于9。

  1. 两个骰子之和为9的情况下,至少有一个骰子点是3的概率是多少?

图解: 两个骰子之和为9,一共有6种组合,因为P(B A) = 2, 所以分子是2,它的样本空间是6 , 所以2/4,标记 P(A|B) = 2/4

注意 P(A B) 表示: 至少点数有3并且之和为9,P(B A) 表示: 之和为9并且至少点数有3 (在前面是第一条件,后面是第二条件) , P(A|B) 在前面是子集,在后面是所有集

其实以上问题都 可以用 贝叶斯公式1: 来求解, 假设已知条件:

  1. 至少有一个骰子点数是3的概率 P(A) = 11/36

  2. 两个骰子相加等于9的 概率 P(B) = 4/36

  3. 至少有一个骰子点数是3的情况下,两个骰子相加等于9的概率 P(B|A) = 2/11

现在求 两个骰子之和为9的情况下,至少有一个骰子点是3的概率是多少?求P(A|B)=?

根据贝叶斯 公式有 = 2/11 * 11/36 4/36 = * * =

很多时候 P(A)是已知的或是给定的 叫做先验概率, P(A|B)是计算出来的,叫后验概率

最后 贝叶斯公式1

贝叶斯公式2

很多时候 发现计算P(B)是比较困难的,甚至无法知道P(B)概率,所以要用到贝叶斯定理 的另一种表示叫做贝叶斯公式2 分子不变, 分母P(B) = P(B|A)*P(A) + P(B|)*P(), 其中P()=1- P(A)

P() 图解 P(B|), P() 子集 中找到两个骰子相加等于9的组合,P(B|) 图解

为了方便记忆,简化一下图形结构

P(B) =P(BA) + P(B) ,其中公式P(BA) = P(A|B)*P(A)

P(B) = P(A)与P(B)的交集 加上 非P(A)与P(B)的交集,把 P(B)分成左右两部份

最后 贝叶斯公式2为

实例分析

根据单关键词垃圾邮件判断 已知邮件库的统计数据

  1. 垃圾邮件占所有邮件的概率(占比) 0.4

  2. 垃圾邮件中包含关键词 "xxx" 的概率(占比) 0.9

  3. 正常邮件中包含关键词 "xxx" 的概率(占比) 0.05

问题:现收到一封包含关键词 "xxx" 的邮件,判断它是垃圾邮件的概率是多少?

分析一下: 1.垃圾邮件占所有邮件0.4 我们定为先验概率 记P(A) = 0.4 垃圾邮件 当作A事件

  1. 包含关键词 占所有邮件 概率是多少? 无法知道P(B)=? , 包含关键词当作 B事件

  2. 垃圾邮件中包含关键词概率 P(B|A) = 0.9

  3. 正常邮件中包含关键词, 正常邮件 P()= 1-P(A) =0.6, P(B|) = 0.05

5.问题求 P (垃圾邮件 |含关键词)的概率 也就是 P(A|B) = ?

图解:

解:用贝叶斯公式2

分子:P(B|A)*P(A) = 0.9*0.4 = 0.36

分母: P(B) = P(B|A)*P(A) + P(B|)*P() = 0.36 + 0.05 * 0.6 = 0.39

P (垃圾邮件 |含关键词 )的概率 P(A|B) =0.36/0.39 = 12/13

应用领域

该定理在多个领域有广泛应用

医学诊断‌ :例如,计算在检测结果呈阳性时实际患病的概率,考虑疾病的发病率和检测的准确率;
‌机器学习‌: 用于垃圾邮件过滤、推荐系统等,通过更新模型参数来改进预测;
‌投资决策‌: 在信息不完全时,基于相关项目的概率分析推断目标项目的可能性;
‌人工智能‌:支持概率推理和决策系统,使设备能根据经验调整行为。‌


感谢大家的支持,如要问题欢迎提问指正。

相关推荐
zm-v-159304339862 小时前
Python 气象数据处理从入门到精通:机器学习订正 + 深度学习预测完整教程
python·深度学习·机器学习
F_U_N_2 小时前
轻量化开源知识库落地路径研究:AI赋能、多端集成及合规管理指引
人工智能·开源
丝斯20112 小时前
AI学习笔记整理(75)——Python学习4
人工智能·笔记·学习
TImCheng06092 小时前
科学的兴趣评估模型:如何通过低成本试错与深度体验,确定 AI 是否为长期志业?
人工智能
物联网软硬件开发-轨物科技2 小时前
【轨物洞见】从“人工时代”迈向“视觉语音时代”:轨物科技多模态智能感知与一键顺控专家系统全解析
大数据·人工智能·科技
FindAI发现力量2 小时前
智能耳机:AI销售场景中的数据采集新范式
人工智能
大傻^2 小时前
Spring AI Alibaba 向量数据库集成:Milvus与Elasticsearch配置详解
数据库·人工智能·spring·elasticsearch·milvus·springai·springaialibaba
大傻^2 小时前
Spring AI Alibaba ChatClient实战:流式输出与多轮对话管理
java·人工智能·后端·spring·springai·springaialibaba
1941s2 小时前
Google Agent Development Kit (ADK) 指南 第四章:Agent 开发与编排
人工智能·python·langchain·agent·adk
nap-joker2 小时前
【生物年龄age gap】基于影像的器官特异性衰老时钟预测人类疾病和死亡率
人工智能·深度学习·影像·生物年龄·age gap