概率论 - 贝叶斯定理

贝叶斯定理可广泛应用在数据分析、模式识别、统计决策、人工智能、心理学、博弈论等各种领域,可见了解和掌握贝叶斯定理是有必备要的。

贝叶斯公式1

举个例子:一次掷两颗骰子,共可能出现的结果有6x6=36种组合,这就是的样本空间 ,每个样本的概率均为1/36。
问题A: 至少有一个骰子点数是3 的概率是多少?
问题B: 两个骰子相加等于9 的概率是多少?
问题C: 至少有一个骰子点是3 并且 相加等于9的 概率是多少?

为了理解我们把36种结果列举出来如下

问题A 至少有一个骰子点数是3的概率是多少?

图解:11/36, 标记 P(A) = 11/36

问题B: 两个骰子之和为9的概率是多少?

图解:4/36, 标记 P(B) = 4/36

**问题C :**至少有一个骰子点数是3 并且 相加等于9的 概率是多少?

图解:2/36, 标记 P() = 2/36

以上问题应该好理解,它的**样本空间是36也就是分母固定是36,**再来看两个新问题

  1. 至少有一个骰子点数是3的情况下,两个骰子相加等于9的概率是多少?

图解: 至少一个骰子点数是3, 一共有11种组合,因为P(A B) = 2, 所以分子是2,它的样本空间是11 , 所以2/11 ,标记 P(B|A) = 2/11 , A 表示至少一个骰子点是3,B表示相加等于9。

  1. 两个骰子之和为9的情况下,至少有一个骰子点是3的概率是多少?

图解: 两个骰子之和为9,一共有6种组合,因为P(B A) = 2, 所以分子是2,它的样本空间是6 , 所以2/4,标记 P(A|B) = 2/4

注意 P(A B) 表示: 至少点数有3并且之和为9,P(B A) 表示: 之和为9并且至少点数有3 (在前面是第一条件,后面是第二条件) , P(A|B) 在前面是子集,在后面是所有集

其实以上问题都 可以用 贝叶斯公式1: 来求解, 假设已知条件:

  1. 至少有一个骰子点数是3的概率 P(A) = 11/36

  2. 两个骰子相加等于9的 概率 P(B) = 4/36

  3. 至少有一个骰子点数是3的情况下,两个骰子相加等于9的概率 P(B|A) = 2/11

现在求 两个骰子之和为9的情况下,至少有一个骰子点是3的概率是多少?求P(A|B)=?

根据贝叶斯 公式有 = 2/11 * 11/36 4/36 = * * =

很多时候 P(A)是已知的或是给定的 叫做先验概率, P(A|B)是计算出来的,叫后验概率

最后 贝叶斯公式1

贝叶斯公式2

很多时候 发现计算P(B)是比较困难的,甚至无法知道P(B)概率,所以要用到贝叶斯定理 的另一种表示叫做贝叶斯公式2 分子不变, 分母P(B) = P(B|A)*P(A) + P(B|)*P(), 其中P()=1- P(A)

P() 图解 P(B|), P() 子集 中找到两个骰子相加等于9的组合,P(B|) 图解

为了方便记忆,简化一下图形结构

P(B) =P(BA) + P(B) ,其中公式P(BA) = P(A|B)*P(A)

P(B) = P(A)与P(B)的交集 加上 非P(A)与P(B)的交集,把 P(B)分成左右两部份

最后 贝叶斯公式2为

实例分析

根据单关键词垃圾邮件判断 已知邮件库的统计数据

  1. 垃圾邮件占所有邮件的概率(占比) 0.4

  2. 垃圾邮件中包含关键词 "xxx" 的概率(占比) 0.9

  3. 正常邮件中包含关键词 "xxx" 的概率(占比) 0.05

问题:现收到一封包含关键词 "xxx" 的邮件,判断它是垃圾邮件的概率是多少?

分析一下: 1.垃圾邮件占所有邮件0.4 我们定为先验概率 记P(A) = 0.4 垃圾邮件 当作A事件

  1. 包含关键词 占所有邮件 概率是多少? 无法知道P(B)=? , 包含关键词当作 B事件

  2. 垃圾邮件中包含关键词概率 P(B|A) = 0.9

  3. 正常邮件中包含关键词, 正常邮件 P()= 1-P(A) =0.6, P(B|) = 0.05

5.问题求 P (垃圾邮件 |含关键词)的概率 也就是 P(A|B) = ?

图解:

解:用贝叶斯公式2

分子:P(B|A)*P(A) = 0.9*0.4 = 0.36

分母: P(B) = P(B|A)*P(A) + P(B|)*P() = 0.36 + 0.05 * 0.6 = 0.39

P (垃圾邮件 |含关键词 )的概率 P(A|B) =0.36/0.39 = 12/13

应用领域

该定理在多个领域有广泛应用

医学诊断‌ :例如,计算在检测结果呈阳性时实际患病的概率,考虑疾病的发病率和检测的准确率;
‌机器学习‌: 用于垃圾邮件过滤、推荐系统等,通过更新模型参数来改进预测;
‌投资决策‌: 在信息不完全时,基于相关项目的概率分析推断目标项目的可能性;
‌人工智能‌:支持概率推理和决策系统,使设备能根据经验调整行为。‌


感谢大家的支持,如要问题欢迎提问指正。

相关推荐
CCPC不拿奖不改名1 小时前
“Token→整数索引” 的完整实现步骤
人工智能·python·rnn·神经网络·自然语言处理·token·josn
deephub1 小时前
多智能体强化学习(MARL)核心概念与算法概览
人工智能·机器学习·强化学习·多智能体
张小凡vip2 小时前
数据挖掘(五) -----JupyterHub 使用gitlab的账号体系进行认证
人工智能·数据挖掘·gitlab
叫我:松哥2 小时前
基于神经网络算法的多模态内容分析系统,采用Flask + Bootstrap + ECharts + LSTM-CNN + 注意力机制
前端·神经网络·算法·机器学习·flask·bootstrap·echarts
vx_bisheyuange2 小时前
基于SpringBoot的知识竞赛系统
大数据·前端·人工智能·spring boot·毕业设计
Ryan老房2 小时前
从LabelImg到TjMakeBot-标注工具的进化史
人工智能·yolo·目标检测·计算机视觉·ai
Coding茶水间2 小时前
基于深度学习的吸烟检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·目标检测·机器学习
Aaron_9452 小时前
VideoRAG:革新视频理解的检索增强生成技术深度解析
人工智能·音视频
FlameAIStudio2 小时前
用人格模型去做漫威角色测试,是比娱乐向更严肃的一种设计
人工智能·机器学习·娱乐